What is RAG?

Posted Sep 10, 2024

By Weihua Kwong

2 min read

What is RAG?

RAG 的全称是 Retrival-Augumented Generation.

Retrieval

检索外部知识库（文档、网页、数据库等）。

加载网页时，主要关注两点：

向量检索：文本转换为向量（Embedding），通过向量相似度（余弦相似度）匹配内容

关键词检索：传统方法（BM25，是TF-IDF的优化），基于关键词匹配检索文档

混合检索：混合向量和关键词

将检索信息与原始查询混合成增强的Prompt

当前，在我的观点里，System prompt & ollama 提出的 Model prompt 等也是一种增强

注意，目前已经默认RAG流程中使用Frozen的LM进行生成。

但早期有过将Retrieval加入预训练、微调过程的尝试，仍有专门训练Retrieval的尝试。

This post is licensed under CC BY 4.0 by the author.