通信人家园

标题: RAG  [查看完整版帖子] [打印本页]

时间:  2025-10-27 16:56
作者: jpfjpf148468     标题: RAG

AI幻觉:AI的回答局限在训练数据的范围内,对于超出训练数据范围的问题,就容易一本正经的胡说八道。给大模型外挂知识库,补足其知识短板,可以有效减少AI幻觉问题,这一方法便是RAG。
20分钟速成 RAG & 向量数据库核心概念 【小白学AI系列 -1 】_哔哩哔哩_bilibili
A Crash Course on Building RAG Systems – Part 1 (With Implementation)
检索增强生成(RAG,Retrieval-Augmented Generation)是一种AI框架,它通过将大语言模型与外部信息源相整合,来提升模型的输出质量。RAG从外部知识库中检索相关的上下文context,并将这些信息连同用户的问题,一起传递给大语言模型,从而提高输出的准确性和可靠性。
RAG分类:Naive RAG、Advanced RAG、Modular RAG
工作流程:
朴素RAG包含流程:索引、检索和生成。
解释:
文本分块的质量直接决定了检索的准确性和生成模型的效果,它能显著改善信息检索和内容生成效果,提供更精准相关的结果。
文本块将由Embedding Model(嵌入模型)转换为向量。Embedding Model是一种机器学习模型,可以将高维输入数据,如文本图像转换为低维向量。文本块转换成的向量捕捉了文本的语义信息,从而可以在海量文本库中检索相关内容,不同模型生成的向量数值可能会有所不同。
向量在多维空间中捕捉文本,图像或音频的语义和关联,可以让机器学习算法更轻松地对其进行处理和解读。向量的每个数值表示对象在特定维度上的特征或属性。
通过相似性搜索,在向量空间中寻找与查询向量Query距离最近的邻居,这些邻居便是与查询向量最相似的对象。
通常,向量具有数百甚至数千个维度,为了实现向量空间的可视化,采用PCA技术,将嵌入维度从2048维降低到三维,相似的对象在向量空间中会靠的更近,而不相似的对象则会分散的更远。




时间:  2025-10-27 19:09
作者: 不吹不黑

嗯,了解了




通信人家园 (https://www.txrjy.com/) Powered by C114