Multi-Head RAG：复杂问题的RAG召回方案

2024 年 9 月 14 日 7点热度 0人点赞 0条评论

论文笔记分享，标题是 Multi-Head RAG: Solving Multi-Aspect Problems with LLMs。代码开源了：https://github.com/spcl/MRAG

这个工作要解决个什么问题呢？ RAG 得流程是通过将文档召回，放入LLM的上下文中，来提供更准确和相关的答案。但是现有的 RAG 解决方案可能比较难处理，召回的内容来自完全不同的文档，因为这些文档在语义空间中可能很远，很难将它们全部检索出来。

论文中有张图如下图，正常的RAG在遇到query有点复杂的时候，在召回的时候就很麻烦。如果是纯粹的绿点主题或者黄点主题那都没太大问题。但是如果是复杂的多主题的，到向量空间之后就不好召回了。

那咋整呢，大概的一个方案就是下图，query被拆解成了多个向量，每个向量比较纯粹，类似于多路召回，总能匹配到需要的chunk。

怎么获取多个向量呢？ MRAG通过使用Transformer的多头注意力层的特征作为向量表征，而不是仅使用取最后解码器层的输出，这样做的动机是不同的注意力头可以学习捕获数据的不同方面。每一层取一个向量，取最后一个位置的。chunks和query都生成多个向量，检索的时候，使用投票策略，结合了不同嵌入空间的重要性得分（根据一层的头内向量空间分布计算的），来选择最相关的文本块，并根据其重要性对检索结果进行加权。

最后结果在召回的相关性方面获得了比较大的提升

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述