如何使用HippoRAG增强LLM的记忆-AI.x-AIGC专属社区-合毅科技

如何使用HippoRAG增强LLM的记忆 原创

发布于 2024-7-3 10:03
浏览
0收藏

译者 | 李睿

审校 | 重楼


大型语言模型(LLM)已经证明是一种非常宝贵的思考工具。经过大量文本、代码和其他媒体数据集的训练,它们能够创作出接近人类水平的文章、翻译语言、生成图像,还能以信息丰富的方式回答人们提出的问题,甚至可以编写不同类型的创意内容。但是,尽管它们功能强大,即使是最先进的LLM也有一个基本的限制:知识的时效性。它们所“知道”的一切知识都是由所接受的训练数据决定的,这使它们无法适应新的信息,也无法了解人们的具体需求和偏好。

为了克服这一限制,研究人员开发了检索增强生成(RAG)。RAG赋予了LLM访问实时更新的数据存储的能力。这种对动态外部知识库的访问使它们能够动态地检索相关信息,并将其合并到他们的响应中。然而,由于这些模型往往依赖于关键字匹配,当面对需要跨多个信息源进行关联的问题时,标准的RAG实现就会遇到挑战——这是一种被称为“多跳” (multi-hop)推理的难题。

受到大脑存储和提取记忆机制的启发,研究人员开发了HippoRAG这一新颖的RAG方法,这种方法在生成反应时能够检索并整合更具意义的来源。本文将深入剖析HippoRAG的工作原理,探究其在传统RAG技术之上的优势,并展望其在人工智能系统中激发全新推理和理解水平的潜力。

在RAG技术存在局限时:寻求更深层次的联系

在传统的RAG系统中有两个关键组件:检索器和生成器。检索器负责在庞大的文本数据库(知识库)中搜寻,这些数据库可能包括维基百科、企业内部文档,甚至个人文件。其工作原理是将问题和文档转化为数字表示(即嵌入),并利用高效的算法迅速找出与问题嵌入最为相似的文档。随后,生成器(通常是一个强大的大型语言模型)将这些检索到的文档作为场景,生成一个全面且信息丰富的答案。

例如,如果询问RAG系统“巴黎的主要旅游景点是什么?”,检索器将在知识库中搜索包含巴黎和旅游景点信息的文档。它可能会从维基百科、旅游博客甚至旅游指南中找到文章。然后LLM将使用这些检索到的文档来生成响应,可能列出像埃菲尔铁塔、卢浮宫博物馆和凯旋门这样的热门景点。

尽管这款工具功能强大,但当面对需要将多个信息片段串联起来以解答问题的情况时,传统的RAG系统往往显得力不从心——这正是所谓的“多跳”推理难题。假设某人向人工智能助理提问:“我下周去伦敦旅行时应该带把伞吗?”为了回答这个问题,助理需从他的日历中检索旅行日期,核实这些日期内伦敦的天气状况,并考虑他的个人行李偏好(他是习惯随身携带雨伞,还是仅在天气恶劣时才携带?)。然而,传统的RAG系统往往仅依赖于基础的关键字匹配,可能会找到包含“伦敦”和“雨伞”的文件,但不一定能理解这些文件与他的旅行或其个人行李偏好之间的时间关联性。

类似地,像“谷歌现任首席执行官(CEO)的出生地是哪个国家的首都?”这样的问题需要将他的出生地与该国的首都联系起来——这种联系可能在任何一份文档中都不明确。传统的RAG很难有效地建立这些连接。

HippoRAG:模仿大脑的记忆指数

HippoRAG是一个新的RAG框架,其设计理念来自于人们的大脑如何存储和检索记忆。人类的大脑不只是将信息存储在孤立的单元中,它在不同概念之间建立了丰富的联系网络。这种将相关想法联系起来的能力使得HippoRAG能够进行复杂的逻辑推理,从而做出推断,并回答需要将多个来源的信息综合在一起的复杂问题。

通过模拟大脑的记忆索引机制,HippoRAG展现了其独特的优势,为信息检索和推理领域带来了新的可能性。

受HippoRAG启发的海马体索引理论为大脑中的这种工作方式提供了一个模型:

  • 新皮质:作为大脑中负责“思考”的部分,负责处理感官信息和存储复杂知识。这类似于HippoRAG中的LLM。​
  • 海马体:大脑深处的一个区域,就像记忆的“索引”。它本身并不存储完整的记忆,但它在存储在新皮层中的不同信息片段之间建立了联系(关联)。可以把它想象成一个概念之间联系的心理地图。这就是知识图谱在HippoRAG中的作用。​

当体验到新事物时,大脑皮层就会处理,海马体会在相关概念之间建立联系,形成记忆痕迹。当在今后回忆起那段经历的一部分时,海马体会激活相关的联系,触发从新皮质提取完整的记忆。

为LLM构建更好的记忆

HippoRAG模仿这种受大脑启发的模型,为LLM提供了更复杂的记忆系统。以下探讨HippoRAG是如何运作的:

1.建立海马指数

HippoRAG使用LLM从知识库中提取关键概念和关系,构建知识图,其中节点表示概念,边表示概念之间的关系。这个知识图谱就像海马体,储存着想法之间的联系。

以下是示例中知识图谱的简化表示:

  • 节点:表示实体和概念:“伦敦”、“英国”、“天气”、“不可预测”、“雨伞”、“保护”、“雨”、“旅行”、“下周”、“周一”、“周五”、“轻装”、“我”等。​
  • 边:表示节点之间的关系:“伦敦”-[是首都]->“英国”,“伦敦”-[以]->“不可预测的天气”而闻名,“雨伞”-[提供]->“保护”,“保护”-[从]->“雨”,“旅行”-[目的地]->“伦敦”,“旅行”-[时间]->“下周”,“下周”-[包括]->“星期一”,“下周”-[包括]->“星期五”,“我”-[偏好]->“轻装”,等等。​

2.个性化PageRank的查询时间推理

给定一个新问题,LLM识别关键实体,并将它们映射到知识图中的节点。然后,HippoRAG使用一种称为个性化PageRank (PPR)的算法来探索知识图谱,在相关节点上传播激活。这就像海马体激活了相关的记忆痕迹。PPR允许HippoRAG从远离原始实体的多“跳”中有效地收集信息,在一个步骤中捕获多跳关系。在以下示例中:

  • 实体识别:与之前一样,LLM识别问题中的关键实体:“雨伞”、“旅行”和“伦敦”。​
  • 知识图谱上的PPR:从代表这些实体的节点开始,PPR探索知识图谱,在相关节点之间传播激活。它考虑边缘的强度和方向来确定不同路径的相关性。​

在例子中:PPR可能会高度激活通往“雨”、“变幻莫测的天气”和“保护”等节点的路径,因为它们与“伦敦”和“雨伞”有联系。

3.单步检索

然后检索最高度激活的节点(以及知识库中与它们相关的文本块)。这为LLM提供了回答问题所需的信息,包括概念之间的关键联系。

在示例中,这可能包括原始示例中的文本块1、2和3。

4.使用LLM生成答案

LLM现在已经掌握了谜题的所有部分——原始问题、检索到的知识(通过基于图的连接丰富)和任何额外的实时信息。它可以利用这些更丰富的知识来提供更细致、更准确的答案。

在例子中:

  • 组合输入:LLM接收原始问题、检索到的知识(现在已通过基于图的连接得到丰富)以及伦敦在旅行日期的实时天气预报。​
  • 增强推理:LLM现在可以利用更丰富的知识来提供更细致、更准确的答案。它不仅知道伦敦的天气变幻莫测,而且还知道雨伞可以防雨,而且知道行程安排在可能下雨的时间。​

从多跳到寻径:人工智能记忆的未来

HippoRAG背后的研究人员证明,它在多跳推理任务上明显优于标准的RAG方法。但这种方法的含义远远超出了简单的问题回答。

由HippoRAG实现的“寻径”检索概念尤其令人兴奋。想象一下,人工智能系统不仅可以检索信息,还可以发现概念之间的新联系,即使这些联系没有在数据中明确说明。这将改变科学发现、法律推理和个性化推荐等领域的游戏规则,在这些领域,建立新联系的能力是必不可少的。

虽然HippoRAG面临着扩展到大规模知识图谱和管理概念-场景权衡等挑战,但它代表了构建具有更类似人类记忆能力的LLM的重大飞跃。随着人们继续探索神经科学和人工智能的交叉点,正在接近创造能够像人类大脑一样学习、记忆和推理的深度和灵活性的人工智能系统。

原文标题:LLMs Get a Memory Boost with HippoRAG,作者:Indrajit Bhattacharya,Obaid Sarvana​

链接:https://dzone.com/articles/llms-get-a-memory-boost-with-hipporag

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
收藏
回复
举报
回复
相关推荐

相关内容推荐

人力资源本科毕业论文论文标题用几号字核电的论文南昌大学论文格式议论文中心论点怎么写建筑工程技术专业论文小学语文电教论文单摆论文呼啸山庄论文题目计算机会议论文论文基地档案学论文选题海伦凯勒议论文素材毕业论文代码查重吗底气议论文素材论文中图片格式军事理论论文摘要如何在知网发表论文质疑论文科技金融论文大一微积分论文小学教育科研论文文化英语论文高中议论文真题营销渠道论文关于信念的议论文素材论文研究网教师继续教育论文三年级数学教学论文同济大学学位论文本科论文答辩好过吗大自然的论文长征精神的论文大学生美术鉴赏论文论文关键词的作用烟囱论文营运论文关于恒心的议论文关于女性主义的论文论文标题英文中文期刊论文格式毕业论文的前言怎么写自信的议论文600字小学数学论文参考文献读书不如经商驳论文查发表论文金工实习论文永不言败议论文面点的论文传递正能量议论文关于变的议论文大专论文范文导师发论文大专工商管理毕业论文期刊论文作者简介人与社会论文学术论文一般多少字书画的论文有关留守儿童的论文陶渊明论文chatgpt论文润色turnitin论文查重思修论文3000字读书报告论文格式议论文的相关知识读书不如经商驳论文关于情绪管理的论文电力毕业论文我的人生观论文校企合作论文论文范文参考800字siggraph论文日语论文题目参考国家级的论文建设工程项目管理论文工厂供电论文乡村振兴论文参考文献坚强的议论文800字医学检验技术毕业论文北京交通大学论文宪法论文800勤出成果议论文关于真相的议论文学生心理论文尊师重道的议论文专升本的论文议论文三要素范文农业气象学论文怎么查看sci论文英国硕士论文辅导关于文化建设的论文无人超市论文排队的论文生活中的哲学论文音乐剧论文茶艺的论文数学论文200字论文检测软件免费论文理论分析法议论文翅膀论文茶馆自考会计论文夜色温柔论文生物论文500字艰苦奋斗的议论文高中语文议论文模板幼儿园教师的论文教育发展论文筹资的论文毕业论文题鸡蛋论文物质议论文公益议论文毛概论文格式电子设计论文生本教育论文园艺专业论文题目利润质量分析论文学位论文的文献格式适应议论文汽车维修工技师论文我的人生观论文学位论文标识码光谱论文本科毕业论文网站小学语文论文发表黄金分析师论文心理学教育论文顾客满意度研究论文关于人际交往的论文建筑论文格式分析性论文汽车维修高级技师论文古代汉语论文题目怎样查论文关于学习的议论文作文stata实证分析论文查找论文资料的网站地理论文目录议论文文体常识公德的议论文雪的议论文金融市场的论文以笑议论文中国硕博论文网综述论文格式要求教育论文范文3000字中国航天论文关于文化建设的论文永不放弃的议论文善假于物的议论文专科用写论文吗现代企业论文反恐的论文古筝论文开题报告中学教学论文电子货币论文出口贸易论文钻石的论文如何在期刊上发表论文乳腺 论文滴滴打车论文生物论文500字古龙论文楚门的世界论文论文第三作者有用吗企业会计论文情与法论文以道德论文论文修改与润色led灯论文万方查论文妇产科的论文比喻议论文关于公正的议论文aaai论文孝心论文新教育论文免费毕业论文查重软件国之重器议论文关于创新的议论文开头排球的论文古人论文文学论文范文论文可以引用多少字信息技术导论论文读书报告论文格式毕业论文指导记录详细人体健康论文毕业论文设计范文书画的论文诺贝尔经济学奖论文国贸专业毕业论文选题知网学位论文检测地理教育教学论文平凡成就伟大议论文小学生心理健康教育论文数学论文发表英语毕业论文开题报告小学音乐论文题目大全

合作伙伴

合毅科技

www.lpjfm.cn
www.desai360.com
www.lyhbj.cn
zz.urkeji.com
www.bbswimming.cn
www.chaoshanxing.com
seo.jsfengchao.com
www.maijichuang.cn
kuai.urkeji.com
www.innatjerome.com
www.innatjerome.com
www.he1tech.com
www.desai360.com
seo.china185.com
www.lyhbj.cn
baidu.07yue.com
www.chaoshanxing.com
www.wangluohr.cn
www.7272w.cn
dh.jsfengchao.com