关键字: [Amazon Web Services re:Invent 2023, Neo4j, Knowledge Graph Construction, Natural Language Processing, Financial Data Extraction, Chatbot Question Answering, Graph Databases]

本文字数: 1000, 阅读完需: 5 分钟

视频

如视频不能正常播放,请前往bilibili观看本视频。>> https://www.bilibili.com/video/BV1tj411L7GW

导读

将生成式AI与知识图谱相结合可以增强语言理解能力,生成更符合上下文的响应。这丰富了信息检索和基于上下文的推理,并提高了整体用户体验。在这个闪电演讲中,探索Amazon Bedrock的应用,用于解析半结构化数据,在Neo4j中自动创建知识图谱。了解如何将这个知识图谱与聊天机器人集成,提高可靠性和准确性。这个演示由Neo4j提供,Neo4j是亚马逊云科技的合作伙伴。

演讲精华

以下是小编为您整理的本次演讲的精华,共700字,阅读时间大约是4分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。

Anthony Prasad详细阐述了大型语言模型(LLM)在文本生成和应用构建方面的应用所面临的挑战。据他统计,尽管现成的LLM能够连接到数据源并提取100%的可用数据,但它们生成的输出中,高达50%的时间存在错误、幻觉和缺乏上下文。这是因为重复模板的过度使用,以及LLM无法理解语义上下文。他提供了一个客户用例示例,展示了LLM在回答足球相关问题时却生成了一个关于篮球的回答,强调了其回答的不相关性。此外,他还注意到LLM有40%的时间会使用填充词来完成文本输出。

为了解决这些问题,Anthony强调利用Neo4j知识图来辅助LLM。通过关注输入参数驱动的特定任务,可以对LLM进行微调,从而将准确性提高60%。将LLM根植于知识图中可以消除幻觉和偏见达75%。Neo4j支持语义搜索和关系向量搜索,提供了超出仅提取数据点的30%的可见性。图形结构允许用户遍历关系并理解100%的上下文,而LLM只能输出文本。

Anthony提供了一个示例架构,包括两个阶段:将数据摄入到Neo4j的知识图中,然后消费这些数据来驱动应用程序,如聊天机器人。演示使用了包含资产经理持仓信息的真实世界金融SEC备案数据。Amazon SageMaker Studio调用Bedrock处理所有备案文件并在Neo4j中构建完整的知识图谱。

他提到,提示工程可以从数据中提取特定信息,精度提高80%。演示的聊天机器人通过获取用户问题,将其传递给LLM,将其转换为针对Neo4j的Cypher查询,在知识图上运行,然后将结果以自然语言的形式概括。这结合了LLM的知识和来自Neo4j的关系数据,以提供独立使用任何一种技术都无法实现的见解。

Ben Lackey的演示案例通过一个实际金融应用场景展示了如何将知识图谱与语言模型相结合以提供更多信息和准确的见解。在演示过程中,Lackey使用了实际的财务文件样本,并通过Bedrock和提示来提取公司名和股票持有等实体信息,准确率比不使用提示时提高了75%。提取的知识被加载到Neo4j知识图谱中,然后由聊天机器人界面查询以回答相关问题。这成功地结合了语言模型的能力与Neo4j的关系数据,提供了诸如资产经理的主要持股和哪些公司持有FANG股票等信息。

这个演示展示了一个从美国证券交易委员会(SEC)发布的文件中提取数据的用例。这些文件包含了资产管理公司如果管理资产超过10亿美元就必须每季度提交的披露报告。报告列出了如Fidelity和Vanguard等公司的所有股票和持股情况。Bedrock使用XML和表格混合数据处理这些复杂的文件,以提取关键实体并将其加载到Neo4j中,以构建金融行业知识图谱。

在知识图谱之上的聊天机器人界面可以回答结合了对FANG股票等概念的行业知识和来自Neo4j的资产管理公司的实际持股数据的问题。这展示了将语言模型的能力与领域特定的现实世界知识相结合以提供更准确的信息的可能性。

总之,这个视频演示清楚地说明了单独应用语言模型可能存在的陷阱,以及将它们建立在知识图谱如Neo4j上的巨大价值。通过将语言模型与结构化的关系知识相结合,可以克服关于偏见和幻觉的限制,从而实现更智能的应用。这一实际案例强调了知识图谱和语言模型在构建下一代具有增强准确性的AI系统中的协同作用。

下面是一些演讲现场的精彩瞬间:

在本届re:Invent期间,Neo4j公司的Ben Lackey将进行一场现场演示。

Amara Bedrock的云计算B2LM技术能够提取数据并对其进行加密处理,从而在电子商务网站上实现个性化推荐。

此外,还将展示一款使用Amazon SageMaker Studio和Bedrock共同构建的聊天机器人应用程序。

通过一键部署功能,SageMaker Studio可以轻松运行从存储库克隆的机器学习项目。

本次演讲还将强调检查包含预期复杂信息的政府数据文件的重要性。

通过结合LLM和Neo4j,可以实现超越各自单独实现的功能。

最后,将介绍亚马逊云科技与亚马逊市场之间的合作伙伴关系,以便用户能轻松部署解决方案。

总结

该视频探讨了利用Neo4j图和Amazon Bedrock构建更精确语言模型的方法。传统的模型可能会产生误解且缺乏上下文。将模型建立在诸如Neo4j这样的知识图基础上有助于消除误解和偏见。Neo4j支持基于语义的向量嵌入搜索,这使得能够遍历关系而不仅仅是提取数据点。

演示展示了两个主要的工作流程。首先,通过Bedrock将金融数据输入到Neo4j知识图中,同时提取元数据,如经理姓名和资产详细信息。其次,一个聊天机器人查询图形以回答自然语言问题。聊天机器人将其自身的知识与图形数据相结合。例如,它知道什么是FANG股票,并能查出拥有这些股票的经理有哪些。聊天机器人通过Bedrock将问题转换成Cypher查询。图形查询的结果被综合成自然语言回复。这展示出将语言模型与结构化知识图相结合的强大之处。

演讲原文

https://blog.csdn.net/just2gooo/article/details/134860681

想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!

2023亚马逊云科技re:Invent全球大会 - 官方网站

点击此处,一键获取亚马逊云科技全球最新产品/服务资讯!

点击此处,一键获取亚马逊云科技中国区最新产品/服务资讯!

即刻注册亚马逊云科技账户,开启云端之旅!

【免费】亚马逊云科技“100 余种核心云服务产品免费试用”

【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”

亚马逊云科技是谁?

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者,自 2006 年以来一直以不断创新、技术领先、服务丰富、应用广泛而享誉业界。亚马逊云科技可以支持几乎云上任意工作负载。亚马逊云科技目前提供超过 200 项全功能的服务,涵盖计算、存储、网络、数据库、数据分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及 31 个地理区域的 99 个可用区,并计划新建 4 个区域和 12 个可用区。全球数百万客户,从初创公司、中小企业,到大型企业和政府机构都信赖亚马逊云科技,通过亚马逊云科技的服务强化其基础设施,提高敏捷性,降低成本,加快创新,提升竞争力,实现业务成长和成功。

好文阅读

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: