知识库服务(RAG)
简介
知识库服务(Retrieval-Augmented Generation, RAG)是一种结合检索和生成技术的应用方法。通过将外部知识库中的信息与大模型相结合,RAG 能够生成更加准确和丰富的答案,适用于问答系统、智能客服、知识管理等场景。
功能特点
- 高效检索:采用先进的检索算法,能够快速从大规模知识库中找到相关信息。
- 智能生成:结合预训练模型和检索结果,生成准确且上下文相关的回答。
- 定制化知识库:支持用户自定义和管理知识库内容,满足不同业务需求。
- 高扩展性:可以与现有系统无缝集成,支持大规模并发请求处理。
- 团队管理:专为团队管理打造使用,可以内部共享授权,分为管理权限和仅可使用权限。
使用指南
一、知识库使用前准备
租户开通知识库:
- 进入 万象模型开发平台 ModelStudio,选择“知识库服务”模块,租户可以开通 RAG 服务,确保租户内用户均可以正常使用。
- 当前知识库服务的收费项为知识解析和知识应用时的收费,计费为 0.001 元/千 tokens,在导入知识、知识库检索和大模型调用知识库时会进行收费。另外,在知识库应用中调用大模型,会按照输入和输出的 tokens 进行计费,其中输入的 tokens 会加上知识库服务所添加的 Prompt 内容。
租户开通日日新大模型:
- 使用知识库体验时,需要事先开通好日日新大模型,从而可以调用 SenseChat 大模型进行体验使用,因此需要租户保障事先已开通过日日新大模型。
用户确保获取 AKSK:
- 在 SenseCore 上,用户可获取 Access Key 和 Secret Key(AKSK)。
- 确保 AKSK 保密并妥善保存,用于知识库服务功能的正常使用和相应 API 的正常调用。
二、知识库管理
创建知识库:
- 进入“知识库管理”模块,可以点击“新建知识库”按钮。
- 填写知识库名称、描述和封面图片,确认后创建知识库。
导入知识:
- 在知识库管理界面,进入某个知识库,可以选择“导入知识”选项。
- 当前支持本地导入,可以点击上传文件,拖拽文件或者文件夹进行上传。单次上传限制300个文件,总大小不超过1GB。
- 支持从网页导入数据。
- 支持从 notion 中导入知识。
- 文件中的图片解析暂不支持。
- 确认导入后,系统会自动解析并添加到知识库中,可以实时查看导入知识列表的进度。
知识库授权:
- 在知识库管理界面,知识库列表页,可以点击指定知识库的设置图标,打开“授权”选项。
- 为需要访问知识库的用户或用户组分配访问权限,确保只有授权用户能够访问和操作知识库。
- 维护者拥有该知识库的读写权限,使用者拥有该知识库的只读权限。
知识查看:
- 在知识库管理界面,进入知识库后,可以查看知识库的详细信息,包含知识库 ID、知识列表。
- 知识列表界面,可以点击知识查看详情,展示知识的分段视图,以及相对应的元数据信息,也可以切换到全文视图,或者查看原始文件。
- 点击分段,可以查看该分段的详细内容。
三、知识库检索
知识库检索:
- 在知识库服务界面,选择“知识库检索”选项。
- 输入查询关键词,选择要检索的知识库,可以调整 topk 结果,以及检索的置信度,点击“搜索”按钮。
- 系统会快速从知识库中检索相关信息,并展示检索结果。
四、知识库应用
创建知识库应用:
- 进入知识库应用界面,可以点击“创建应用”按钮。
- 填写知识库应用的名称、描述和封面图标,可以预设图标和自定义图标,确认后创建知识库应用。
知识库应用编排:
- 进入指定知识库应用详情中,可以对知识库应用进行网页端的编排。
- 知识库检索处,可以配置知识库,检索参数可以调整默认推荐的 topK 结果、置信度、选择语义检索和全文检索的配比。
- 模型参数处,可以选择大模型,调整默认推荐的大模型参数,包括温度、topP、重复惩罚和生成长度。
- Prompt 处,可以调整默认推荐的人设 Prompt和知识库 Prompt 。
- 对话增强处,可以调整对话开场白、开场推荐问和下一轮问题。
知识库应用发布:
- 点击应用编排页的前往发布,可以发布对应的应用
- 发布到 web 端,即可以在 web 的 url 端直接进行对话
- 发布到 API 端,可以获得临时的 API key,在 api 端进行调用知识库应用,进行对话
知识库应用分析:
- 点击应用编排页的应用分析,或者应用列表页操作的分析按钮,可以前往该应用的分析页
- 统计分析页可以查看该应用的使用量、用户量、用户留存率和用户新增数
- 消息记录页可以查看回话用户的消息记录,并且可以导出会话记录
常见问题
如何提升检索准确性?
- 定期更新和维护知识库内容,确保数据的时效性和准确性。
- 优化检索算法参数,根据业务需求选择合适的算法以及参数。
知识库内容建议更新频率是多少?
- 建议定期(例如每周)更新知识库内容,以确保数据的时效性和准确性。根据具体业务需求,决定相对应的更新频率。
如何导入大量数据到知识库?
- 可以使用导入知识功能,将大量数据一次性导入知识库。具体操作可以在知识库管理界面的导入知识中找到。
知识库的创建文件限制是什么样的?
- 建议租户最多创建 100 个知识库,每个知识库的总文件容量不超过 10GB,单次导入文件数量不超过 300 个且总容量不超过 1GB。如租户有更高需求,欢迎随时联系我们以获取更高维度支持。
这篇帮助文档旨在帮助用户了解和使用知识库服务(RAG),如果您有进一步的需求或问题,请随时与我们联系。