知识库服务(RAG) | 大装置帮助中心
跳到主要内容

知识库服务(RAG)

简介

知识库服务(Retrieval-Augmented Generation, RAG)是一种结合检索和生成技术的应用方法。通过将外部知识库中的信息与大模型相结合,RAG 能够生成更加准确和丰富的答案,适用于问答系统、智能客服、知识管理等场景。

功能特点

  1. 高效检索:采用先进的检索算法,能够快速从大规模知识库中找到相关信息。
  2. 智能生成:结合预训练模型和检索结果,生成准确且上下文相关的回答。
  3. 定制化知识库:支持用户自定义和管理知识库内容,满足不同业务需求。
  4. 高扩展性:可以与现有系统无缝集成,支持大规模并发请求处理。
  5. 团队管理:专为团队管理打造使用,可以内部共享授权,分为管理权限和仅可使用权限。

使用指南

一、知识库使用前准备

  1. 租户开通知识库

    • 进入 万象模型开发平台 ModelStudio,选择“知识库服务”模块,租户可以开通 RAG 服务,确保租户内用户均可以正常使用。
    • 当前知识库服务的收费项为知识解析和知识应用时的收费,计费为 0.001 元/千 tokens,在导入知识、知识库检索和大模型调用知识库时会进行收费。另外,在知识库应用中调用大模型,会按照输入和输出的 tokens 进行计费,其中输入的 tokens 会加上知识库服务所添加的 Prompt 内容。

    RAG 开通界面

  1. 租户开通日日新大模型

    • 使用知识库体验时,需要事先开通好日日新大模型,从而可以调用 SenseChat 大模型进行体验使用,因此需要租户保障事先已开通过日日新大模型。
  2. 用户确保获取 AKSK

    • 在 SenseCore 上,用户可获取 Access Key 和 Secret Key(AKSK)。
    • 确保 AKSK 保密并妥善保存,用于知识库服务功能的正常使用和相应 API 的正常调用。

    获取AKSK.png

二、知识库管理

  1. 创建知识库

    • 进入“知识库管理”模块,可以点击“新建知识库”按钮。
    • 填写知识库名称、描述和封面图片,确认后创建知识库。

    创建知识库.png

  2. 导入知识

    • 在知识库管理界面,进入某个知识库,可以选择“导入知识”选项。
    • 当前支持本地导入,可以点击上传文件,拖拽文件或者文件夹进行上传。单次上传限制300个文件,总大小不超过1GB。
    • 支持从网页导入数据。
    • 支持从 notion 中导入知识。
    • 文件中的图片解析暂不支持。
    • 确认导入后,系统会自动解析并添加到知识库中,可以实时查看导入知识列表的进度。

    知识导入.png

  1. 知识库授权

    • 在知识库管理界面,知识库列表页,可以点击指定知识库的设置图标,打开“授权”选项。
    • 为需要访问知识库的用户或用户组分配访问权限,确保只有授权用户能够访问和操作知识库。
    • 维护者拥有该知识库的读写权限,使用者拥有该知识库的只读权限。

    知识库授权.png

  1. 知识查看

    • 在知识库管理界面,进入知识库后,可以查看知识库的详细信息,包含知识库 ID、知识列表。
    • 知识列表界面,可以点击知识查看详情,展示知识的分段视图,以及相对应的元数据信息,也可以切换到全文视图,或者查看原始文件。
    • 点击分段,可以查看该分段的详细内容。

    知识查看.png

三、知识库检索

  1. 知识库检索

    • 在知识库服务界面,选择“知识库检索”选项。
    • 输入查询关键词,选择要检索的知识库,可以调整 topk 结果,以及检索的置信度,点击“搜索”按钮。
    • 系统会快速从知识库中检索相关信息,并展示检索结果。

    知识库检索.png

四、知识库应用

  1. 创建知识库应用

    • 进入知识库应用界面,可以点击“创建应用”按钮。
    • 填写知识库应用的名称、描述和封面图标,可以预设图标和自定义图标,确认后创建知识库应用。

    知识库应用创建.png

    知识库应用列表.png

  1. 知识库应用编排

    • 进入指定知识库应用详情中,可以对知识库应用进行网页端的编排。
    • 知识库检索处,可以配置知识库,检索参数可以调整默认推荐的 topK 结果、置信度、选择语义检索和全文检索的配比。
    • 模型参数处,可以选择大模型,调整默认推荐的大模型参数,包括温度、topP、重复惩罚和生成长度。
    • Prompt 处,可以调整默认推荐的人设 Prompt和知识库 Prompt 。
    • 对话增强处,可以调整对话开场白、开场推荐问和下一轮问题。

    知识库应用编排页.png

  1. 知识库应用发布

    • 点击应用编排页的前往发布,可以发布对应的应用
    • 发布到 web 端,即可以在 web 的 url 端直接进行对话
    • 发布到 API 端,可以获得临时的 API key,在 api 端进行调用知识库应用,进行对话

    知识库应用发布.png

  2. 知识库应用分析

    • 点击应用编排页的应用分析,或者应用列表页操作的分析按钮,可以前往该应用的分析页
    • 统计分析页可以查看该应用的使用量、用户量、用户留存率和用户新增数
    • 消息记录页可以查看回话用户的消息记录,并且可以导出会话记录

    知识库应用统计分析.png

    知识库应用消息中心.png

常见问题

  1. 如何提升检索准确性?

    • 定期更新和维护知识库内容,确保数据的时效性和准确性。
    • 优化检索算法参数,根据业务需求选择合适的算法以及参数。
  2. 知识库内容建议更新频率是多少?

    • 建议定期(例如每周)更新知识库内容,以确保数据的时效性和准确性。根据具体业务需求,决定相对应的更新频率。
  3. 如何导入大量数据到知识库?

    • 可以使用导入知识功能,将大量数据一次性导入知识库。具体操作可以在知识库管理界面的导入知识中找到。
  4. 知识库的创建文件限制是什么样的?

    • 建议租户最多创建 100 个知识库,每个知识库的总文件容量不超过 10GB,单次导入文件数量不超过 300 个且总容量不超过 1GB。如租户有更高需求,欢迎随时联系我们以获取更高维度支持。

这篇帮助文档旨在帮助用户了解和使用知识库服务(RAG),如果您有进一步的需求或问题,请随时与我们联系。