创建知识库 | 大装置帮助中心
跳到主要内容

创建知识库

接口描述(Description)

创建知识库

请注意,当前版本(Beta),1个账号下允许创建10个知识库。


请求地址(Request URL)

[POST] https://api.sensenova.cn/v1/llm/knowledge-bases

请求头(Request Header)

无特殊Header,请参考接口鉴权


请求体(Request Body)

名称类型必须默认值可选值描述
descriptionstring--知识库描述
长度不超过256字符
filesstring[]--文件管理模块对应的文件ID,1个知识库最多支持添加50个文件(注意,文件必须是知识库支持的格式)
configsobject--知识库构建参数配置
  • configs 部分参数如下:
名称类型必须默认值可选值描述
text_splitobject--文本分割配置
embeddingobject--embedding配置
  • text_split 部分参数如下:
名称类型必须默认值可选值描述
modestringsemantics按语义分割:semantics
按长度和标点分割:delimiter(请注意,这种模式目前仅支持处理PDF格式的知识库文件)
文本分割模式
configobject--delimiter模式下的分隔符配置,semantics模式不支持
  • config 部分参数如下:
名称类型必须默认值可选值描述
max_lengthint500[200,+∞)每个分割片段最大字数长度,注意最大值不能超过所使用的Embedding模型的长度限制,否则超出部分会被截断
punctuationsobject[]默认优先级顺序由大到小为:##\n\n\n.,空格-分割每个片段的标记符号列表,包括符号及其优先级
  • punctuations 部分参数如下:
名称类型必须默认值可选值描述
markstring--##\n\n\n.,空格分割标记
priorityint--[1,+∞)分割标记优先级,数字越大优先级越高,若指定标点符号则必须填写优先级
  • embedding 部分参数如下:
名称类型必须默认值可选值描述
modelstringnova-embedding-stable参考查询模型列表模型ID

请求示例(Request Example)

curl --request POST "https://api.sensenova.cn/v1/llm/knowledge-bases" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $API_TOKEN" \
-d '{
"description": "string",
"files":[
"string"
],
"configs":{
"text_split":{
"mode": "semantics"
},
"embedding":{
"model": "string"
}
}
}'

响应(Response)

名称类型描述
knowledge_baseobject知识库
  • knowledge_base 部分参数如下:
名称类型描述
idstring知识库ID
descriptionstring知识库描述
filesobjetc[]文件详情
configsobject知识库构建参数详情
created_atstring知识库创建时间,ISO 8601标准时间格式,精确到纳秒
updated_atstring知识库更新时间,ISO 8601标准时间格式,精确到纳秒
statusstring知识库状态
可用:AVAILABLE
不可用:UNAVAILABLE
正在准备:LOADING
等待中:PENDING
  • files 部分参数如下:
名称类型描述
idstring文件ID
descriptionstring文件描述
statusstring文件状态,枚举值
未上传/上传中:NOTUPLOADED
已上传:UPLOADED
文件无效:INVALID
文件有效:VALID
  • configs 部分参数如下:
名称类型描述
text_splitobject文本分割配置
embeddingobjectembedding配置
  • text_split 部分参数如下:
名称类型描述
modestring文本分割模式
configobjectdelimiter模式下的分隔符配置,semantics模式无此配置
  • config 部分参数如下:
名称类型描述
max_lengthstring每个分割片段最大字数长度
punctuationsobject[]分割每个片段的标记符号列表
  • punctuations 部分参数如下:
名称类型描述
markstring分割标记
priorityint分割标记优先级
  • embedding 部分参数如下:
名称类型描述
modelstring模型ID

响应示例(Response Example)

{
"knowledge_base": {
"id": "string",
"description": "string",
"files":[
{
"id": "string",
"description": "string",
"status": "string"
}
],
"configs":{
"text_split":{
"mode": "string",
"config": {}
},
"embedding":{
"model": "string"
}
},
"created_at": "2023-06-28T17:23:01.243566533Z",
"updated_at": "2023-06-28T17:23:01.243566533Z",
"status": "string"
}
}

错误信息

参考错误码