检索所有搜索历史
GET /studio/rag/data/v1/search:allSearchHistory
请求头(Request Header)
Authorization
可以使用如下两种Header
- 动态生成 Authorization Header, 参考认证(authentication)
-H "X-Date: $xdate" \
-H "Authorization: $auth"
- 直接提供完整的 Authorization Header,可以通过浏览器的开发者工具DevTools查看并复制接口调用的完整信息
-H 'Authorization: Bearer eyJhbGciOiJSUzI1NiIsImtpZCI6InB...'
请求参数(Request Parameters)
无请求参数
请求示例(Request Example)
curl 'https://aidmp.cn-sh-01.sensecoreapi.cn/studio/rag/data/v1/search:allSearchHistory' \
-H "X-Date: $xdate" \
-H "Authorization: $auth" \
-X GET
响应(Response)
名称 | 类型 | 描述 |
---|---|---|
list | array[object] | 历史记录列表. |
其中,list
的参数如下
名称 | 类型 | 描述 |
---|---|---|
id | string | 历史记录ID. |
request | object | 历史记录的请求参数. |
results | array[object] | 历史记录的搜索结果. |
其中,list.request
的参数如下
名称 | 类型 | 描述 |
---|---|---|
config | object | 搜索配置. |
page_size | int32 | 每页大小. |
page_token | string | 分页令牌;如果从头开始,不要传递. |
keyword | string | 要检索的文本. |
其中,request.config
的参数如下
名称 | 类型 | 描述 |
---|---|---|
dataset_list | array[object] | 要搜索的知识库列表. |
top_k | int32 | 返回结果的Top K值. |
confidence | float | 置信度. |
weight | float | 权重:表示两种方法之间的比例. |
open_window | bool | 是否在提示中包含检索段的前后片段. |
其中,config.dataset_list
的参数如下
名称 | 类型 | 描述 |
---|---|---|
id | string | 知识库ID. |
display_name | string | 知识库显示名称. |
其中,list.results
的参数如下
名称 | 类型 | 描述 |
---|---|---|
page_content | string | 页面内容. |
document | object | 相关知识文档. |
confidence | float | 结果置信度. |
token_count | int64 | 内容的token数量. |
segment_number | int32 | 段落数量. |
words | int32 | 段落的字数. |
type | integer($enum) | 段落类型. |
display_type | integer($enum) | 显示类型. |
table_content | string | 表格内容. |
image_uri | string | 图片URI. |
image_key | string | 图片键. |
image_keys | array[string] | 图片键集合. |
display_content | string | 显示内容. |
其中,results.document
的参数如下
名称 | 类型 | 描述 |
---|---|---|
document_id | string | 知识文档的ID. |
display_name | string | 知识文档的名称. |
type | integer($enum) | 知识文档的类型. |
document_size | int64 | 知识文档的大小. |
token_count | int64 | 知识文档的令牌计数. |
segment_count | int64 | 知识文档的段落计数. |
dataset_id | string | 知识文档所属知识库的ID. |
dataset_display | string | 知识文档所属知识库的显示名称. |
p_id | string | 父知识文档的ID. |
data_source_type | integer($enum) | 知识文档的数据源类型. |
creator | string | 知识文档的创建者. |
create_time | string($date-time) | 知识文档的创建时间. |
update_time | string($date-time) | 知识文档的更新时间. |
segments | array[object] | 知识文档的段落详细信息列表. |
uri | string | 知识文档在OSS中的预签名URI. |
其中,document.type
有如下情况
枚举值 | 数值 | 含义 |
---|---|---|
DOCUMENT_TYPE_UNSPECIFIED | 0 | 未指定 |
WEBPAGE | 1 | 网页 |
FOLDER | 2 | 文件夹 |
TXT | 3 | 文本文件 |
4 | PDF文件 | |
HTML | 5 | HTML文件 |
XLSX | 6 | XLSX文件 |
XLS | 7 | XLS文件 |
DOCX | 8 | DOCX文件 |
CSV | 9 | CSV文件 |
PPTX | 10 | PPTX文件 |
PPT | 11 | PPT文件,暂不支持 |
XML | 12 | XML文件 |
MARKDOWN | 13 | Markdown文件 |
MD | 14 | MD文件 |
JSON | 15 | Json文件 |
其中,document.data_source_type
有如下情况
枚举值 | 数值 | 含义 |
---|---|---|
DATA_SOURCE_TYPE_UNSPECIFIED | 0 | 开始,默认 |
LOCAL_FILE | 1 | 本地知识 |
WEB | 2 | 网络知识 |
NOTION | 3 | Notion知识 |
其中,document.segments
的参数如下
名称 | 类型 | 描述 |
---|---|---|
segment_id | string | 段ID. |
dataset_id | string | 知识库ID |
document_id | string | 文档ID |
content | string | 段落内容 |
token_count | int32 | 词元数量 |
number | int32 | 段落编号 |
metadata | object | 元数据 |
words | int32 | 单词数量 |
segment_type | integer($enum) | 段落类型 |
table_content | string | 表格内容 |
image_key | string | 图片键值 |
image_uri | string | 图片URI |
display_type | integer($enum) | 显示类型 |
image_keys | array[string] | 图片键值列表 |
display_content | string | 展示内容 |
其中,segments.metadata
的参数如下
名称 | 类型 | 描述 |
---|---|---|
key_words | array[string] | 关键词 |
image_name_value | string | 图片名称 |
image_size | int32 | 图片大小 |
table_name_value | string | 表格名称 |
table_rows | int32 | 表格行数 |
table_columns | array[string] | 表格列 |
score | float | 分数 |
其中,results.type
和segments.segment_type
有如下情况
枚举值 | 数值 | 含义 |
---|---|---|
SEGMENT_TYPE_UNSPECIFIED | 0 | 未指定状态 |
SEGMENT_TYPE_TEXT | 1 | 文字 |
SEGMENT_TYPE_IMAGE | 2 | 图片 |
SEGMENT_TYPE_TABLE | 3 | 表格 |
SEGMENT_TYPE_WEB_IMAGE | 4 | 网页图片 |
其中,results.display_type
和segments.display_type
有如下情况
枚举值 | 数值 | 含义 |
---|---|---|
DISPLAY_TYPE_UNSPECIFIED | 0 | 未指定状态 |
DISPLAY_TYPE_TEXT | 1 | 文字 |
DISPLAY_TYPE_MARKDOWN | 2 | Markdown |
响应示例(Response Example)
{
"list": [
{
"id": "10c67a2f-3e8e-49b7-8ec7-88edd5174892",
"request": {
"config": {
"dataset_list": [
{
"id": "rag_709be04165094a78b12d60df29817b54",
"display_name": "uploadurl"
},
{
"id": "d3e045538a124300a050864a95c7bd30",
"display_name": "r14t4641"
},
{
"id": "rag_feca3cbcc636484ca14195716d8aa588",
"display_name": "test01"
}
],
"top_k": 3,
"confidence": 0
},
"page_size": 0,
"page_token": "",
"keyword": "银行"
},
"results": [
{
"page_content": "*****",
"document": {
"name": "",
"document_id": "1b41913407d64de895b481efa61dddda",
"display_name": "newke.com/pract",
"type": 0,
"document_size": "6477",
"token_count": "231",
"segment_count": "6",
"dataset_id": "rag_feca3cbcc636484ca14195716d8aa588",
"dataset_display": "test01",
"p_id": "",
"data_source_type": 2,
"creator": "7e1d3847-d467-44b6-a3f9-acf019ae9cc3",
"create_time": "2024-07-11T10:10:09.414562Z",
"update_time": "2024-07-18T09:22:30.807009Z",
"segments": [],
"uri": ""
},
"confidence": 0.008333334,
"token_count": "40",
"segment_number": 5,
"words": 0
},
{
"page_content": "xsad",
"document": {
"name": "",
"document_id": "0d65c4675f3e4b8693177f77aba7bbd1",
"display_name": "1.txt",
"type": 3,
"document_size": "4",
"token_count": "0",
"segment_count": "0",
"dataset_id": "rag_709be04165094a78b12d60df29817b54",
"dataset_display": "uploadurl",
"p_id": "",
"data_source_type": 1,
"creator": "7e1d3847-d467-44b6-a3f9-acf019ae9cc3",
"create_time": "2024-07-11T07:49:51.460208Z",
"update_time": "2024-07-11T07:49:51.460220Z",
"segments": [],
"uri": ""
},
"confidence": 0.008333334,
"token_count": "1",
"segment_number": 1,
"words": 0
}
]
}
]
}