如何使用【图文对话生成】 | 大装置帮助中心
跳到主要内容

如何使用【图文对话生成】

在本入门教程中,我们将演示如何通过我们的 OpenAPI ,使用对话生成。


一、调用前的准备工作

首先,您需要完成一些调用前的准备工作,主要包括:

  1. “获取访问密钥”
  2. “生成API_TOKEN”

二、获取您可用的模型列表

调用 “获取模型列表” 接口,查看您可用的模型ID。 关于每个模型的介绍,可以查看 模型清单


三、上传图片

调用 “创建并上传文件” 接口,上传成功后可以获得上传图片的文件ID(即file_id)。


四、使用图文对话生成

调用 “图文对话生成” 接口,进行对话。其中,有几个参数的使用方法需要注意:

  1. 请求体中的 model 参数

直接填写您从第二步获取到的模型ID即可。

  1. 请求体中的 messages 参数

您可以在这个参数中填写您想跟大模型对话的内容,参数image_file_id直接填写您从第三步获取到的上传图片的文件ID即可,例如:

  • 图片识别:

苹果图片

{
"messages": [
{
"role": "user",
"content": [
{
"type": "image_file_id",
"image_file_id": "file_id"
},
{
"type": "text",
"text": "这是什么?"
}
]
}
]
}
  • 视觉对话:

小猫图片

{
"messages": [
{
"role": "user",
"content": [
{
"type": "image_file_id",
"image_file_id": "file_id"
},
{
"type": "text",
"text": "图片中的小猫在干什么?"
}
]
}
]
}

到这里,您已经完成了一个简单的多模态对话生成的使用,如果过程中出现了以上文档没有解释到的其他问题,欢迎您随时联系我们!