控制台文档联系我们

如何使用【图文对话生成】 | 大装置帮助中心

跳到主要内容

如何使用【图文对话生成】

在本入门教程中，我们将演示如何通过我们的 OpenAPI ，使用对话生成。

一、调用前的准备工作

首先，您需要完成一些调用前的准备工作，主要包括：

二、获取您可用的模型列表

调用 “获取模型列表” 接口，查看您可用的模型ID。关于每个模型的介绍，可以查看模型清单。

三、上传图片

调用 “创建并上传文件” 接口，上传成功后可以获得上传图片的文件ID（即file_id）。

也可以在直接在content字段中，直接使用image_url，将要上传的图片URL放在请求体中

四、使用图文对话生成

调用 “图文对话生成” 接口，进行对话。其中，有几个参数的使用方法需要注意：

请求体中的 model 参数

直接填写您从第二步获取到的模型ID即可。

请求体中的 messages 参数

您可以在这个参数中填写您想跟大模型对话的内容，参数image_file_id直接填写您从第三步获取到的上传图片的文件ID即可，例如：

图片识别：

苹果图片

{
    "messages": [
        {
            "role": "user",
            "content": [
              {
                "type": "image_file_id",
                "image_file_id": "file_id"
              },
              {
                "type": "text",
                "text": "这是什么？"
              }
            ]
        }
    ]
}

视觉对话：

小猫图片

{
    "messages": [
        {
            "role": "user",
            "content": [
              {
                "type": "image_file_id",
                "image_file_id": "file_id"
              },
              {
                "type": "text",
                "text": "图片中的小猫在干什么？"
              }
            ]
        }
    ]
}

到这里，您已经完成了一个简单的多模态对话生成的使用，如果过程中出现了以上文档没有解释到的其他问题，欢迎您随时联系我们！

一、调用前的准备工作
二、获取您可用的模型列表
三、上传图片
四、使用图文对话生成