文本生成
多模态响应接口
POST
Documentation Index
Fetch the complete documentation index at: https://docs.qingbo.dev/llms.txt
Use this file to discover all available pages before exploring further.
- 完全兼容 OpenAI Responses API 格式
- 支持文本和图像的多模态输入
- 支持工具扩展:网络搜索、文件搜索、函数调用、远程 MCP
Authorizations
Body
模型名称支持的模型包括:
gpt-5- GPT-5 基础模型gpt-5-pro- GPT-5 专业增强版(仅支持此接口)gpt-5-codex- GPT-5 Codex 代码模型(仅支持此接口)gpt-5.1-codex- GPT-5.1 Codex 代码模型(仅支持此接口)gpt-5.1-codex-mini- GPT-5.1 Codex Mini(仅支持此接口)gpt-5.2-codex- GPT-5.2 Codex 代码模型(仅支持此接口)gpt-5.3-codex- GPT-5.3 Codex 代码模型(仅支持此接口)- 以及所有支持
/v1/chat/completions的模型
gpt-5-pro 和所有 Codex 系列模型仅支持此接口(/v1/responses),不支持 /v1/chat/completions。输入内容,支持字符串或消息数组字符串形式为简单文本输入,数组形式支持多轮对话和多模态:
工具列表,可选配置支持的工具类型:
web_search- 网络搜索file_search- 文件搜索function- 函数调用remote_mcp- 远程 MCP 服务
控制输出随机性,范围 0-2默认值:1.0
生成的最大 token 数量
是否使用流式输出默认值:false
Response
响应的唯一标识符
对象类型,固定为
response创建时间戳
实际使用的模型名称(如
gpt-5-2025-08-07)响应状态可能的值:
completed- 已完成in_progress- 处理中failed- 失败cancelled- 已取消
输出内容数组
token 使用统计
推理配置信息(思考模型专用)
实际使用的采样温度
实际使用的核采样参数
工具选择策略
使用的工具列表
是否允许并行工具调用
是否存储对话历史
服务等级
截断策略
文本格式配置
是否为后台任务
错误信息(如果有)
元数据信息
使用示例
图片分析
视频分析
使用网络搜索工具
使用函数调用
内容类型说明
input_text
文本输入类型 属性:type: 固定为"input_text"text: 文本内容(字符串)
input_image
图像输入类型 属性:type: 固定为"input_image"image_url: 图像 URL 或 Base64 编码的数据 URI
- JPEG
- PNG
- GIF
- WebP
- 最大文件大小:20MB
- 推荐分辨率:不超过 2048x2048 像素
input_video
视频输入类型(部分模型支持) 属性:type: 固定为"input_video"video_url: 视频 URL
- MP4
- MOV
- AVI
- WebM
- 最大文件大小:200MB
- 最大时长:10 分钟
- 推荐分辨率:1080p
工具使用详解
网络搜索 (Web Search)
使用网络搜索工具可以让模型访问实时互联网信息。 配置示例:- 查询最新新闻和时事
- 获取实时数据(股票、天气、汇率等)
- 搜索最新的技术文档和资料
- 验证事实信息
文件搜索 (File Search)
文件搜索工具允许模型在已上传的文档中搜索相关信息。 配置示例:- 分析企业内部文档
- 搜索技术规范和手册
- 查询合同和法律文件
- 知识库问答系统
函数调用 (Function Calling)
定义自定义函数,让模型能够调用外部 API 或执行特定操作。 完整配置示例:name: 函数名称(必需)description: 函数功能描述(必需)parameters: 参数定义,使用 JSON Schema 格式type: 参数类型properties: 参数属性定义required: 必需参数列表
- 调用第三方 API
- 执行数据库查询
- 触发业务流程
- 与内部系统集成
远程 MCP (Remote MCP)
连接到远程模型上下文协议(MCP)服务,扩展模型能力。 配置示例:url: MCP 服务器地址(必需)auth_token: 认证令牌(可选)timeout: 超时时间(秒),默认 30 秒
- 连接企业级 AI 服务
- 使用专业领域模型
- 访问受保护的数据源
- 分布式 AI 系统集成
工具响应格式
当模型使用工具时,响应格式会包含工具调用信息:- 模型接收用户输入
- 分析是否需要使用工具
- 如需要,返回工具调用请求
- 客户端执行工具调用
- 将工具结果返回给模型
- 模型生成最终响应
注意事项
-
图像 URL 要求:
- 必须是公开可访问的 URL
- 或使用 Base64 编码的 Data URI 格式
-
Token 计费:
- 图像会根据其分辨率消耗相应的 tokens
- 高分辨率图像会自动调整大小以优化成本
- 工具调用也会消耗额外的 tokens
-
内容顺序:
- content 数组中的元素顺序会影响模型理解
- 建议先放置文本指令,再放置图像/视频
-
多模态组合:
- 可以在一个请求中混合多个文本和图像
- 支持多轮对话,保持上下文连贯性
-
工具使用限制:
- 同时使用多个工具时,模型会智能选择最合适的工具
- 函数调用需要明确的函数定义和参数说明
- 网络搜索结果可能受地域和时间限制
-
API 兼容性:
- 完全兼容 OpenAI Responses API 格式
- 可无缝迁移现有 OpenAI 代码
- 支持所有 OpenAI 工具扩展功能