文本生成
Claude 消息接口
POST
Documentation Index
Fetch the complete documentation index at: https://docs.qingbo.dev/llms.txt
Use this file to discover all available pages before exploring further.
- 完全兼容 Claude Messages API 格式
- 支持多轮对话和单次查询
- 支持文本、图像等多模态内容
Authorizations
API 版本号指定要使用的 Claude API 版本示例:
2023-06-01Body
模型名称
claude-opus-4.6- Claude 4.6 Opus 最新旗舰模型claude-sonnet-4.6- Claude 4.6 Sonnet 最新版claude-opus-4.5- Claude 4.5 Opus 旗舰模型claude-sonnet-4.5- Claude 4.5 Sonnet 平衡版claude-haiku-4.5- Claude 4.5 Haiku 快速响应版
消息列表,支持交替的
user 和 assistant 角色最大生成 token 数生成停止前的最大 token 数量。模型可能会在达到此限制前停止。不同模型有不同的最大值,请参考模型文档。最小值:1
系统提示词系统提示词用于设置 Claude 的角色、个性、目标和指令。字符串格式:结构化格式:
温度参数,范围 0-1控制输出的随机性:
- 低值(如 0.2):更确定、更保守
- 高值(如 0.8):更随机、更有创意
核采样参数,范围 0-1使用 nucleus sampling。建议使用
temperature 或 top_p 其中之一,不要同时使用。默认值:1.0Top-K 采样只从概率最高的 K 个选项中采样,用于移除”长尾”低概率响应。建议仅在高级用例中使用。
是否启用流式输出
true: 通过服务器发送事件 (SSE) 逐步返回响应false: 一次性返回完整响应
停止序列自定义文本序列,遇到时停止生成。最多 4 个序列,每个最长 32 个 token。
元数据用于追踪或标识请求的对象。
Response
消息的唯一标识符
对象类型,固定为
message角色类型,固定为
assistant消息内容数组
实际使用的模型名称
停止原因可能的值:
end_turn- 自然结束max_tokens- 达到最大 token 限制stop_sequence- 遇到停止序列tool_use- 工具使用
触发停止的序列(如果有)
token 使用统计