视频生成
Kling 系列
快手可灵视频生成 — v2.6 / v3 / v3-omni / video-o1 四代模型,覆盖文生、图生、首尾帧、多模态参考与推理增强
POST
Kling 系列
快手可灵 Kling 视频生成系列。 四代模型分工:Documentation Index
Fetch the complete documentation index at: https://docs.qingbo.dev/llms.txt
Use this file to discover all available pages before exploring further.
- kling-v2.6 — 经典稳定版,720P 无声 / 1080P 可有声,语义和动态稳定性进一步打磨
- kling-v3 — 新一代基础模型,新增 4K 分辨率,文生时长可拓展到 15 秒,原生支持有声视频
- kling-v3-omni — v3 系列统一多模态接口,文生 / 图生 / 视频参考全走同一 endpoint,prompt 支持
<<<image_N>>>引用语法 - kling-video-o1 — 首款推理增强视频模型,生成前对提示词与参考素材深度规划,物理一致性、复杂运动、长动作语义跟随上表现最优
$/秒,通过 resolution 选择 720p / 1080p / 4K。
定价
| 模型 | 720P | 1080P | 4K | 备注 |
|---|---|---|---|---|
kling-v2.6 | $0.0391 | $0.06641 | — | 1080P 有声叠加至 $0.159375 |
kling-v3 | $0.0714 | $0.0952 | $0.455345 | 有声:720P $0.1071 / 1080P $0.1428 / 4K 同价 |
kling-v3-omni | $0.0714 | $0.0952 | $0.455345 | 有声:720P $0.0952 / 1080P $0.119;视频参考:720P $0.1071 / 1080P $0.1428 |
kling-video-o1 | $0.0714 | $0.0952 | — | 视频参考:720P $0.1071 / 1080P $0.1428 |
单价为每秒;实际计费 = 单价 ×
duration。开启 audio 或挂 video_list 视频参考会切换到对应高档单价。调用示例
GET /v1/tasks/{task_id} 轮询状态,详见 任务系统。
可用模型
| 模型 ID | 分辨率 | 时长 | 支持 action | 特色 |
|---|---|---|---|---|
kling-video-o1 | 720P / 1080P | 5 / 10 秒 | generate · image2video · first_last_frame · reference · reference_video | 推理增强,物理一致性最优 |
kling-v3-omni | 720P / 1080P / 4K | 3-15 秒 | generate · image2video · reference · reference_video | 统一多模态 endpoint |
kling-v3 | 720P / 1080P / 4K | 3-15 秒 | generate · image2video · first_last_frame | 4K + 原生有声 |
kling-v2.6 | 720P / 1080P | 5 / 10 秒 | generate · image2video · first_last_frame | 1080P 可有声,稳定性优 |
通用参数
操作类型,可选值:
generate— 文生视频(T2V)image2video— 图生视频,需配合first_frame_image或image_urlsfirst_last_frame— 首尾帧补全,需first_frame_image+last_frame_image(v2.6 / v3 / o1)reference— 多模态参考生视频,需配合image_urls(omni / o1)reference_video— 视频参考生视频,需配合video_list(omni / o1)
视频描述文本。Omni / O1 中可用
<<<image_N>>> 语法引用 image_urls 第 N 张图(N 从 1 开始)画面宽高比,仅 T2V 生效;图 / 视频参考模式跟随源素材比例。可选值:
16:9— 横版宽屏9:16— 竖版长屏1:1— 正方形
视频时长(秒)。v2.6 / o1 仅
5 或 10;v3 / omni 支持 3-15 任意整数参考图片 URL 数组。单元素数组触发 I2V;多张用于 Omni / O1 的多模态参考(可被
<<<image_N>>> 引用)视频首帧图 URL。配合
image2video 或 first_last_frame action 使用(v2.6 / v3 / o1)视频尾帧图 URL,配合
first_last_frame action 使用参考视频 URL 数组(单元素)。Omni / O1 简化形态,等价于挂一段
refer_type=feature 的 video_list需要推送的事件类型,默认终态全推
模型特定参数
- kling-video-o1
- kling-v3-omni
- kling-v3
- kling-v2.6
参考视频列表,最多 1 段。结构与 Omni 相同:
video_url— 视频 URLrefer_type—base/featurekeep_original_sound—yes/no
audio 字段;有声需求请用 v3 / omni。特殊语法说明
<<<image_N>>> 提示词图片引用(Omni / O1 适用)
在 prompt 中用 <<<image_N>>> 占位符显式引用 image_urls 数组中的第 N 张图(N 从 1 开始)。模型会把占位符替换为对应图像内容,用于:
- 角色一致性 —
<<<image_1>>>锁定主体形象 - 场景拼合 —
<<<image_1>>>中的角色出现在<<<image_2>>>的环境 - 多素材引导 — 任意位置嵌入 N 张参考图
示例
image_urls:
非 Omni / O1 的 v2.6 / v3 不解析
<<<image_N>>> 占位符,会作为字面文本送入模型。资源限制
| 项目 | 限制 |
|---|---|
| 参考图片(单张) | ≤ 30MB,JPG / PNG / WEBP |
| 参考图片(数量) | I2V:1 张;Omni / O1 多模态:建议 ≤ 4 张 |
参考视频(video_list) | MP4 / MOV,≤ 100MB,2-30 秒,最多 1 段 |
| 提示词 | ≤ 2500 字符 |
| 输出 | MP4,链接 24 小时有效 |
相关文档
Kling 系列