智能字幕

对视频进行语音识别,自动生成字幕,支持翻译为其他语言,并提供多种字幕样式和颜色选择。可选择将字幕渲染烧录到视频中。

创建任务

基本信息

项目
请求方法POST
请求路径/task/video_ai_subtitle
Content-Typeapplication/json
鉴权方式Authorization 请求头(直接传 API Key)

请求参数(Body)

参数名类型必填默认值说明
file_idstring已上传视频文件的 ID
languagestring字幕源语言代码,完整列表见下方“支持的语言代码”
translate_languagestring字幕翻译目标语言代码,支持范围与 language 相同;不填则不翻译
need_renderbooleanfalse是否将字幕烧录到视频中
need_purebooleanfalse是否先去除原视频中已有的字幕
lingual_typestring"bilingual"字幕语言类型:monolingual(单语)/ bilingual(双语,需设置翻译语言),示例见下方“字幕样式示例”
subtitle_typestring"default"字幕样式:default / outline / cinema_yellow / immersive_box / wide_spacing / deep_shadow / boxed,示例见下方“字幕样式示例”
subtitle_colorstring"雅黑"字幕颜色:雅黑 / 淡绿 / 森林绿 / 湖蓝 / 道奇蓝 / 钢蓝 / 浅粉红 / 深橙 / 珊瑚橙 / 橙红 / 土豪金

支持的语言代码

languagetranslate_language 使用同一组语言代码,智能字幕支持以下 11 种语言互译:

语言代码语言名称
zh-CHT中文繁体
zh-CHS中文简体
zh-CN中文
ja-JP日文
en-US英文
es-ES西班牙文
ru-RU俄文
ko-KR韩文
fr-FR法文
pt-PT葡萄牙文
vi-VN越南文

提示:当 lingual_typebilingual 时,建议显式传入 translate_language,并确保它也来自上表。

字幕样式示例

以下展示智能字幕当前支持的全部 7subtitle_type 样式,并覆盖:

  • monolingualbilingual
  • 1080x19201920x10802160x38403840x2160480x848848x480

请求中请直接使用对应的 subtitle_type 参数值。

默认

default

每种样式均包含 12 张示例图

双语 / bilingual

竖版 / portrait

默认 字幕样式示例,双语 / bilingual,480x848
480x848
默认 字幕样式示例,双语 / bilingual,1080x1920
1080x1920
默认 字幕样式示例,双语 / bilingual,2160x3840
2160x3840

横版 / landscape

默认 字幕样式示例,双语 / bilingual,848x480
848x480
默认 字幕样式示例,双语 / bilingual,1920x1080
1920x1080
默认 字幕样式示例,双语 / bilingual,3840x2160
3840x2160

单语 / monolingual

竖版 / portrait

默认 字幕样式示例,单语 / monolingual,480x848
480x848
默认 字幕样式示例,单语 / monolingual,1080x1920
1080x1920
默认 字幕样式示例,单语 / monolingual,2160x3840
2160x3840

横版 / landscape

默认 字幕样式示例,单语 / monolingual,848x480
848x480
默认 字幕样式示例,单语 / monolingual,1920x1080
1920x1080
默认 字幕样式示例,单语 / monolingual,3840x2160
3840x2160

描边

outline

每种样式均包含 12 张示例图

双语 / bilingual

竖版 / portrait

描边 字幕样式示例,双语 / bilingual,480x848
480x848
描边 字幕样式示例,双语 / bilingual,1080x1920
1080x1920
描边 字幕样式示例,双语 / bilingual,2160x3840
2160x3840

横版 / landscape

描边 字幕样式示例,双语 / bilingual,848x480
848x480
描边 字幕样式示例,双语 / bilingual,1920x1080
1920x1080
描边 字幕样式示例,双语 / bilingual,3840x2160
3840x2160

单语 / monolingual

竖版 / portrait

描边 字幕样式示例,单语 / monolingual,480x848
480x848
描边 字幕样式示例,单语 / monolingual,1080x1920
1080x1920
描边 字幕样式示例,单语 / monolingual,2160x3840
2160x3840

横版 / landscape

描边 字幕样式示例,单语 / monolingual,848x480
848x480
描边 字幕样式示例,单语 / monolingual,1920x1080
1920x1080
描边 字幕样式示例,单语 / monolingual,3840x2160
3840x2160

影院黄

cinema_yellow

每种样式均包含 12 张示例图

双语 / bilingual

竖版 / portrait

影院黄 字幕样式示例,双语 / bilingual,480x848
480x848
影院黄 字幕样式示例,双语 / bilingual,1080x1920
1080x1920
影院黄 字幕样式示例,双语 / bilingual,2160x3840
2160x3840

横版 / landscape

影院黄 字幕样式示例,双语 / bilingual,848x480
848x480
影院黄 字幕样式示例,双语 / bilingual,1920x1080
1920x1080
影院黄 字幕样式示例,双语 / bilingual,3840x2160
3840x2160

单语 / monolingual

竖版 / portrait

影院黄 字幕样式示例,单语 / monolingual,480x848
480x848
影院黄 字幕样式示例,单语 / monolingual,1080x1920
1080x1920
影院黄 字幕样式示例,单语 / monolingual,2160x3840
2160x3840

横版 / landscape

影院黄 字幕样式示例,单语 / monolingual,848x480
848x480
影院黄 字幕样式示例,单语 / monolingual,1920x1080
1920x1080
影院黄 字幕样式示例,单语 / monolingual,3840x2160
3840x2160

沉浸框

immersive_box

每种样式均包含 12 张示例图

双语 / bilingual

竖版 / portrait

沉浸框 字幕样式示例,双语 / bilingual,480x848
480x848
沉浸框 字幕样式示例,双语 / bilingual,1080x1920
1080x1920
沉浸框 字幕样式示例,双语 / bilingual,2160x3840
2160x3840

横版 / landscape

沉浸框 字幕样式示例,双语 / bilingual,848x480
848x480
沉浸框 字幕样式示例,双语 / bilingual,1920x1080
1920x1080
沉浸框 字幕样式示例,双语 / bilingual,3840x2160
3840x2160

单语 / monolingual

竖版 / portrait

沉浸框 字幕样式示例,单语 / monolingual,480x848
480x848
沉浸框 字幕样式示例,单语 / monolingual,1080x1920
1080x1920
沉浸框 字幕样式示例,单语 / monolingual,2160x3840
2160x3840

横版 / landscape

沉浸框 字幕样式示例,单语 / monolingual,848x480
848x480
沉浸框 字幕样式示例,单语 / monolingual,1920x1080
1920x1080
沉浸框 字幕样式示例,单语 / monolingual,3840x2160
3840x2160

宽间距

wide_spacing

每种样式均包含 12 张示例图

双语 / bilingual

竖版 / portrait

宽间距 字幕样式示例,双语 / bilingual,480x848
480x848
宽间距 字幕样式示例,双语 / bilingual,1080x1920
1080x1920
宽间距 字幕样式示例,双语 / bilingual,2160x3840
2160x3840

横版 / landscape

宽间距 字幕样式示例,双语 / bilingual,848x480
848x480
宽间距 字幕样式示例,双语 / bilingual,1920x1080
1920x1080
宽间距 字幕样式示例,双语 / bilingual,3840x2160
3840x2160

单语 / monolingual

竖版 / portrait

宽间距 字幕样式示例,单语 / monolingual,480x848
480x848
宽间距 字幕样式示例,单语 / monolingual,1080x1920
1080x1920
宽间距 字幕样式示例,单语 / monolingual,2160x3840
2160x3840

横版 / landscape

宽间距 字幕样式示例,单语 / monolingual,848x480
848x480
宽间距 字幕样式示例,单语 / monolingual,1920x1080
1920x1080
宽间距 字幕样式示例,单语 / monolingual,3840x2160
3840x2160

深阴影

deep_shadow

每种样式均包含 12 张示例图

双语 / bilingual

竖版 / portrait

深阴影 字幕样式示例,双语 / bilingual,480x848
480x848
深阴影 字幕样式示例,双语 / bilingual,1080x1920
1080x1920
深阴影 字幕样式示例,双语 / bilingual,2160x3840
2160x3840

横版 / landscape

深阴影 字幕样式示例,双语 / bilingual,848x480
848x480
深阴影 字幕样式示例,双语 / bilingual,1920x1080
1920x1080
深阴影 字幕样式示例,双语 / bilingual,3840x2160
3840x2160

单语 / monolingual

竖版 / portrait

深阴影 字幕样式示例,单语 / monolingual,480x848
480x848
深阴影 字幕样式示例,单语 / monolingual,1080x1920
1080x1920
深阴影 字幕样式示例,单语 / monolingual,2160x3840
2160x3840

横版 / landscape

深阴影 字幕样式示例,单语 / monolingual,848x480
848x480
深阴影 字幕样式示例,单语 / monolingual,1920x1080
1920x1080
深阴影 字幕样式示例,单语 / monolingual,3840x2160
3840x2160

盒装

boxed

每种样式均包含 12 张示例图

双语 / bilingual

竖版 / portrait

盒装 字幕样式示例,双语 / bilingual,480x848
480x848
盒装 字幕样式示例,双语 / bilingual,1080x1920
1080x1920
盒装 字幕样式示例,双语 / bilingual,2160x3840
2160x3840

横版 / landscape

盒装 字幕样式示例,双语 / bilingual,848x480
848x480
盒装 字幕样式示例,双语 / bilingual,1920x1080
1920x1080
盒装 字幕样式示例,双语 / bilingual,3840x2160
3840x2160

单语 / monolingual

竖版 / portrait

盒装 字幕样式示例,单语 / monolingual,480x848
480x848
盒装 字幕样式示例,单语 / monolingual,1080x1920
1080x1920
盒装 字幕样式示例,单语 / monolingual,2160x3840
2160x3840

横版 / landscape

盒装 字幕样式示例,单语 / monolingual,848x480
848x480
盒装 字幕样式示例,单语 / monolingual,1920x1080
1920x1080
盒装 字幕样式示例,单语 / monolingual,3840x2160
3840x2160

content 对象(可选)

可通过 content 字段补充视频上下文信息,帮助提升字幕准确率:

参数名类型说明
content.video_titlestring视频标题
content.video_infostring视频内容摘要描述

请求示例

curl -X POST https://api.ai-mcn.tv:10000/task/video_ai_subtitle \
  -H "Authorization: YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "file_id": "537489015178246",
    "language": "zh-CN",
    "translate_language": "en-US",
    "need_render": true,
    "lingual_type": "bilingual",
    "subtitle_type": "outline",
    "subtitle_color": "雅黑"
  }'

成功响应示例

{
  "code": 200,
  "msg": "success",
  "data": {
    "task_id": "537489015178247",
    "task_type": "video_ai_subtitle",
    "status": "queued"
  }
}

查询任务结果

基本信息

项目
请求方法GET
请求路径/task/video_ai_subtitle/{task_id}
鉴权方式Authorization 请求头(直接传 API Key)

响应参数(output_result)

参数名类型说明
file_idstring烧录字幕后的视频文件 ID(仅 need_render: true 时返回)
subtitle_file_idstring字幕文件 ID(SRT 格式)

成功响应示例

{
  "code": 200,
  "msg": "success",
  "data": {
    "task_id": "537489015178247",
    "status": "completed",
    "progress": 100,
    "output_result": {
      "file_id": "537489015178248",
      "subtitle_file_id": "537489015178249"
    },
    "create_time": "2026-04-05T08:00:00Z",
    "update_time": "2026-04-05T08:01:30Z"
  }
}

错误码

错误码HTTP 状态码说明解决方案
6013400file_idlanguage 缺失补充必填参数
6015400不支持的语言代码使用上表中的受支持语言代码
6004404文件不存在检查 file_id 是否正确
6502401鉴权失败检查 Authorization 请求头
6202402余额不足前往仪表盘充值