语音转文字(ASR)

将音频文件中的语音内容转换为文字,支持多语言识别,并可获取字级别或句子级别的时间戳信息。

创建任务

基本信息

项目
请求方法POST
请求路径/task/asr
Content-Typeapplication/json
鉴权方式Authorization 请求头(直接传 API Key)

请求参数(Body)

参数名类型必填默认值说明
file_idstring已上传音频或视频文件的 ID
languagestring"zh-CN"音频语言代码,传标准地区语言码,完整列表见下方“支持的语言代码”
word_levelbooleanfalse是否返回字级别时间戳(开启后响应数据更详细)

支持的语言代码

language 参数应传标准地区语言码。当前实现共支持 101 个可传入值:

请求 language语言名称
zh-CN中文 (中国)
en-US英语 (美国)
ja-JP日语 (日本)
ko-KR韩语 (韩国)
fr-FR法语 (法国)
de-DE德语 (德国)
es-MX西班牙语 (墨西哥)
pt-BR葡萄牙语 (巴西)
ru-RU俄语 (俄罗斯)
zh-HK中文 (中国香港特别行政区)
id-ID印度尼西亚语 (印度尼西亚)
fil-PH菲律宾语 (菲律宾)
ms-MY马来语 (马来西亚)
th-TH泰语 (泰国)
ar-SA阿拉伯语 (沙特阿拉伯)
af-ZA南非荷兰语 (南非)
am-ET阿姆哈拉语 (埃塞俄比亚)
as-IN阿萨姆语 (印度)
az-AZ阿塞拜疆语 (阿塞拜疆)
ba-RU巴什基尔语 (俄罗斯)
be-BY白俄罗斯语 (白俄罗斯)
bg-BG保加利亚语 (保加利亚)
bn-IN孟加拉语 (印度)
bo-CN藏语 (中国)
br-FR布列塔尼语 (法国)
bs-BA波斯尼亚语 (波斯尼亚和黑塞哥维那)
ca-ES加泰罗尼亚语 (西班牙)
cs-CZ捷克语 (捷克)
cy-GB威尔士语 (英国)
da-DK丹麦语 (丹麦)
el-GR希腊语 (希腊)
et-EE爱沙尼亚语 (爱沙尼亚)
eu-ES巴斯克语 (西班牙)
fa-IR波斯语 (伊朗)
fi-FI芬兰语 (芬兰)
fo-FO法罗语 (法罗群岛)
gl-ES加利西亚语 (西班牙)
gu-IN古吉拉特语 (印度)
ha-NG豪萨语 (尼日利亚)
haw-US夏威夷语 (美国)
he-IL希伯来语 (以色列)
hi-IN印地语 (印度)
hr-HR克罗地亚语 (克罗地亚)
ht-HT海地克里奥尔语 (海地)
hu-HU匈牙利语 (匈牙利)
hy-AM亚美尼亚语 (亚美尼亚)
is-IS冰岛语 (冰岛)
it-IT意大利语 (意大利)
jw-ID爪哇语 (印度尼西亚)
ka-GE格鲁吉亚语 (格鲁吉亚)
kk-KZ哈萨克语 (哈萨克斯坦)
km-KH高棉语 (柬埔寨)
kn-IN卡纳达语 (印度)
la-VA拉丁语 (梵蒂冈)
lb-LU卢森堡语 (卢森堡)
ln-CD林加拉语 (刚果(金))
lo-LA老挝语 (老挝)
lt-LT立陶宛语 (立陶宛)
lv-LV拉脱维亚语 (拉脱维亚)
mg-MG马拉加斯语 (马达加斯加)
mi-NZ毛利语 (新西兰)
mk-MK马其顿语 (北马其顿)
ml-IN马拉雅拉姆语 (印度)
mn-MN蒙古语 (蒙古)
mr-IN马拉地语 (印度)
mt-MT马耳他语 (马耳他)
my-MM缅甸语 (缅甸)
ne-NP尼泊尔语 (尼泊尔)
nl-NL荷兰语 (荷兰)
nn-NO挪威尼诺斯克语 (挪威)
no-NO挪威语 (挪威)
oc-FR奥克语 (法国)
pa-IN旁遮普语 (印度)
pl-PL波兰语 (波兰)
ps-AF普什图语 (阿富汗)
ro-RO罗马尼亚语 (罗马尼亚)
sa-IN梵语 (印度)
sd-IN信德语 (印度)
si-LK僧伽罗语 (斯里兰卡)
sk-SK斯洛伐克语 (斯洛伐克)
sl-SI斯洛文尼亚语 (斯洛文尼亚)
sn-ZW绍纳语 (津巴布韦)
so-SO索马里语 (索马里)
sq-AL阿尔巴尼亚语 (阿尔巴尼亚)
sr-RS塞尔维亚语 (塞尔维亚)
su-ID巽他语 (印度尼西亚)
sv-SE瑞典语 (瑞典)
sw-KE斯瓦希里语 (肯尼亚)
ta-IN泰米尔语 (印度)
te-IN泰卢固语 (印度)
tg-TJ塔吉克语 (塔吉克斯坦)
tk-TM土库曼语 (土库曼斯坦)
tl-PH菲律宾语 (菲律宾)
tr-TR土耳其语 (土耳其)
tt-RU鞑靼语 (俄罗斯)
uk-UA乌克兰语 (乌克兰)
ur-PK乌尔都语 (巴基斯坦)
uz-UZ乌兹别克语 (乌兹别克斯坦)
vi-VN越南语 (越南)
yi-DE意第绪语 (德国)
yo-NG约鲁巴语 (尼日利亚)

提示:fil-PHtl-PH 都可用;如果是香港粤语内容,建议优先使用 zh-HK

请求示例

curl -X POST https://api.ai-mcn.tv:10000/task/asr \
  -H "Authorization: YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "file_id": "537489015178246",
    "language": "zh-CN",
    "word_level": true
  }'

成功响应示例

{
  "code": 200,
  "msg": "success",
  "data": {
    "task_id": "537489015178247",
    "task_type": "asr",
    "status": "queued"
  }
}

查询任务结果

基本信息

项目
请求方法GET
请求路径/task/asr/{task_id}
鉴权方式Authorization 请求头(直接传 API Key)

响应参数(output_result)

参数名类型说明
textstring完整识别文本
sentence_listarray句子级别时间戳列表
sentence_list[].textstring句子文本
sentence_list[].start_timenumber句子开始时间(秒)
sentence_list[].end_timenumber句子结束时间(秒)
word_listarray字级别时间戳列表(仅 word_level: true 时返回)
word_list[].textstring单字/词文本
word_list[].start_timenumber开始时间(秒)
word_list[].end_timenumber结束时间(秒)

成功响应示例

{
  "code": 200,
  "msg": "success",
  "data": {
    "task_id": "537489015178247",
    "status": "completed",
    "progress": 100,
    "output_result": {
      "text": "你好世界,这是一段测试语音。",
      "sentence_list": [
        {
          "text": "你好世界,这是一段测试语音。",
          "start_time": 0.0,
          "end_time": 3.5
        }
      ],
      "word_list": [
        {"text": "你", "start_time": 0.0, "end_time": 0.3},
        {"text": "好", "start_time": 0.3, "end_time": 0.6},
        {"text": "世", "start_time": 0.6, "end_time": 0.9},
        {"text": "界", "start_time": 0.9, "end_time": 1.2}
      ]
    },
    "create_time": "2026-04-05T08:00:00Z",
    "update_time": "2026-04-05T08:00:10Z"
  }
}

错误码

错误码HTTP 状态码说明解决方案
6013400file_id 缺失传入 file_id 参数
6015400不支持的语言代码使用上表中的受支持语言代码(如 zh-CNen-US
6004404文件不存在检查 file_id 是否正确
6502401鉴权失败检查 Authorization 请求头
6202402余额不足前往仪表盘充值