语音转文字(ASR)
将音频文件中的语音内容转换为文字,支持多语言识别,并可获取字级别或句子级别的时间戳信息。
创建任务
基本信息
| 项目 | 值 |
|---|
| 请求方法 | POST |
| 请求路径 | /task/asr |
| Content-Type | application/json |
| 鉴权方式 | Authorization 请求头(直接传 API Key) |
请求参数(Body)
| 参数名 | 类型 | 必填 | 默认值 | 说明 |
|---|
file_id | string | 是 | — | 已上传音频或视频文件的 ID |
language | string | 否 | "zh-CN" | 音频语言代码,传标准地区语言码,完整列表见下方“支持的语言代码” |
word_level | boolean | 否 | false | 是否返回字级别时间戳(开启后响应数据更详细) |
支持的语言代码
language 参数应传标准地区语言码。当前实现共支持 101 个可传入值:
请求 language | 语言名称 |
|---|
zh-CN | 中文 (中国) |
en-US | 英语 (美国) |
ja-JP | 日语 (日本) |
ko-KR | 韩语 (韩国) |
fr-FR | 法语 (法国) |
de-DE | 德语 (德国) |
es-MX | 西班牙语 (墨西哥) |
pt-BR | 葡萄牙语 (巴西) |
ru-RU | 俄语 (俄罗斯) |
zh-HK | 中文 (中国香港特别行政区) |
id-ID | 印度尼西亚语 (印度尼西亚) |
fil-PH | 菲律宾语 (菲律宾) |
ms-MY | 马来语 (马来西亚) |
th-TH | 泰语 (泰国) |
ar-SA | 阿拉伯语 (沙特阿拉伯) |
af-ZA | 南非荷兰语 (南非) |
am-ET | 阿姆哈拉语 (埃塞俄比亚) |
as-IN | 阿萨姆语 (印度) |
az-AZ | 阿塞拜疆语 (阿塞拜疆) |
ba-RU | 巴什基尔语 (俄罗斯) |
be-BY | 白俄罗斯语 (白俄罗斯) |
bg-BG | 保加利亚语 (保加利亚) |
bn-IN | 孟加拉语 (印度) |
bo-CN | 藏语 (中国) |
br-FR | 布列塔尼语 (法国) |
bs-BA | 波斯尼亚语 (波斯尼亚和黑塞哥维那) |
ca-ES | 加泰罗尼亚语 (西班牙) |
cs-CZ | 捷克语 (捷克) |
cy-GB | 威尔士语 (英国) |
da-DK | 丹麦语 (丹麦) |
el-GR | 希腊语 (希腊) |
et-EE | 爱沙尼亚语 (爱沙尼亚) |
eu-ES | 巴斯克语 (西班牙) |
fa-IR | 波斯语 (伊朗) |
fi-FI | 芬兰语 (芬兰) |
fo-FO | 法罗语 (法罗群岛) |
gl-ES | 加利西亚语 (西班牙) |
gu-IN | 古吉拉特语 (印度) |
ha-NG | 豪萨语 (尼日利亚) |
haw-US | 夏威夷语 (美国) |
he-IL | 希伯来语 (以色列) |
hi-IN | 印地语 (印度) |
hr-HR | 克罗地亚语 (克罗地亚) |
ht-HT | 海地克里奥尔语 (海地) |
hu-HU | 匈牙利语 (匈牙利) |
hy-AM | 亚美尼亚语 (亚美尼亚) |
is-IS | 冰岛语 (冰岛) |
it-IT | 意大利语 (意大利) |
jw-ID | 爪哇语 (印度尼西亚) |
ka-GE | 格鲁吉亚语 (格鲁吉亚) |
kk-KZ | 哈萨克语 (哈萨克斯坦) |
km-KH | 高棉语 (柬埔寨) |
kn-IN | 卡纳达语 (印度) |
la-VA | 拉丁语 (梵蒂冈) |
lb-LU | 卢森堡语 (卢森堡) |
ln-CD | 林加拉语 (刚果(金)) |
lo-LA | 老挝语 (老挝) |
lt-LT | 立陶宛语 (立陶宛) |
lv-LV | 拉脱维亚语 (拉脱维亚) |
mg-MG | 马拉加斯语 (马达加斯加) |
mi-NZ | 毛利语 (新西兰) |
mk-MK | 马其顿语 (北马其顿) |
ml-IN | 马拉雅拉姆语 (印度) |
mn-MN | 蒙古语 (蒙古) |
mr-IN | 马拉地语 (印度) |
mt-MT | 马耳他语 (马耳他) |
my-MM | 缅甸语 (缅甸) |
ne-NP | 尼泊尔语 (尼泊尔) |
nl-NL | 荷兰语 (荷兰) |
nn-NO | 挪威尼诺斯克语 (挪威) |
no-NO | 挪威语 (挪威) |
oc-FR | 奥克语 (法国) |
pa-IN | 旁遮普语 (印度) |
pl-PL | 波兰语 (波兰) |
ps-AF | 普什图语 (阿富汗) |
ro-RO | 罗马尼亚语 (罗马尼亚) |
sa-IN | 梵语 (印度) |
sd-IN | 信德语 (印度) |
si-LK | 僧伽罗语 (斯里兰卡) |
sk-SK | 斯洛伐克语 (斯洛伐克) |
sl-SI | 斯洛文尼亚语 (斯洛文尼亚) |
sn-ZW | 绍纳语 (津巴布韦) |
so-SO | 索马里语 (索马里) |
sq-AL | 阿尔巴尼亚语 (阿尔巴尼亚) |
sr-RS | 塞尔维亚语 (塞尔维亚) |
su-ID | 巽他语 (印度尼西亚) |
sv-SE | 瑞典语 (瑞典) |
sw-KE | 斯瓦希里语 (肯尼亚) |
ta-IN | 泰米尔语 (印度) |
te-IN | 泰卢固语 (印度) |
tg-TJ | 塔吉克语 (塔吉克斯坦) |
tk-TM | 土库曼语 (土库曼斯坦) |
tl-PH | 菲律宾语 (菲律宾) |
tr-TR | 土耳其语 (土耳其) |
tt-RU | 鞑靼语 (俄罗斯) |
uk-UA | 乌克兰语 (乌克兰) |
ur-PK | 乌尔都语 (巴基斯坦) |
uz-UZ | 乌兹别克语 (乌兹别克斯坦) |
vi-VN | 越南语 (越南) |
yi-DE | 意第绪语 (德国) |
yo-NG | 约鲁巴语 (尼日利亚) |
提示:fil-PH 与 tl-PH 都可用;如果是香港粤语内容,建议优先使用 zh-HK。
请求示例
curl -X POST https://api.ai-mcn.tv:10000/task/asr \
-H "Authorization: YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"file_id": "537489015178246",
"language": "zh-CN",
"word_level": true
}'
成功响应示例
{
"code": 200,
"msg": "success",
"data": {
"task_id": "537489015178247",
"task_type": "asr",
"status": "queued"
}
}
查询任务结果
基本信息
| 项目 | 值 |
|---|
| 请求方法 | GET |
| 请求路径 | /task/asr/{task_id} |
| 鉴权方式 | Authorization 请求头(直接传 API Key) |
响应参数(output_result)
| 参数名 | 类型 | 说明 |
|---|
text | string | 完整识别文本 |
sentence_list | array | 句子级别时间戳列表 |
sentence_list[].text | string | 句子文本 |
sentence_list[].start_time | number | 句子开始时间(秒) |
sentence_list[].end_time | number | 句子结束时间(秒) |
word_list | array | 字级别时间戳列表(仅 word_level: true 时返回) |
word_list[].text | string | 单字/词文本 |
word_list[].start_time | number | 开始时间(秒) |
word_list[].end_time | number | 结束时间(秒) |
成功响应示例
{
"code": 200,
"msg": "success",
"data": {
"task_id": "537489015178247",
"status": "completed",
"progress": 100,
"output_result": {
"text": "你好世界,这是一段测试语音。",
"sentence_list": [
{
"text": "你好世界,这是一段测试语音。",
"start_time": 0.0,
"end_time": 3.5
}
],
"word_list": [
{"text": "你", "start_time": 0.0, "end_time": 0.3},
{"text": "好", "start_time": 0.3, "end_time": 0.6},
{"text": "世", "start_time": 0.6, "end_time": 0.9},
{"text": "界", "start_time": 0.9, "end_time": 1.2}
]
},
"create_time": "2026-04-05T08:00:00Z",
"update_time": "2026-04-05T08:00:10Z"
}
}
错误码
| 错误码 | HTTP 状态码 | 说明 | 解决方案 |
|---|
6013 | 400 | file_id 缺失 | 传入 file_id 参数 |
6015 | 400 | 不支持的语言代码 | 使用上表中的受支持语言代码(如 zh-CN、en-US) |
6004 | 404 | 文件不存在 | 检查 file_id 是否正确 |
6502 | 401 | 鉴权失败 | 检查 Authorization 请求头 |
6202 | 402 | 余额不足 | 前往仪表盘充值 |