视频处理

同合云视频处理接口提供智能字幕、机械分镜、智能分镜、运镜分析、去黑边、比例转换、帧插值、超分辨率、视频稳像、去水印及蒸汽波滤镜等能力。

通用说明

所有视频处理接口均采用异步任务模式:

  1. 上传文件:调用 文件上传 接口获取 file_id
  2. 创建任务:调用对应处理接口(POST),传入 file_id 创建任务,获取 task_id
  3. 查询结果:通过查询接口(GET)轮询任务状态,status 变为 completed 时结果可用。

💡 提示:视频处理任务耗时通常较长,建议每隔 5-10 秒轮询一次。

接口列表

接口路径功能描述
智能字幕/task/video_ai_subtitle自动识别语音并生成字幕,支持翻译和多种字幕样式
视频机械分镜/task/video_segment基于画面变动率识别镜头边界,可返回分镜区间或切片文件
视频智能分镜/task/video_ai_segment基于多模态语义理解进行镜头切分与结构化归类
视频运镜分析/task/video_motion_cut检测视频中具有明显动作或运镜的高光区间,返回纯结构化结果
去除黑边/task/video_blackborder_remove自动检测并去除视频四周黑边
比例转换/task/video_canvas_adapt将视频转换为指定尺寸,支持片段截取
视频插帧/task/video_interpolateAI 帧插值,提升视频流畅度(最长 1 分钟)
去水印/task/video_purify去除视频中的水印、Logo 或字幕
视频稳像/task/video_stabilizer防抖处理,使画面更稳定
视频超分/task/video_upscaleAI 超分辨率放大,提升视频清晰度
蒸汽波滤镜/task/video_vaporwave为视频添加 Vaporwave 风格滤镜效果

支持的文件格式

视频处理接口支持:mp4movavimkvflvwebm 等常用格式。

注意事项

  • 视频插帧:当前实现会校验输出单边分辨率不能超过 4000 px
  • 视频机械分镜:默认仅返回结构化分镜结果;设置 only_struct=false 时会额外输出切片文件。
  • 视频智能分镜:支持 sceneshot_typenarrativesubject 四种模式,长视频会自动分片分析并合并结果。
  • 视频运镜分析:当前固定使用 OpenCVMotionCut 引擎,不开放模式选择,接口始终只返回结构化结果,不生成切片文件。
  • 视频去水印:支持 ffmpegraft 两种算法;其中 raft 为实验模式,仅支持 2 分钟以内 视频,且处理速度较慢。
  • 视频超分:当前实现仅支持 1 分钟以内的视频,且放大后的单边分辨率不能超过 4000 px

下一步