Whisper 系列

说明

  1. 后缀带 -kv 代表启用 KV Cache 推理加速
  2. 全系模型支持标点、支持时间戳,默认输出段落级时间戳,可通过参数开启词级时间戳
  3. 语种范围:
    • 标准多语言版(tiny/small/medium/large-v1/large-v2):共支持 99 种语言(含中文、粤语、英语、日语、韩语、俄语、阿拉伯语、越南语、乌克兰语等全球主流语种)
    • large-v3 / large-v3-turbo 系列:在99种语言基础上扩充低资源语种,总计约 106 种,新增:祖鲁语(zu)、毛利语(mi)、斯瓦希里语(sw)、豪萨语(ha) 等,对应语种识别效果显著增强

whisper-tiny 模型

模型名称类型支持语种标点时间戳KV下载地址
whisper-tiny-onnx非流式99种多语言modelscope
whisper-tiny-onnx-kv非流式99种多语言modelscope
whisper-tiny-en-onnx非流式英语modelscope

whisper-small 模型

模型名称类型支持语种标点时间戳KV下载地址
whisper-small-onnx非流式99种多语言modelscope
whisper-small-en-onnx非流式英语modelscope
whisper-small-cantonese-onnx非流式粤语、中文、英语modelscope

whisper-medium 模型

模型名称类型支持语种标点时间戳KV下载地址
whisper-medium-onnx非流式99种多语言modelscope
whisper-medium-int8-onnx-kv非流式99种多语言modelscope
whisper-medium-en-onnx非流式英语modelscope
whisper-medium-yue-onnx-kv非流式粤语modelscope
whisper-medium-yue-int8-onnx-kv非流式粤语modelscope

whisper-large 模型

模型名称类型支持语种标点时间戳KV下载地址
whisper-large-v1-onnx非流式99种多语言modelscope
whisper-large-v2-onnx非流式99种多语言modelscope
whisper-large-v3-onnx非流式约106种多语言modelscope
whisper-large-v3-turbo-onnx非流式约106种多语言modelscope
whisper-large-v3-turbo-zh-onnx非流式中文modelscope
whisper-large-v3-turbo-zh-int8-onnx-kv-belle-20241016非流式中文modelscope

Distil-Whisper 模型

模型名称类型支持语种标点时间戳KV下载地址
distil-whisper-small-en-onnx非流式英语modelscope
distil-whisper-medium-en-onnx非流式英语modelscope
distil-whisper-large-v2-en-onnx非流式英语modelscope
distil-whisper-large-v3-en-onnx非流式英语modelscope
distil-whipser-large-v3.5-en-onnx非流式英语modelscope
distil-whisper-large-v2-multi-hans-onnx非流式中文(兼容99种多语言)modelscope
distil-whisper-small-cantonese-onnx-alvanlii-20240404非流式粤语、中文、英语modelscope