ASR モデル

DolphinAsr シリーズ

説明

License: Apache 2.0
opt：最適化バージョン。オーディオ特徴抽出モジュールをモデルから分離し、推論オーバーヘッドを低減
完全対応言語および地域コード対応表：

zh-CN: 中国語(普通話)，zh-TW: 中国語(台湾)，zh-WU: 中国語(呉語)，zh-SICHUAN: 中国語(四川話)，zh-SHANXI: 中国語(山西話)，zh-ANHUI: 中国語(安徽話)，zh-TIANJIN: 中国語(天津話)，zh-NINGXIA: 中国語(寧夏話)，zh-SHAANXI: 中国語(陝西話)，zh-HEBEI: 中国語(河北話)，zh-SHANDONG: 中国語(山東話)，zh-GUANGDONG: 中国語(広東話)，zh-SHANGHAI: 中国語(上海話)，zh-HUBEI: 中国語(湖北話)，zh-LIAONING: 中国語(遼寧話)，zh-GANSU: 中国語(甘粛話)，zh-FUJIAN: 中国語(福建話)，zh-HUNAN: 中国語(湖南話)，zh-HENAN: 中国語(河南話)，zh-YUNNAN: 中国語(雲南話)，zh-MINNAN: 中国語(閩南語)，zh-WENZHOU: 中国語(温州話)
ja-JP: 日本語，th-TH: タイ語，ru-RU: ロシア語，ko-KR: 韓国語，id-ID: インドネシア語，vi-VN: ベトナム語
ct-NULL: 広東語，ct-HK: 広東語(香港)，ct-GZ: 広東語(広東)
hi-IN: ヒンディー語，ur-IN: ウルドゥー語(インド)，ur-PK: ウルドゥー語，ms-MY: マレー語，uz-UZ: ウズベク語
ar-MA: アラビア語(モロッコ)，ar-GLA: アラビア語，ar-SA: アラビア語(サウジアラビア)，ar-EG: アラビア語(エジプト)，ar-KW: アラビア語(クウェート)，ar-LY: アラビア語(リビア)，ar-JO: アラビア語(ヨルダン)，ar-AE: アラビア語(アラブ首長国連邦)，ar-LVT: アラビア語(レバント)
fa-IR: ペルシア語，bn-BD: ベンガル語
ta-SG: タミル語(シンガポール)，ta-LK: タミル語(スリランカ)，ta-IN: タミル語(インド)，ta-MY: タミル語(マレーシア)
te-IN: テルグ語，ug-NULL: ウイグル語，ug-CN: ウイグル語，gu-IN: グジャラート語
my-MM: ビルマ語，tl-PH: タガログ語，kk-KZ: カザフ語，or-IN: オリヤー語，ne-NP: ネパール語
mn-MN: モンゴル語，km-KH: クメール語，jv-ID: ジャワ語，lo-LA: ラオ語，si-LK: シンハラ語
fil-PH: フィリピノ語，ps-AF: パシュトー語，pa-IN: パンジャブ語，kab-NULL: カビル語
ba-NULL: バシキール語，ks-IN: カシミール語，tg-TJ: タジク語，su-ID: スンダ語
mr-IN: マラーティー語，ky-KG: キルギス語，az-AZ: アゼルバイジャン語

DolphinAsr-base モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
DolphinAsr-base-onnx	非ストリーミング	多言語	なし	あり	modelscope
DolphinAsr-base-int8-onnx	非ストリーミング	多言語	なし	あり	modelscope
DolphinAsr-base-onnx-opt	非ストリーミング	多言語	なし	あり	modelscope
DolphinAsr-base-int8-onnx-opt	非ストリーミング	多言語	なし	あり	modelscope

DolphinAsr-small モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
DolphinAsr-small-onnx	非ストリーミング	多言語	なし	あり	modelscope
DolphinAsr-small-int8-onnx	非ストリーミング	多言語	なし	あり	modelscope
DolphinAsr-small-onnx-opt	非ストリーミング	多言語	なし	あり	modelscope
DolphinAsr-small-int8-onnx-opt	非ストリーミング	多言語	なし	あり	modelscope

FireRedAsr シリーズ

FireRedAsr-AED 中英モデル（v1）

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
fireredasr-aed-large-zh-en-onnx-offline-20250124	非ストリーミング	中国語、英語	なし	なし	modelscope

FireRedAsr2-AED 中英モデル（v2）

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
fireredasr2-aed-large-zh-en-onnx-offline-20260212	非ストリーミング	中国語、英語	なし	あり	modelscope
fireredasr2-aed-large-zh-en-int8-onnx-offline-20260212	非ストリーミング	中国語、英語	なし	あり	modelscope
fireredasr2-aed-large-zh-en-onnx-selfcrosskv-offline-20260212	非ストリーミング	中国語、英語	なし	あり	modelscope
fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskv-offline-20260212	非ストリーミング	中国語、英語	なし	あり	modelscope
fireredasr2-aed-large-zh-en-int8-onnx-selfcrosskvstack-offline-20260212	非ストリーミング	中国語、英語	なし	あり	modelscope

Fun-ASR シリーズ

説明

モデル背景：通義実験室が発表したエンドツーエンド音声認識大モデル。数千万時間の実音声データで事前学習され、強力な文脈理解と業界適応能力を持つ

機能特性：全シリーズ非ストリーミング、句読点対応、タイムスタンプ対応。低遅延リアルタイム書き起こしをサポートし、遠距離・高騒音環境での認識精度は93%に達する

バージョン識別子の説明：

int8：INT8量子化バージョン。サイズが小さく、推論速度が高速で、エッジ展開に適する

LLM：大モデル強化版。文脈理解がより強力で、認識幻覚を抑制

CTC：古典的なCTCアーキテクチャの軽量版。推論が軽量

MLT：多言語汎用版。31言語をカバー

split-adaptor：特徴適応モジュールを分離して展開するバージョン

言語と能力の説明：

Fun-ASR-Nano：中国語、英語、日本語に対応。7つの方言（呉語、広東語、閩語、客家語、贛語、湘語、晋語）。26の地方訛り（河南、山西、湖北、四川、重慶、雲南、貴州、広東、広西、陝西、河北、山東、安徽、天津、寧夏、遼寧、甘粛、湖南、黒竜江、吉林、内モンゴル、江蘇、浙江、福建、江西、海南）。歌詞認識、ラップ音声認識もサポート

Fun-ASR-MLT-Nano：合計31言語に対応：中国語、英語、広東語、日本語、韓国語、ベトナム語、インドネシア語、タイ語、マレー語、フィリピノ語、アラビア語、ヒンディー語、ブルガリア語、クロアチア語、チェコ語、デンマーク語、オランダ語、エストニア語、フィンランド語、ギリシャ語、ハンガリー語、アイルランド語、ラトビア語、リトアニア語、マルタ語、ポーランド語、ポルトガル語、ルーマニア語、スロバキア語、スロベニア語、スウェーデン語

業界優位性：教育、金融などの垂直領域で優れた性能を発揮し、専門用語を正確に認識し、幻覚生成や言語混同の問題を効果的に抑制

Fun-ASR-Nano モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
Fun-ASR-Nano-2512-LLM-onnx	非ストリーミング	中・英・日、7方言+26地方訛り、歌詞/ラップ認識を含む	あり	あり	modelscope
Fun-ASR-Nano-2512-LLM-int8-onnx	非ストリーミング	同上	あり	あり	modelscope
Fun-ASR-Nano-2512-LLM-split-adaptor-onnx	非ストリーミング	同上	あり	あり	modelscope
Fun-ASR-Nano-2512-LLM-split-adaptor-int8-onnx	非ストリーミング	同上	あり	あり	modelscope
Fun-ASR-Nano-2512-CTC-onnx	非ストリーミング	同上	あり	あり	modelscope
Fun-ASR-Nano-2512-CTC-int8-onnx	非ストリーミング	同上	あり	あり	modelscope

Fun-ASR-MLT-Nano モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
Fun-ASR-MLT-Nano-2512-onnx	非ストリーミング	31言語の多言語	あり	あり	modelscope
Fun-ASR-MLT-Nano-2512-int8-onnx	非ストリーミング	31言語の多言語	あり	あり	modelscope

FunASR シリーズ

Paraformer 中英モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
paraformer-large-zh-en-onnx-offline	非ストリーミング	中国語(zh), 英語(en)	なし	なし	huggingface, modelscope
paraformer-large-zh-en-timestamp-onnx-offline	非ストリーミング	中国語、英語	なし	あり	modelscope
paraformer-large-en-onnx-offline	非ストリーミング	英語	なし	なし	modelscope
paraformer-large-zh-en-onnx-online	ストリーミング	中国語、英語	なし	なし	modelscope

Paraformer 粤/中英多言語モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
paraformer-large-zh-yue-en-timestamp-onnx-offline-dengcunqin-20240805	非ストリーミング	中、広東語、英	なし	あり	modelscope
paraformer-large-zh-yue-en-onnx-offline-dengcunqin-20240805	非ストリーミング	中、広東語、英	なし	なし	modelscope
paraformer-large-zh-yue-en-onnx-online-dengcunqin-20240208	ストリーミング	中、広東語、英	なし	なし	modelscope

SeACo-Paraformer ホットワードカスタマイズモデル

SeACoParaformerは、アリババ音声実験室が提案した次世代のホットワードカスタマイズ非自己回帰音声認識モデルです。従来のCLASベースのホットワードカスタマイズ方式と比較して、ホットワードモジュールとASRモデルを分離し、事後確率融合によりホットワードを促進することで、促進プロセスを可視化・制御可能にし、ホットワードの再現率を大幅に向上させています。

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
paraformer-seaco-large-zh-timestamp-onnx-offline	非ストリーミング	中国語、ホットワードカスタマイズ対応	なし	あり	modelscope

SenseVoice モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
sensevoice-small-onnx	非ストリーミング	中、広東語、英、日、韓	あり	なし	modelscope
sensevoice-small-int8-onnx	非ストリーミング	中、広東語、英、日、韓	あり	なし	modelscope
sensevoice-small-wenetspeech-yue-onnx	非ストリーミング	広東語、中、英、日、韓	あり	なし	modelscope
sensevoice-small-wenetspeech-yue-int8-onnx	非ストリーミング	広東語、中、英、日、韓	あり	なし	modelscope
sensevoice-small-split-embed-onnx	非ストリーミング	中、広東語、英、日、韓	あり	なし	modelscope

K2TransducerAsr シリーズ

ストリーミングモデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
k2transducer-lstm-en-onnx-online-csukuangfj-20220903	ストリーミング	英語	なし	なし	modelscope
k2transducer-lstm-zh-onnx-online-csukuangfj-20221014	ストリーミング	中国語	なし	なし	modelscope
k2transducer-zipformer-en-onnx-online-weijizhuang-20221202	ストリーミング	英語	なし	なし	modelscope
k2transducer-zipformer-en-onnx-online-zengwei-20230517	ストリーミング	英語	なし	なし	modelscope
k2transducer-zipformer-multi-zh-hans-onnx-online-20231212	ストリーミング	中国語	なし	なし	modelscope
k2transducer-zipformer-ko-onnx-online-johnbamma-20240612	ストリーミング	韓国語	なし	なし	modelscope
k2transducer-zipformer-ctc-small-zh-onnx-online-20250401	ストリーミング	中国語	なし	なし	modelscope
k2transducer-zipformer-large-zh-onnx-online-yuekai-20250630	ストリーミング	中国語	なし	なし	modelscope
k2transducer-zipformer-xlarge-zh-onnx-online-yuekai-20250630	ストリーミング	中国語	なし	なし	modelscope
k2transducer-zipformer-ctc-large-zh-onnx-online-yuekai-20250630	ストリーミング	中国語	なし	なし	modelscope
k2transducer-zipformer-ctc-xlarge-zh-onnx-online-yuekai-20250630	ストリーミング	中国語	なし	なし	modelscope

非ストリーミングモデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
k2transducer-conformer-en-onnx-offline-csukuangfj-20220513	非ストリーミング	英語	なし	なし	modelscope
k2transducer-conformer-zh-onnx-offline-luomingshuang-20220727	非ストリーミング	中国語	なし	なし	modelscope
k2transducer-zipformer-en-onnx-offline-yfyeung-20230417	非ストリーミング	英語	なし	なし	modelscope
k2transducer-zipformer-large-en-onnx-offline-zengwei-20230516	非ストリーミング	英語	なし	なし	modelscope
k2transducer-zipformer-small-en-onnx-offline-zengwei-20230516	非ストリーミング	英語	なし	なし	modelscope
k2transducer-zipformer-zh-onnx-offline-wenetspeech-20230615	非ストリーミング	中国語	なし	なし	modelscope
k2transducer-zipformer-zh-onnx-offline-multi-zh-hans-20230902	非ストリーミング	中国語	なし	なし	modelscope
k2transducer-zipformer-zh-en-onnx-offline-20231122	非ストリーミング	中英語	なし	なし	modelscope
k2transducer-zipformer-cantonese-onnx-offline-20240313	非ストリーミング	広東語	なし	なし	modelscope
k2transducer-zipformer-th-onnx-offline-yfyeung-20240620	非ストリーミング	タイ語	なし	なし	modelscope
k2transducer-zipformer-ja-onnx-offline-reazonspeech-20240801	非ストリーミング	日本語	なし	なし	modelscope
k2transducer-zipformer-ru-onnx-offline-20240918	非ストリーミング	ロシア語	なし	なし	modelscope
k2transducer-zipformer-vi-onnx-offline-20250420	非ストリーミング	ベトナム語	なし	なし	modelscope
k2transducer-zipformer-ctc-zh-onnx-offline-20250703	非ストリーミング	中国語	なし	なし	modelscope github
k2transducer-zipformer-ctc-small-zh-onnx-offline-20250716	非ストリーミング	中国語	なし	なし	modelscope

MedAsr シリーズ

説明

モデルアーキテクチャ：Conformer ベース。Google Health が発表した医療シーン向け音声認識モデル

適用シーン：放射線科の口述、医師と患者の対話、医学文書の書き起こしなど、医療向けディクテーションタスクに適合

対応言語：英語のみ（主に米国英語）

モデル特徴：約5000時間の医療音声データで事前学習され、医学専門用語の認識に強い。非標準的な薬品名や日時といった構造化データの認識にはばらつきがあるため、業務シーンに合わせた追加のファインチューニングを推奨

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
medasr-onnx	非ストリーミング	英語	なし	なし	modelscope

moonshine シリーズ

moonshine-tiny モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
moonshine-tiny-onnx	非ストリーミング	英語	あり	なし	modelscope
moonshine-tiny-int8-onnx	非ストリーミング	英語	あり	なし	modelscope
moonshine-tiny-en-onnx	非ストリーミング	英語	あり	なし	modelscope
moonshine-tiny-zh-onnx	非ストリーミング	中国語	あり	なし	modelscope
moonshine-tiny-zh-int8-onnx	非ストリーミング	中国語	あり	なし	modelscope
moonshine-tiny-vi-onnx	非ストリーミング	ベトナム語	あり	なし	modelscope
moonshine-tiny-vi-int8-onnx	非ストリーミング	ベトナム語	あり	なし	modelscope
moonshine-tiny-uk-onnx	非ストリーミング	ウクライナ語	あり	なし	modelscope
moonshine-tiny-uk-int8-onnx	非ストリーミング	ウクライナ語	あり	なし	modelscope
moonshine-tiny-ko-onnx	非ストリーミング	韓国語	あり	なし	modelscope
moonshine-tiny-ko-int8-onnx	非ストリーミング	韓国語	あり	なし	modelscope
moonshine-tiny-ja-onnx	非ストリーミング	日本語	あり	なし	modelscope
moonshine-tiny-ja-int8-onnx	非ストリーミング	日本語	あり	なし	modelscope
moonshine-tiny-ar-onnx	非ストリーミング	アラビア語	あり	なし	modelscope
moonshine-tiny-ar-int8-onnx	非ストリーミング	アラビア語	あり	なし	modelscope
moonshine-tiny-fr-onnx	非ストリーミング	フランス語	あり	なし	modelscope
moonshine-tiny-fr-int8-onnx	非ストリーミング	フランス語	あり	なし	modelscope

moonshine-base モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
moonshine-base-onnx	非ストリーミング	英語	あり	なし	modelscope
moonshine-base-int8-onnx	非ストリーミング	英語	あり	なし	modelscope
moonshine-base-en-onnx	非ストリーミング	英語	あり	なし	modelscope
moonshine-base-zh-onnx	非ストリーミング	中国語	あり	なし	modelscope
moonshine-base-zh-int8-onnx	非ストリーミング	中国語	あり	なし	modelscope
moonshine-base-vi-onnx	非ストリーミング	ベトナム語	あり	なし	modelscope
moonshine-base-vi-int8-onnx	非ストリーミング	ベトナム語	あり	なし	modelscope
moonshine-base-uk-onnx	非ストリーミング	ウクライナ語	あり	なし	modelscope
moonshine-base-uk-int8-onnx	非ストリーミング	ウクライナ語	あり	なし	modelscope
moonshine-base-ko-onnx	非ストリーミング	韓国語	あり	なし	modelscope
moonshine-base-ko-int8-onnx	非ストリーミング	韓国語	あり	なし	modelscope
moonshine-base-ja-onnx	非ストリーミング	日本語	あり	なし	modelscope
moonshine-base-ja-int8-onnx	非ストリーミング	日本語	あり	なし	modelscope
moonshine-base-ar-onnx	非ストリーミング	アラビア語	あり	なし	modelscope
moonshine-base-ar-int8-onnx	非ストリーミング	アラビア語	あり	なし	modelscope

WeNet シリーズ

ストリーミングモデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
wenet-u2pp-conformer-aishell-onnx-online-20210601	ストリーミング	中国語	なし	なし	modelscope
wenet-u2pp-conformer-wenetspeech-onnx-online-20220506	ストリーミング	中国語	なし	なし	modelscope
wenet-u2pp-conformer-wenetspeech-int8-onnx-online-20220506	ストリーミング	中国語	なし	なし	modelscope
wenet-u2pp-conformer-gigaspeech-onnx-online-20210728	ストリーミング	英語	なし	なし	modelscope

非ストリーミングモデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
wenet-u2pp-conformer-aishell-onnx-offline-20210601	非ストリーミング	中国語	なし	なし	modelscope
wenet-u2pp-conformer-wenetspeech-onnx-offline-20220506	非ストリーミング	中国語	なし	なし	modelscope
wenet-u2pp-conformer-wenetspeech-int8-onnx-offline-20220506	非ストリーミング	中国語	なし	なし	modelscope
wenet-u2pp-conformer-gigaspeech-onnx-offline-20210728	非ストリーミング	英語	なし	なし	modelscope

Whisper シリーズ

説明

末尾に -kv が付くものは、KV Cache推論高速化を有効にしたバージョン
全シリーズ句読点対応、タイムスタンプ対応。デフォルトで段落レベルのタイムスタンプを出力し、パラメータで単語レベルのタイムスタンプも有効化可能
言語範囲：
- 標準多言語版（tiny/small/medium/large-v1/large-v2）：合計 99言語（中国語、広東語、英語、日本語、韓国語、ロシア語、アラビア語、ベトナム語、ウクライナ語など世界の主要言語を含む）
- large-v3 / large-v3-turbo シリーズ：99言語に加え低リソース言語を拡張し、合計約 106言語。新たに追加されたもの：ズールー語（zu）、マオリ語（mi）、スワヒリ語（sw）、ハウサ語（ha） など。言語識別効果が顕著に向上
- 完全な言語一覧とコード：

af(アフリカーンス語), am(アムハラ語), ar(アラビア語), as(アッサム語), az(アゼルバイジャン語), 
ba(バシキール語), be(ベラルーシ語), bg(ブルガリア語), bn(ベンガル語), bo(チベット語), br(ブルトン語), bs(ボスニア語), 
ca(カタルーニャ語), cs(チェコ語), cy(ウェールズ語), 
da(デンマーク語), de(ドイツ語), 
el(ギリシャ語), en(英語), es(スペイン語), et(エストニア語), eu(バスク語), 
fa(ペルシア語), fi(フィンランド語), fo(フェロー語), fr(フランス語), 
ga(アイルランド語), gl(ガリシア語), gu(グジャラート語), 
ha(ハウサ語), haw(ハワイ語), he(ヘブライ語), hi(ヒンディー語), hr(クロアチア語), hu(ハンガリー語), hy(アルメニア語), 
id(インドネシア語), ig(イボ語), is(アイスランド語), it(イタリア語), 
ja(日本語), jv(ジャワ語), 
ka(グルジア語), kk(カザフ語), km(クメール語), kn(カンナダ語), ko(韓国語), ku(クルド語), ky(キルギス語), 
la(ラテン語), lb(ルクセンブルク語), lg(ガンダ語), lt(リトアニア語), lv(ラトビア語), 
mai(マイティリー語), mg(マダガスカル語), mi(マオリ語), mk(マケドニア語), ml(マラヤーラム語), mn(モンゴル語), mr(マラーティー語), ms(マレー語), mt(マルタ語), my(ビルマ語), 
ne(ネパール語), nl(オランダ語), no(ノルウェー語), nso(北ソト語), ny(ニャンジャ語), 
oc(オック語), om(オロモ語), or(オリヤー語), 
pa(パンジャブ語), pl(ポーランド語), ps(パシュトー語), pt(ポルトガル語), 
ro(ルーマニア語), ru(ロシア語), rw(ルワンダ語), 
sa(サンスクリット語), sd(シンド語), si(シンハラ語), sk(スロバキア語), sl(スロベニア語), sm(サモア語), sn(ショナ語), so(ソマリ語), sq(アルバニア語), sr(セルビア語), ss(スワジ語), st(南ソト語), su(スンダ語), sv(スウェーデン語), sw(スワヒリ語), 
ta(タミル語), te(テルグ語), tg(タジク語), th(タイ語), ti(ティグリニア語), tk(トルクメン語), tl(タガログ語), tn(ツワナ語), to(トンガ語), tr(トルコ語), ts(ツォンガ語), tt(タタール語), tw(トウィ語), 
ug(ウイグル語), uk(ウクライナ語), ur(ウルドゥー語), uz(ウズベク語), 
ve(ベンダ語), vi(ベトナム語), vo(ヴォラピュク語), 
wa(ワロン語), wo(ウォロフ語), 
xh(コサ語), 
yi(イディッシュ語), yo(ヨルバ語), 
zh(中国語), yue(広東語), zu(ズールー語)

言語コード省略形：

af, am, ar, as, az,
ba, be, bg, bn, bo, br, bs,
ca, cs, cy,
da, de, el, en, es, et, eu,
fa, fi, fo, fr, ga, gl, gu,
ha, haw, he, hi, hr, hu, hy,
id, ig, is, it,
ja, jv,
ka, kk, km, kn, ko, ku, ky,
la, lb, lg, lt, lv,
mai, mg, mi, mk, ml, mn, mr, ms, mt, my,
ne, nl, no, nso, ny,
oc, om, or,
pa, pl, ps, pt,
ro, ru, rw,
sa, sd, si, sk, sl, sm, sn, so, sq, sr, ss, st, su, sv, sw,
ta, te, tg, th, ti, tk, tl, tn, to, tr, ts, tt, tw,
ug, uk, ur, uz,
ve, vi, vo,
wa, wo, xh,
yi, yo,
zh, yue, zu

whisper-tiny モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	KV	ダウンロード先
whisper-tiny-onnx	非ストリーミング	99言語の多言語	あり	あり	なし	modelscope
whisper-tiny-onnx-kv	非ストリーミング	99言語の多言語	あり	あり	あり	modelscope
whisper-tiny-en-onnx	非ストリーミング	英語	あり	あり	なし	modelscope

whisper-small モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	KV	ダウンロード先
whisper-small-onnx	非ストリーミング	99言語の多言語	あり	あり	なし	modelscope
whisper-small-en-onnx	非ストリーミング	英語	あり	あり	なし	modelscope
whisper-small-cantonese-onnx	非ストリーミング	広東語、中国語、英語	あり	あり	なし	modelscope

whisper-medium モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	KV	ダウンロード先
whisper-medium-onnx	非ストリーミング	99言語の多言語	あり	あり	なし	modelscope
whisper-medium-int8-onnx-kv	非ストリーミング	99言語の多言語	あり	あり	あり	modelscope
whisper-medium-en-onnx	非ストリーミング	英語	あり	あり	なし	modelscope
whisper-medium-yue-onnx-kv	非ストリーミング	広東語	あり	あり	あり	modelscope
whisper-medium-yue-int8-onnx-kv	非ストリーミング	広東語	あり	あり	あり	modelscope

whisper-large モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	KV	ダウンロード先
whisper-large-v1-onnx	非ストリーミング	99言語の多言語	あり	あり	なし	modelscope
whisper-large-v2-onnx	非ストリーミング	99言語の多言語	あり	あり	なし	modelscope
whisper-large-v3-onnx	非ストリーミング	約106言語の多言語	あり	あり	なし	modelscope
whisper-large-v3-turbo-onnx	非ストリーミング	約106言語の多言語	あり	あり	なし	modelscope
whisper-large-v3-turbo-zh-onnx	非ストリーミング	中国語	あり	あり	なし	modelscope
whisper-large-v3-turbo-zh-int8-onnx-kv-belle-20241016	非ストリーミング	中国語	あり	あり	あり	modelscope

Distil-Whisper モデル

モデル名	タイプ	対応言語	句読点	タイムスタンプ	KV	ダウンロード先
distil-whisper-small-en-onnx	非ストリーミング	英語	あり	あり	なし	modelscope
distil-whisper-medium-en-onnx	非ストリーミング	英語	あり	あり	なし	modelscope
distil-whisper-large-v2-en-onnx	非ストリーミング	英語	あり	あり	なし	modelscope
distil-whisper-large-v3-en-onnx	非ストリーミング	英語	あり	あり	なし	modelscope
distil-whipser-large-v3.5-en-onnx	非ストリーミング	英語	あり	あり	なし	modelscope
distil-whisper-large-v2-multi-hans-onnx	非ストリーミング	中国語（99言語の多言語互換）	あり	あり	なし	modelscope
distil-whisper-small-cantonese-onnx-alvanlii-20240404	非ストリーミング	広東語、中国語、英語	あり	あり	なし	modelscope

共通説明

int8 = 量子化版。サイズが小さく、速度が高速

kv / selfcrosskv / selfcrosskvstack / opt = 推論最適化バージョン

一部のモデルは HuggingFace または GitHub のソースを提供しています。各表を参照してください

#ASR モデル

#DolphinAsr シリーズ

#DolphinAsr-base モデル

#DolphinAsr-small モデル

#FireRedAsr シリーズ

#FireRedAsr-AED 中英モデル（v1）

#FireRedAsr2-AED 中英モデル（v2）

#Fun-ASR シリーズ

#Fun-ASR-Nano モデル

#Fun-ASR-MLT-Nano モデル

#FunASR シリーズ

#Paraformer 中英モデル

#Paraformer 粤/中英多言語モデル

#SeACo-Paraformer ホットワードカスタマイズモデル

#SenseVoice モデル

#K2TransducerAsr シリーズ

#ストリーミングモデル

#非ストリーミングモデル

#MedAsr シリーズ

#moonshine シリーズ

#moonshine-tiny モデル

#moonshine-base モデル

#WeNet シリーズ

#ストリーミングモデル

#非ストリーミングモデル

#Whisper シリーズ

#whisper-tiny モデル

#whisper-small モデル

#whisper-medium モデル

#whisper-large モデル

#Distil-Whisper モデル

ASR モデル

DolphinAsr シリーズ

DolphinAsr-base モデル

DolphinAsr-small モデル

FireRedAsr シリーズ

FireRedAsr-AED 中英モデル（v1）

FireRedAsr2-AED 中英モデル（v2）

Fun-ASR シリーズ

Fun-ASR-Nano モデル

Fun-ASR-MLT-Nano モデル

FunASR シリーズ

Paraformer 中英モデル

Paraformer 粤/中英多言語モデル

SeACo-Paraformer ホットワードカスタマイズモデル

SenseVoice モデル

K2TransducerAsr シリーズ

ストリーミングモデル

非ストリーミングモデル

MedAsr シリーズ

moonshine シリーズ

moonshine-tiny モデル

moonshine-base モデル

WeNet シリーズ

ストリーミングモデル

非ストリーミングモデル

Whisper シリーズ

whisper-tiny モデル

whisper-small モデル

whisper-medium モデル

whisper-large モデル

Distil-Whisper モデル