Whisper シリーズ
説明
- 末尾に
-kvが付くものは、KV Cache推論高速化を有効にしたバージョン- 全シリーズ句読点対応、タイムスタンプ対応。デフォルトで段落レベルのタイムスタンプを出力し、パラメータで単語レベルのタイムスタンプも有効化可能
- 言語範囲:
- 標準多言語版(tiny/small/medium/large-v1/large-v2):合計 99言語(中国語、広東語、英語、日本語、韓国語、ロシア語、アラビア語、ベトナム語、ウクライナ語など世界の主要言語を含む)
- large-v3 / large-v3-turbo シリーズ:99言語に加え低リソース言語を拡張し、合計約 106言語。新たに追加されたもの:ズールー語(zu)、マオリ語(mi)、スワヒリ語(sw)、ハウサ語(ha) など。言語識別効果が顕著に向上

