MedAsr シリーズ
説明
- モデルアーキテクチャ:Conformer ベース。Google Health が発表した医療シーン向け音声認識モデル
- 適用シーン:放射線科の口述、医師と患者の対話、医学文書の書き起こしなど、医療向けディクテーションタスクに適合
- 対応言語:英語のみ(主に米国英語)
- モデル特徴:約5000時間の医療音声データで事前学習され、医学専門用語の認識に強い。非標準的な薬品名や日時といった構造化データの認識にはばらつきがあるため、業務シーンに合わせた追加のファインチューニングを推奨

