MedAsr シリーズ

説明

モデルアーキテクチャ：Conformer ベース。Google Health が発表した医療シーン向け音声認識モデル

適用シーン：放射線科の口述、医師と患者の対話、医学文書の書き起こしなど、医療向けディクテーションタスクに適合

対応言語：英語のみ（主に米国英語）

モデル特徴：約5000時間の医療音声データで事前学習され、医学専門用語の認識に強い。非標準的な薬品名や日時といった構造化データの認識にはばらつきがあるため、業務シーンに合わせた追加のファインチューニングを推奨

モデル名	タイプ	対応言語	句読点	タイムスタンプ	ダウンロード先
medasr-onnx	非ストリーミング	英語	なし	なし	modelscope

#MedAsr シリーズ

MedAsr シリーズ