原生支持离线识别、实时流式识别,无需依赖云端、零配置启动
离线音频识别 + 麦克风实时流式识别,覆盖全场景
自动检测并下载所需 ONNX 模型,全程离线本地推理
支持 SRT字幕、JSON、纯文本等多种输出格式
支持多线程推理,自动检测CPU核心数智能适配
交互模式 + 命令行模式,灵活适配不同场景
解压即用,无需复杂的环境配置