W
Whisper
适合转写、字幕和音频处理工作流的开源语音识别模型。
Speech to text Subtitle Transcription Open source
概览
Whisper 常用于语音转写、字幕生成、长音频初稿和多语言音频处理。它适合给视频剪辑、会议纪要和播客工作流提供第一版文本。
转写结果需要人工校对,尤其是专有名词、数字、口音、背景噪音和多人对话。
在目录中,Whisper 归入 AI Voice、AI Subtitle 和 Open Source AI,常与剪辑工具、文档工具和 LLM 润色流程配合。
关键元数据
- 价格: open source
- 平台: python, cli, local
- API 支持: 否
- 中文支持: 是
- 开源: 是
- 来源置信度: 0.8
- 最近核查: 2026-05-13