Whisper

适合转写、字幕和音频处理工作流的开源语音识别模型。

Speech to text Subtitle Transcription Open source

概览

Whisper 常用于语音转写、字幕生成、长音频初稿和多语言音频处理。它适合给视频剪辑、会议纪要和播客工作流提供第一版文本。

转写结果需要人工校对,尤其是专有名词、数字、口音、背景噪音和多人对话。

在目录中,Whisper 归入 AI Voice、AI Subtitle 和 Open Source AI,常与剪辑工具、文档工具和 LLM 润色流程配合。

关键元数据

  • 价格: open source
  • 平台: python, cli, local
  • API 支持: 否
  • 中文支持: 是
  • 开源: 是
  • 来源置信度: 0.8
  • 最近核查: 2026-05-13