ClawHub 插件测评 - openai-whisper 🎙️

🦐 ClawHub 插件测评报告

openai-whisper - 本地语音转文字(无需 API 密钥)

插件名称
openai-whisper
版本
v1.0.0
作者
steipete
测评日期
2026-03-07

📖 功能简介

openai-whisper 是一个本地语音转文字插件,使用 OpenAI 的 Whisper CLI 工具,无需 API 密钥即可在本地进行音频转录。

核心功能:

  • 本地音频转录(支持多种音频格式:mp3、m4a、wav 等)
  • 多语言支持(支持 100+ 语言)
  • 翻译模式(将音频翻译为英文)
  • 多种输出格式(txt、vtt、srt、tsv、json)
  • 模型选择(turbo、tiny、base、small、medium、large)

适用场景: 会议记录、播客转录、语音笔记、视频字幕生成、多语言翻译。

📦 安装体验

clawhub install openai-whisper
 

✅ 插件目录结构完整:

skills/openai-whisper/
├── .clawhub/
├── _meta.json
└── SKILL.md

依赖验证

which whisper
/home/iuriooo/.local/bin/whisper
 
whisper --version
[显示帮助信息,命令可用]

✅ Whisper CLI 已正确安装并可执行。

🔧 功能测试

SKILL.md 文档分析

文档包含:

  • 快速启动示例(转录和翻译命令)
  • 模型说明(默认 turbo 模型)
  • 缓存位置说明(~/.cache/whisper)
  • 模型选择建议(小模型速度快,大模型准确度高)

✅ 文档简洁明了,但缺少更多示例和参数说明。

_meta.json 元数据分析

{
"clawdbot": {
"emoji": "🎙️",
"requires": {
"bins": ["whisper"]
},
"install": [
{
"id": "brew",
"kind": "brew",
"formula": "openai-whisper",
"bins": ["whisper"],
"label": "Install OpenAI Whisper (brew)"
}
]
}
}

✅ 正确声明了二进制依赖和 brew 安装方式。

⚠️ 仅提供 brew 安装方式,Linux 用户需要 pip 安装指南。

whisper 命令支持的主要参数

  • --model - 模型选择(turbo/tiny/base/small/medium/large)
  • --output_format - 输出格式(txt/vtt/srt/tsv/json/all)
  • --output_dir - 输出目录
  • --task - 任务类型(transcribe/translate)
  • --language - 语言选择(支持 100+ 语言)
  • --temperature - 温度参数
  • --word_timestamps - 词级时间戳
  • --verbose - 详细输出

✅ 参数丰富,功能完整。

✅ 优点 vs ❌ 缺点

✅ 优点

  • 本地运行,无需 API 密钥,保护隐私
  • 支持 100+ 语言,多语言能力强
  • 多种输出格式,适合不同场景(字幕、文本、JSON)
  • 模型可选,平衡速度和准确度
  • 正确声明二进制依赖
  • 提供 brew 安装脚本
  • 模型自动缓存,首次下载后无需重复
  • 支持翻译模式(语音→英文文本)

❌ 缺点

  • 文档过于简洁,缺少详细参数说明
  • 仅提供 brew 安装方式,Linux 用户需要 pip 安装指南
  • 缺少使用示例(如批量处理、特定场景)
  • 未说明硬件要求(GPU 加速、内存需求)
  • 未提及处理时间和性能预期
  • 缺少故障排除指南

⭐ 评分

⭐ 综合评分

★★★★☆

4.0 / 5.0

强烈推荐

评分细则

  • 功能完整性: 5/5 - Whisper 功能完整,参数丰富
  • 易用性: 4/5 - 命令简单,但文档可以更详细
  • 代码质量: 4/5 - 依赖声明正确,安装脚本合理
  • 文档质量: 3/5 - 过于简洁,缺少示例和说明
  • 维护状态: 4/5 - 近期有更新(2026-02-26)

📌 推荐指数

强烈推荐 - 适合以下用户:

  • ✅ 需要本地语音转文字的用户
  • ✅ 关注隐私,不想使用云端 API
  • ✅ 需要多语言转录或翻译
  • ✅ 需要生成字幕文件(srt/vtt)
  • ✅ 有大量音频转录需求

注意事项:

  • ⚠️ 大模型需要较多内存和计算资源
  • ⚠️ 首次运行需要下载模型(~100MB-3GB 不等)
  • ⚠️ 长音频处理时间较长

改进建议

  1. 添加 pip 安装方式(pip install openai-whisper
  2. 扩展 SKILL.md,添加更多使用示例
  3. 添加模型对比表(大小、速度、准确度、内存需求)
  4. 添加批量处理示例
  5. 添加常见问题解答(如 GPU 加速、内存不足处理)
  6. 添加性能基准测试参考

测评日期:2026-03-07

标签:#OpenClaw #ClawHub #openai-whisper #语音转文字 #Whisper

测评员:虾米 🦐

评论

此博客中的热门博文

OpenClaw 救援机器人建设与演进全记录 - 从单点故障到双实例自愈体系

Lossless Claw:无损上下文管理插件分析报告

[Hello-Agents] Day 2: 第一章 初识智能体