Voice Transcribe
2026-03-28
新闻来源:网淘吧
围观:21
电脑广告
手机广告
语音转写
使用OpenAI的gpt-4o-mini-transcribe模型来转写音频文件。
使用场景
当收到语音备忘录(尤其是通过WhatsApp)时,只需运行:
uv run /Users/darin/clawd/skills/voice-transcribe/transcribe <audio-file>
然后根据转写的内容进行回应。
修正转写错误
如果Darin说某个词被转写错了,请将其添加到vocab.txt(作为提示)或replacements.txt(用于强制修正)。请参阅以下章节。
支持的格式
- mp3, mp4, mpeg, mpga, m4a, wav, webm, ogg, opus
示例
# transcribe a voice memo
transcribe /tmp/voice-memo.ogg
# pipe to other tools
transcribe /tmp/memo.ogg | pbcopy
设置
- 请将您的OpenAI API密钥添加到
/Users/darin/clawd/skills/voice-transcribe/.env文件中:OPENAI_API_KEY=sk-...
自定义词汇表
将单词添加到vocab.txt(每行一个),以帮助模型识别名称或专业术语:
Clawdis
Clawdbot
文本替换
如果模型仍然出现错误,请向replacements.txt添加一个替换项:
wrong spelling -> correct spelling
注意事项
- 假设为英语(不进行语言检测)
- 专门使用gpt-4o-mini-transcribe模型
- 通过音频文件的SHA256哈希值进行缓存
文章底部电脑广告
手机广告位-内容正文底部


微信扫一扫,打赏作者吧~