网淘吧来吧,欢迎您!

返回首页 微信
微信
手机版
手机版

Voice Transcribe

2026-03-28 新闻来源:网淘吧 围观:21
电脑广告
手机广告

语音转写

使用OpenAI的gpt-4o-mini-transcribe模型来转写音频文件。

使用场景

当收到语音备忘录(尤其是通过WhatsApp)时,只需运行:

uv run /Users/darin/clawd/skills/voice-transcribe/transcribe <audio-file>

然后根据转写的内容进行回应。

修正转写错误

如果Darin说某个词被转写错了,请将其添加到vocab.txt(作为提示)或replacements.txt(用于强制修正)。请参阅以下章节。

支持的格式

  • mp3, mp4, mpeg, mpga, m4a, wav, webm, ogg, opus

示例

# transcribe a voice memo
transcribe /tmp/voice-memo.ogg

# pipe to other tools
transcribe /tmp/memo.ogg | pbcopy

设置

  1. 请将您的OpenAI API密钥添加到/Users/darin/clawd/skills/voice-transcribe/.env文件中:
    OPENAI_API_KEY=sk-...
    

自定义词汇表

将单词添加到vocab.txt(每行一个),以帮助模型识别名称或专业术语:

Clawdis
Clawdbot

文本替换

如果模型仍然出现错误,请向replacements.txt添加一个替换项:

wrong spelling -> correct spelling

注意事项

  • 假设为英语(不进行语言检测)
  • 专门使用gpt-4o-mini-transcribe模型
  • 通过音频文件的SHA256哈希值进行缓存
免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Python Dataviz 下一篇:Automation Workflows 0.1.0

相关文章

您是本站第291879名访客 今日有274篇新文章/评论