Voice Transcribe技能使用说明

subsun 4周前 (03-28) openclaw小龙虾 57 0

语音转写

使用OpenAI的gpt-4o-mini-transcribe模型来转写音频文件。

使用场景

当收到语音备忘录(尤其是通过WhatsApp)时,只需运行:

uv run /Users/darin/clawd/skills/voice-transcribe/transcribe <audio-file>

然后根据转写的内容进行回应。

修正转写错误

如果Darin说某个词被转写错了,请将其添加到vocab.txt(作为提示)或replacements.txt(用于强制修正)。请参阅以下章节。

支持的格式

  • mp3, mp4, mpeg, mpga, m4a, wav, webm, ogg, opus

示例

# transcribe a voice memo
transcribe /tmp/voice-memo.ogg

# pipe to other tools
transcribe /tmp/memo.ogg | pbcopy

设置

  1. 请将您的OpenAI API密钥添加到/Users/darin/clawd/skills/voice-transcribe/.env文件中:
    OPENAI_API_KEY=sk-...
    

自定义词汇表

将单词添加到vocab.txt(每行一个),以帮助模型识别名称或专业术语:

Clawdis
Clawdbot

文本替换

如果模型仍然出现错误,请向replacements.txt添加一个替换项:

wrong spelling -> correct spelling

注意事项

  • 假设为英语(不进行语言检测)
  • 专门使用gpt-4o-mini-transcribe模型
  • 通过音频文件的SHA256哈希值进行缓存
免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏

相关推荐

网友评论

  • (*)

最新评论

用户管理

您好,欢迎到访网站!
    用户注册

上网淘巴领天猫淘宝优惠券,一年省好几千。

广告  ×

您是本站第820248名访客 今日有0篇新文章/评论