ElevenLabs Speech-to-Text技能使用说明

subsun 4周前 (03-28) openclaw小龙虾 46 0

ElevenLabs 语音转文字

使用 ElevenLabs 的 Scribe v2 模型转录音频文件。支持 90 多种语言,并具备说话人分离功能。

快速开始

# Basic transcription
{baseDir}/scripts/transcribe.sh /path/to/audio.mp3

# With speaker diarization
{baseDir}/scripts/transcribe.sh /path/to/audio.mp3 --diarize

# Specify language (improves accuracy)
{baseDir}/scripts/transcribe.sh /path/to/audio.mp3 --lang en

# Full JSON output with timestamps
{baseDir}/scripts/transcribe.sh /path/to/audio.mp3 --json

选项

标志描述
--diarize识别不同的说话人
--lang 代码ISO 语言代码(例如:en、pt、es)
--json输出包含词级时间戳的完整 JSON
--events标记音频事件(笑声、音乐等)

支持格式

所有主流音频/视频格式:mp3、m4a、wav、ogg、webm、mp4 等。

API 密钥

设置ELEVENLABS_API_KEY环境变量,或在 clawdbot.json 中配置:

{
  skills: {
    entries: {
      "elevenlabs-stt": {
        apiKey: "sk_..."
      }
    }
  }
}

示例

# Transcribe a WhatsApp voice note
{baseDir}/scripts/transcribe.sh ~/Downloads/voice_note.ogg

# Meeting recording with multiple speakers
{baseDir}/scripts/transcribe.sh meeting.mp3 --diarize --lang en

# Get JSON for processing
{baseDir}/scripts/transcribe.sh podcast.mp3 --json > transcript.json
免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏

相关推荐

网友评论

  • (*)

最新评论

用户管理

您好,欢迎到访网站!
    用户注册

上网淘巴领天猫淘宝优惠券,一年省好几千。

广告  ×

您是本站第821226名访客 今日有0篇新文章/评论