网淘吧来吧,欢迎您!

Elevenlabs Transcribe

2026-03-31 新闻来源:网淘吧 围观:15
电脑广告
手机广告

ElevenLabs 语音转文字

用于语音转文字转录的官方 ElevenLabs 技能。

以先进的准确度将音频转换为文本。支持 90 多种语言、说话人分离和实时流式处理。

Elevenlabs Transcribe

先决条件

  • ffmpeg已安装(在 macOS 上使用 brew install ffmpeg
  • ELEVENLABS_API_KEY环境变量已设置
  • Python 3.8+(依赖项在首次运行时自动安装)

使用方法

{baseDir}/scripts/transcribe.sh <audio_file> [options]
{baseDir}/scripts/transcribe.sh --url <stream_url> [options]
{baseDir}/scripts/transcribe.sh --mic [options]

示例

批量转录

转录本地音频文件:

{baseDir}/scripts/transcribe.sh recording.mp3

带有说话人识别:

{baseDir}/scripts/transcribe.sh meeting.mp3 --diarize

获取带时间戳的完整 JSON 响应:

{baseDir}/scripts/transcribe.sh interview.wav --diarize --json

实时流式处理

从 URL 流式处理(例如,直播电台、播客):

{baseDir}/scripts/transcribe.sh --url https://npr-ice.streamguys1.com/live.mp3

从麦克风转录:

{baseDir}/scripts/transcribe.sh --mic

实时流式处理本地文件(用于测试):

{baseDir}/scripts/transcribe.sh audio.mp3 --realtime

代理静默模式

抑制标准错误输出中的状态信息:

{baseDir}/scripts/transcribe.sh --mic --quiet

选项

选项描述
--diarize识别音频中的不同说话者
--lang 代码ISO语言提示(例如:enptesfr
--json输出包含时间戳和元数据的完整JSON
--events标记音频事件(笑声、音乐、掌声)
--realtime流式处理本地文件而非批量处理
--partials在实时模式下显示中间转录结果
-q, --quiet抑制状态消息(推荐代理程序使用)

输出格式

文本模式(默认)

纯文本转录:

The quick brown fox jumps over the lazy dog.

JSON 模式 (--json)

{
  "text": "The quick brown fox jumps over the lazy dog.",
  "language_code": "eng",
  "language_probability": 0.98,
  "words": [
    {"text": "The", "start": 0.0, "end": 0.15, "type": "word", "speaker_id": "speaker_0"}
  ]
}

实时模式

最终转录内容在提交时打印。使用--partials时:

[partial] The quick
[partial] The quick brown fox
The quick brown fox jumps over the lazy dog.

支持的格式

音频:MP3、WAV、M4A、FLAC、OGG、WebM、AAC、AIFF、Opus视频:MP4、AVI、MKV、MOV、WMV、FLV、WebM、MPEG、3GPP

限制:最大文件大小 3GB,最长时长 10 小时

错误处理

脚本在遇到错误时以非零状态退出:

  • 缺少 API 密钥:设置ELEVENLABS_API_KEY环境变量
  • 文件未找到:检查文件路径是否存在
  • 缺少 ffmpeg:使用您的包管理器安装
  • API 错误:检查 API 密钥的有效性和速率限制

何时使用每种模式

场景命令
转录录音文件./transcribe.sh 文件.mp3
有多位发言者的会议./transcribe.sh 会议.mp3 --diarize
直播电台/播客流./transcribe.sh --url <url>
来自用户的语音输入./transcribe.sh --mic --quiet
需要单词时间戳./transcribe.sh 文件.mp3 --json

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Telnyx Toolkit 下一篇:Polymarket Odds

相关文章

您是本站第342353名访客 今日有65篇新文章/评论