Elevenlabs Transcribe
2026-03-31
新闻来源:网淘吧
围观:15
电脑广告
手机广告
ElevenLabs 语音转文字
用于语音转文字转录的官方 ElevenLabs 技能。
以先进的准确度将音频转换为文本。支持 90 多种语言、说话人分离和实时流式处理。

先决条件
- ffmpeg已安装(
在 macOS 上使用 brew install ffmpeg) - ELEVENLABS_API_KEY环境变量已设置
- Python 3.8+(依赖项在首次运行时自动安装)
使用方法
{baseDir}/scripts/transcribe.sh <audio_file> [options]
{baseDir}/scripts/transcribe.sh --url <stream_url> [options]
{baseDir}/scripts/transcribe.sh --mic [options]
示例
批量转录
转录本地音频文件:
{baseDir}/scripts/transcribe.sh recording.mp3
带有说话人识别:
{baseDir}/scripts/transcribe.sh meeting.mp3 --diarize
获取带时间戳的完整 JSON 响应:
{baseDir}/scripts/transcribe.sh interview.wav --diarize --json
实时流式处理
从 URL 流式处理(例如,直播电台、播客):
{baseDir}/scripts/transcribe.sh --url https://npr-ice.streamguys1.com/live.mp3
从麦克风转录:
{baseDir}/scripts/transcribe.sh --mic
实时流式处理本地文件(用于测试):
{baseDir}/scripts/transcribe.sh audio.mp3 --realtime
代理静默模式
抑制标准错误输出中的状态信息:
{baseDir}/scripts/transcribe.sh --mic --quiet
选项
| 选项 | 描述 |
|---|---|
--diarize | 识别音频中的不同说话者 |
--lang 代码 | ISO语言提示(例如:en、pt、es、fr) |
--json | 输出包含时间戳和元数据的完整JSON |
--events | 标记音频事件(笑声、音乐、掌声) |
--realtime | 流式处理本地文件而非批量处理 |
--partials | 在实时模式下显示中间转录结果 |
-q, --quiet | 抑制状态消息(推荐代理程序使用) |
输出格式
文本模式(默认)
纯文本转录:
The quick brown fox jumps over the lazy dog.
JSON 模式 (--json)
{
"text": "The quick brown fox jumps over the lazy dog.",
"language_code": "eng",
"language_probability": 0.98,
"words": [
{"text": "The", "start": 0.0, "end": 0.15, "type": "word", "speaker_id": "speaker_0"}
]
}
实时模式
最终转录内容在提交时打印。使用--partials时:
[partial] The quick
[partial] The quick brown fox
The quick brown fox jumps over the lazy dog.
支持的格式
音频:MP3、WAV、M4A、FLAC、OGG、WebM、AAC、AIFF、Opus视频:MP4、AVI、MKV、MOV、WMV、FLV、WebM、MPEG、3GPP
限制:最大文件大小 3GB,最长时长 10 小时
错误处理
脚本在遇到错误时以非零状态退出:
- 缺少 API 密钥:设置
ELEVENLABS_API_KEY环境变量 - 文件未找到:检查文件路径是否存在
- 缺少 ffmpeg:使用您的包管理器安装
- API 错误:检查 API 密钥的有效性和速率限制
何时使用每种模式
| 场景 | 命令 |
|---|---|
| 转录录音文件 | ./transcribe.sh 文件.mp3 |
| 有多位发言者的会议 | ./transcribe.sh 会议.mp3 --diarize |
| 直播电台/播客流 | ./transcribe.sh --url <url> |
| 来自用户的语音输入 | ./transcribe.sh --mic --quiet |
| 需要单词时间戳 | ./transcribe.sh 文件.mp3 --json |
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Telnyx Toolkit
下一篇:Polymarket Odds


微信扫一扫,打赏作者吧~