网淘吧来吧,欢迎您!

返回首页 微信
微信
手机版
手机版

Edge TTS

2026-03-25 新闻来源:网淘吧 围观:103
电脑广告
手机广告

Edge-TTS 技能

概述

通过 node-edge-tts npm 包,使用 Microsoft Edge 的神经 TTS 服务生成高质量的文本转语音音频。支持多种语言、语音、可调节速度/音高以及字幕生成。

快速开始

当你从触发器或用户请求中检测到 TTS 意图时:

  1. 调用 tts 工具(Clawdbot 内置)将文本转换为语音
  2. 该工具返回一个 MEDIA: 路径
  3. Clawdbot 将音频路由到当前频道
// 示例:内置 tts 工具用法
tts("您要转换为语音的文本")
// 返回:MEDIA: /path/to/audio.mp3

触发器检测

将 "tts" 关键字识别为 TTS 请求。该技能在转换前会自动过滤掉文本中与 TTS 相关的关键字,以避免将触发器词本身转换为音频。

高级自定义

使用 Node.js 脚本

为了获得更多控制,可以直接使用捆绑的脚本:

TTS 转换器

cd scripts
npm install
node tts-converter.js "您的文本" --voice en-US-AriaNeural --rate +10% --output output.mp3

选项:

  • --voice, -v: 语音名称(默认:en-US-AriaNeural)
  • --lang, -l: 语言代码(例如,en-US, es-ES)
  • --format, -o: 输出格式(默认:audio-24khz-48kbitrate-mono-mp3)
  • --pitch音高调整(例如:+10%、-20%、默认)
  • --rate, -r:语速调整(例如:+10%、-20%、默认)
  • --volume:音量调整(例如:+0%、-10%、默认)
  • --save-subtitles, -s:将字幕保存为JSON文件
  • --output, -f:输出文件路径(默认:tts_output.mp3)
  • --proxy, -p:代理URL(例如:http://localhost:7890
  • --timeout:请求超时时间(毫秒)(默认:10000)
  • --list-voices, -L:列出可用语音

配置管理器

cd scripts
npm install
node config-manager.js --set-voice en-US-AriaNeural

node config-manager.js --set-rate +10%

node config-manager.js --get

node config-manager.js --reset

语音选择

常用语音(使用--list-voices查看完整列表):

英语:

  • en-US-MichelleNeural(女性,自然,默认)
  • en-US-AriaNeural(女性,自然)
  • en-US-GuyNeural(男性,自然)
  • en-GB-SoniaNeural(女性,英式英语)
  • en-GB-RyanNeural(男性,英式英语)

其他语言:

  • es-ES-ElviraNeural(西班牙语,西班牙)
  • fr-FR-DeniseNeural(法语)
  • de-DE-KatjaNeural(德语)
  • ja-JP-NanamiNeural(日语)
  • zh-CN-XiaoxiaoNeural(中文)
  • ar-SA-ZariyahNeural(阿拉伯语)

评分指南

速率值使用百分比格式:

  • "default":正常速度
  • "-20%""-10%":缓慢、清晰(教程、故事、辅助功能)
  • "+10%""+20%":稍快(摘要)
  • "+30%""+50%":快速(新闻、效率)

输出格式

根据使用场景选择音频质量:

  • audio-24khz-48kbitrate-mono-mp3:标准质量(语音笔记、消息)
  • audio-24khz-96kbitrate-mono-mp3:高质量(演示文稿、内容)
  • audio-48khz-96kbitrate-stereo-mp3:最高质量(专业音频、音乐)

资源

scripts/tts-converter.js

使用node-edge-tts的主要TTS转换脚本。可生成具有可自定义语音、语速、音量、音调和格式的音频文件。支持字幕生成和语音列表。

scripts/config-manager.js

管理TTS设置的持久化用户偏好(语音、语言、格式、音调、语速、音量)。将配置存储在~/.tts-config.json文件中。

scripts/package.json

包含node-edge-tts依赖项的NPM包配置。

references/node_edge_tts_guide.md

node-edge-tts npm包的完整文档,包括:

  • 按语言分类的完整语音列表
  • 韵律选项(语速、音调、音量)
  • 使用示例(命令行和模块)
  • 字幕生成
  • 输出格式
  • 最佳实践和限制

语音测试

测试不同语音并预览音频质量,请访问:https://tts.travisvn.com/

当您需要特定语音详细信息或高级功能时,请参考此链接。

安装

要使用捆绑的脚本:

cd /home/user/clawd/skills/public/tts-skill/scripts
npm install

这将安装:

  • node-edge-tts- TTS库
  • 指挥官- CLI 参数解析

工作流程

  1. 检测意图:检查用户消息中是否包含"tts"触发器或关键词
  2. 选择方法:对于简单请求使用内置的tts工具,或使用scripts/tts-converter.js进行自定义设置
  3. 生成音频:转换目标文本(消息、搜索结果、摘要)
  4. 返回给用户:tts工具返回一个MEDIA:路径;Clawdbot处理交付

测试

基础测试

运行测试脚本以验证TTS功能:

cd /home/user/clawd/skills/public/edge-tts/scripts
npm test

这将生成一个测试音频文件并验证TTS服务是否正常工作。

语音测试

测试不同语音并在以下网址预览音频质量:https://tts.travisvn.com/

集成测试

使用内置的文本转语音快速测试工具:

// 示例:使用默认设置测试TTS功能
tts("这是对TTS功能的测试。")

配置测试

验证配置持久性:

cd /home/user/clawd/skills/public/edge-tts/scripts
node config-manager.js --get
node config-manager.js --set-voice en-US-GuyNeural
node config-manager.js --get

故障排除

  • 测试连接性:运行npm test以检查TTS服务是否可访问
  • 检查语音可用性:使用node tts-converter.js --list-voices以查看可用语音
  • 验证代理设置:如果使用代理,请使用以下命令测试node tts-converter.js "test" --proxy http://localhost:7890
  • 检查音频输出:测试应在脚本目录中生成test-output.mp3文件

注意事项

  • node-edge-tts 使用微软Edge的在线TTS服务(已更新,身份验证有效)
  • 无需API密钥(免费服务)
  • 默认输出为MP3格式
  • 需要网络连接
  • 支持字幕生成(JSON格式,含逐词时间戳)
  • 临时文件处理:默认情况下,音频文件会保存至系统临时目录(Unix系统为/tmp/edge-tts-temp/Windows系统为C:\Users\<用户>\AppData\Local\Temp\edge-tts-temp\)并采用唯一文件名(例如tts_1234567890_abc123.mp3)。文件不会自动删除——调用程序(Clawdbot)应在使用后自行清理。如需永久存储,可通过--output选项指定自定义输出路径。
  • TTS关键词过滤:该功能会在文本转换前自动过滤TTS相关关键词(tts、TTS、text-to-speech),避免将触发词本身转为音频
  • 如需设置重复使用的偏好项,请通过config-manager.js设定默认值
  • 默认语音en-US-MichelleNeural(女声,自然音质)
  • 神经语音(以Neural结尾)比标准语音质量更高
免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Debug Pro 下一篇:Answer Overflow

相关文章

您是本站第249053名访客 今日有31篇新文章/评论