Phone Voice Agent
2026-03-30
新闻来源:网淘吧
围观:5
电脑广告
手机广告
电话代理技能
运行一个本地FastAPI服务器,充当实时语音桥接器。
架构
Twilio (Phone) <--> WebSocket (Audio) <--> [Local Server] <--> Deepgram (STT)
|
+--> OpenAI (LLM)
+--> ElevenLabs (TTS)
前提条件
- Twilio账户:电话号码 + TwiML应用程序。
- Deepgram API密钥:用于快速语音转文本。
- OpenAI API密钥:用于对话逻辑。
- ElevenLabs API密钥:用于逼真的文本转语音。
- Ngrok(或类似工具):用于将本地8080端口暴露给Twilio。
设置
-
安装依赖项:

pip install -r scripts/requirements.txt -
设置环境变量(在
~/.moltbot/.env、~/.clawdbot/.env文件中,或通过export命令设置):export DEEPGRAM_API_KEY="your_key" export OPENAI_API_KEY="your_key" export ELEVENLABS_API_KEY="your_key" export TWILIO_ACCOUNT_SID="your_sid" export TWILIO_AUTH_TOKEN="your_token" export PORT=8080 -
启动服务器:
python3 scripts/server.py -
暴露至互联网:
ngrok http 8080 -
配置 Twilio:
- 前往您的电话号码设置。
- 将 "语音与传真" -> "来电时" 设置为Webhook。
- URL:
https://<您的-ngrok-URL>.ngrok.io/incoming - 方法:
POST
使用
拨打您的 Twilio 号码。智能体应接听电话,转录您的语音,思考,并以自然的声音回复。
自定义
- 系统提示词: 编辑
SYSTEM_PROMPT于scripts/server.py以更改角色设定。 - 语音: 更改
ELEVENLABS_VOICE_ID使用不同的语音。 - 模型: 切换
gpt-4o-mini到gpt-4以获取更智能(但更慢)的响应。
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Skiplagged Flights
下一篇:Sophie Optimizer


微信扫一扫,打赏作者吧~