- macOS 或 Linux 主机
- 已安装 OpenClaw
- Telegram bot(用于接收转录结果)
# macOS
brew install openai-whisper
# 验证安装
whisper --help首次运行会自动下载模型到 ~/.cache/whisper。推荐模型:
turbo- 速度快,精度不错(默认)medium- 精度更高,速度稍慢large-v3- 最高精度,速度最慢
mkdir -p ~/.openclaw/workspace/meetings每次会议自动创建子目录:~/.openclaw/workspace/meetings/YYYY-MM-DD-<meeting-name>/
在你的 agent 目录(比如 ~/.openclaw/agents/myagent/SOUL.md)加入会议转录规则:
## 会议转录流程
收到会议录音后,按以下步骤处理:
1. **转录** - 用 Whisper 将音频转为文字
2. **精修** - 用 LLM 纠错、润色、整理格式
3. **归档** - 存到 meetings 目录
4. **汇报** - 发送摘要到 Telegram
### 文件命名
- 目录:`~/.openclaw/workspace/meetings/YYYY-MM-DD-<meeting-name>/`
- 转录原文:`transcript.txt`
- 精修版:`summary.md`
### Whisper 命令
\```bash
whisper /path/to/audio.m4a --model turbo --output_format txt --output_dir /tmp/
\```
### 精修 Prompt(中文会议)
将转录原文交给 LLM,使用以下 prompt:
"请对以下会议转录进行精修:1) 纠正语音识别错误(特别是技术术语);
2) 整理为清晰的对话格式;3) 标注发言人;4) 在文末添加 3-5 条要点总结。"~/.openclaw/workspace/
└── meetings/
└── 2026-04-15-qualcomm-interview/
├── transcript.txt # Whisper 原始转录
└── summary.md # LLM 精修版
把录音文件丢给 agent,说一句:
"帮我转录这个会议录音,精修后归档"
Agent 会自动完成:Whisper 转录 → LLM 精修 → 归档到 meetings 目录 → 发摘要给你。
OpenClaw 原生支持文件上传,在 Telegram 里直接发送 .m4a / .mp3 / .wav 文件即可。Agent 收到后用 read 工具读取音频文件路径,再交给 Whisper 处理。
如果你想丢进录音文件后自动处理,可以用 OpenClaw cron 定时扫描:
openclaw cron add \
--label "会议转录扫描" \
--every "30m" \
--agent myagent \
--message "检查 ~/Desktop/ 和 ~/Downloads/ 下是否有新的会议录音文件(.m4a/.mp3/.wav),如有则自动转录、精修、归档"Q: Whisper 太慢?
A: 换小模型。turbo 最快,medium 是精度和速度的平衡点。Apple Silicon Mac 上速度很快。
Q: 技术术语识别不准? A: 精修 prompt 里告诉 LLM 你的领域关键词。比如 RISC-V 相关会议,加上"注意 RISC-V、SoC、BSP、kernel 等术语的正确拼写"。
Q: 录音太长怎么办? A: Whisper 支持长音频,但超过 2 小时的文件建议先分段。LLM 精修时也可以分批处理再合并。