Skip to content

Instantly share code, notes, and snippets.

@docularxu
Created April 12, 2026 05:11
Show Gist options
  • Select an option

  • Save docularxu/6162ae12fbe69fdc5714188dcb0dbb03 to your computer and use it in GitHub Desktop.

Select an option

Save docularxu/6162ae12fbe69fdc5714188dcb0dbb03 to your computer and use it in GitHub Desktop.
OpenClaw 会议转录 + 精修 完整部署指南:Whisper 本地转录 + LLM 精修 + 自动归档

OpenClaw 会议转录 + 精修 完整部署指南

前置条件

  • macOS 或 Linux 主机
  • 已安装 OpenClaw
  • Telegram bot(用于接收转录结果)

第一步:安装 Whisper(本地语音转文字)

# macOS
brew install openai-whisper

# 验证安装
whisper --help

首次运行会自动下载模型到 ~/.cache/whisper。推荐模型:

  • turbo - 速度快,精度不错(默认)
  • medium - 精度更高,速度稍慢
  • large-v3 - 最高精度,速度最慢

第二步:创建会议目录结构

mkdir -p ~/.openclaw/workspace/meetings

每次会议自动创建子目录:~/.openclaw/workspace/meetings/YYYY-MM-DD-<meeting-name>/

第三步:配置 Agent 的 SOUL.md

在你的 agent 目录(比如 ~/.openclaw/agents/myagent/SOUL.md)加入会议转录规则:

## 会议转录流程

收到会议录音后,按以下步骤处理:

1. **转录** - 用 Whisper 将音频转为文字
2. **精修** - 用 LLM 纠错、润色、整理格式
3. **归档** - 存到 meetings 目录
4. **汇报** - 发送摘要到 Telegram

### 文件命名
- 目录:`~/.openclaw/workspace/meetings/YYYY-MM-DD-<meeting-name>/`
- 转录原文:`transcript.txt`
- 精修版:`summary.md`

### Whisper 命令
\```bash
whisper /path/to/audio.m4a --model turbo --output_format txt --output_dir /tmp/
\```

### 精修 Prompt(中文会议)
将转录原文交给 LLM,使用以下 prompt:
"请对以下会议转录进行精修:1) 纠正语音识别错误(特别是技术术语);
2) 整理为清晰的对话格式;3) 标注发言人;4) 在文末添加 3-5 条要点总结。"

第四步:目录结构

~/.openclaw/workspace/
  └── meetings/
      └── 2026-04-15-qualcomm-interview/
          ├── transcript.txt    # Whisper 原始转录
          └── summary.md        # LLM 精修版

第五步:使用方式

把录音文件丢给 agent,说一句:

"帮我转录这个会议录音,精修后归档"

Agent 会自动完成:Whisper 转录 → LLM 精修 → 归档到 meetings 目录 → 发摘要给你。

进阶:支持录音文件上传

OpenClaw 原生支持文件上传,在 Telegram 里直接发送 .m4a / .mp3 / .wav 文件即可。Agent 收到后用 read 工具读取音频文件路径,再交给 Whisper 处理。

进阶:自动转录(cron 定时检查)

如果你想丢进录音文件后自动处理,可以用 OpenClaw cron 定时扫描:

openclaw cron add \
  --label "会议转录扫描" \
  --every "30m" \
  --agent myagent \
  --message "检查 ~/Desktop/ 和 ~/Downloads/ 下是否有新的会议录音文件(.m4a/.mp3/.wav),如有则自动转录、精修、归档"

常见问题

Q: Whisper 太慢? A: 换小模型。turbo 最快,medium 是精度和速度的平衡点。Apple Silicon Mac 上速度很快。

Q: 技术术语识别不准? A: 精修 prompt 里告诉 LLM 你的领域关键词。比如 RISC-V 相关会议,加上"注意 RISC-V、SoC、BSP、kernel 等术语的正确拼写"。

Q: 录音太长怎么办? A: Whisper 支持长音频,但超过 2 小时的文件建议先分段。LLM 精修时也可以分批处理再合并。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment