Skip to content

Instantly share code, notes, and snippets.

@SimonAKing
Last active July 23, 2025 11:36
Show Gist options
  • Select an option

  • Save SimonAKing/ddd18c12868298bb4a48d0e07ceffc7b to your computer and use it in GitHub Desktop.

Select an option

Save SimonAKing/ddd18c12868298bb4a48d0e07ceffc7b to your computer and use it in GitHub Desktop.
Multi-Agent 架构驱动的 Data Agent路线与工程实践 - 07/15/2025

分享下 近期 AICon 大会上 有关数据分析场景的实践主题 - Multi-Agent 架构驱动的 Data Agent 路线与工程实践

内容涉及 context engineering 架构(single vs multi agent)、数据分析策略、工程实践等,其中一些值得解读的信息(从 PPT 内容出发):

  1. Multi agent:

    • 通过划分任务(裁剪 context),让每次 call llm 等价于 argmax (single agent 的 action space),从而提升效果,并且单个 agent 也可独立优化
    • 垂直架构(主 agent + 多个子 agent),主 agent 需要进行 plan、clarify,效果会有单点问题,解决方案可尝试 只让 主 agent 做宏观上的调度
  2. Data agent 分析全流程:ETL(数据清洗、连接)-> Metric(业务语义构建 - 产品功能)-> Insight(基于指标进行不同维度洞察,比如时序性指标 就是分析趋势,枚举指标就是分析归因等)-> Report(报告填充),图比较直观

  3. NL2SQL 实践上:

    • 产品:语义层很重要,企业术语 与 生成 SQL 之间需要 产品功能连接,避免领域知识影响、避免表与字段的歧义
    • 策略:预处理对 table schema 进行归一化,语义召回选表,然后结合 reAct、结果一致性等保证准确率,整体思路比较常见
  4. Memory :压缩时 考虑时效性、冲突性、扩展性(合并已有记忆);读取时会基于用户背景,考虑最近性、相关性、重要性 读取记忆;存储时需要考虑结构化与非结构场景,比如:用户查看业绩情况,结构化是查看 销售额、订单量;非结构是用户喜欢使用柱状图

  5. Research:策略上没有新意,产品上可支持用户上传模版去进行 outline 解析,作为 大纲生成的 fewshots 使用,算是快速意图冷启


Labels: 🎯技术向

Original post: https://simonaking.com/blog/weibo

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment