分享下 近期 AICon 大会上 有关数据分析场景的实践主题 - Multi-Agent 架构驱动的 Data Agent 路线与工程实践
内容涉及 context engineering 架构(single vs multi agent)、数据分析策略、工程实践等,其中一些值得解读的信息(从 PPT 内容出发):
-
Multi agent:
- 通过划分任务(裁剪 context),让每次 call llm 等价于 argmax (single agent 的 action space),从而提升效果,并且单个 agent 也可独立优化
- 垂直架构(主 agent + 多个子 agent),主 agent 需要进行 plan、clarify,效果会有单点问题,解决方案可尝试 只让 主 agent 做宏观上的调度
-
Data agent 分析全流程:ETL(数据清洗、连接)-> Metric(业务语义构建 - 产品功能)-> Insight(基于指标进行不同维度洞察,比如时序性指标 就是分析趋势,枚举指标就是分析归因等)-> Report(报告填充),图比较直观
-
NL2SQL 实践上:
- 产品:语义层很重要,企业术语 与 生成 SQL 之间需要 产品功能连接,避免领域知识影响、避免表与字段的歧义
- 策略:预处理对 table schema 进行归一化,语义召回选表,然后结合 reAct、结果一致性等保证准确率,整体思路比较常见
-
Memory :压缩时 考虑时效性、冲突性、扩展性(合并已有记忆);读取时会基于用户背景,考虑最近性、相关性、重要性 读取记忆;存储时需要考虑结构化与非结构场景,比如:用户查看业绩情况,结构化是查看 销售额、订单量;非结构是用户喜欢使用柱状图
-
Research:策略上没有新意,产品上可支持用户上传模版去进行 outline 解析,作为 大纲生成的 fewshots 使用,算是快速意图冷启
Labels: 🎯技术向
Original post: https://simonaking.com/blog/weibo