多智能体架构通过并行处理,让多个Agent同时在各自的上下文中思考和搜索,本质上是扩展了解决问题所投入的“算力”和“思考容量”,尤其擅长处理那些需要“广度优先”探索的复杂问题。当然,缺点也同样明显:烧钱。多智能体系统消耗的Token大约是普通聊天的15倍。所以,这套玩法更适合那些价值足够高、能承受高成本的复杂任务。但是,考虑到“摩尔定律”,模型调用成本是急剧降低的,成本是最不需要考虑的因素。
发展单智能体和发展多智能体是统一的,都要有。
单智能体越强,多智能体越强。
多智能体的上下文困境在将来模型上下文长度扩展后将得到缓解,越来越多的任务只需单智能体就能完成,还能保持上下文一致性和处理高效。但是多智能体的优势仍然存在:处理更大的上下文。只要多智能体系统支持处理的最大上下文的扩展速度比单智能体快,就有存在的意义。
适合多智能体的任务:巨型代码库里的 coding、跨市场跨周期跨品种的金融分析、长期交互的社会模拟、长期交互的大型游戏