行业杂谈 - Agent 工程之研发的三个方向

124 7~10 min

我接触大模型行业已有一年多,姑且自我定位为 LLM Agent 应用研发工程师。在我看来,LLM 就是一把通往未来:软件 2.0 的钥匙,而在 2025,可以认为「Agent 即为 2.0 时代的软件。」

前言

2023 & 2024 有惊喜(GPT-3.5、GPT 4)、有爆点(Cursor、Deepseek、Claude-3.5-Sonet、o3)、有营销(Sora),也有焦虑(客服 Bot 取代人工、Cursor 取代初级码农)。

于我个人,我的心情是复杂的,时而悲观,时而重燃信心。不过无论如何,我自己被 AI 取代这种焦虑倒从未有过。我认为软件 2.0 的万里征途中,依然离不开工程研发,只不过需要的不再是软件 1.0 时代的研发。

本文将简单讨论分析我接触大模型行业以来,对于 Agent 工程中的三个工作方向分析。

从底至上

总体来说,可分为:

  • 模型工程:做模型相关的工作,包括蒸馏、剪枝、训练、微调、对齐、量化、低秩分解、Benchmark 等等。

  • 基础设施工程:做模型落地到硬件相关的工作,包括部署、推理优化、适配、资源调度、服务化等等。

  • 应用工程:做业务落地相关的工作,包括 Workflow、RAG、Tool Use、ReAct、Prompt Enginering、HTTP Over SSE 等等。

混沌初开时期的混用

我觉得现在行业还没有特别明朗,类似处于混沌初开的时期,但也是在逐渐明朗。所以这个阶段,不少公司招人的时候就把算法混着用,让其做模型工程、也做基础设施、也做应用。只能说非常地费劲。

我认为:

  • 模型工程需要算法背景,否则压根不知道模型怎么训练出来是靠谱的,这个是强 Research 性质的。

  • 基础设施工程,则不需要算法背景也能做。

  • 应用工程,即狭义上的 “Agent 研发”,简直就是软件 1.0 (CRUD 后端)到软件 2.0 (Agent 后端)时代的“接力棒”。

只不过在这个还没有特别成熟的阶段,无论是基础设施工程还是应用工程,都得做一些 Research 工作。即,若你看不懂论文期刊,并将其落地的话,是无法把这两个工作做好的。但这并非要求你有强算法出身的背景。即便如此,也不是培训班出来就能上岗做好的工作,毕竟,培训班可没法将未来论文上的思路给你教会。

未来的发展

我认为 LLM 就是“大脑”,模型工程研究的是如何让“大脑”更聪明的学问,基础设施工程研究的是如何让“大脑”发挥最大潜力的学问,而应用工程(Agent 研发),是让 LLM 从“大脑”蜕变出强大的四肢,让其真正有手有脚的一门学问!

目前 Agent 研发的方法论,或者说技术方案都非常年轻:

  • MCP(Model Context Protocol 是 Anthropic 于 2024/11/25 提出

  • RAG(Retrieval-Augmented Generation)是 Facebook 研究人员于 2020/5/22 提出

  • ReAct (Reasoning and Acting) 是 Google & 普林斯顿大学研究人员于 2023/5/10 提出

  • LangChain 是 Harrison Chase 于 2022 年/10 提出

  • ...

对于未来发展,我认为只是需要巨头们围绕着 AGI 的目标,提出一些靠谱的、好的大方向,接下来就可以由我们(Agent 工程师)上场了。回到以下问题:

  • Agent 会从踉踉跄跄到健步如飞么?会。

  • Agent 工程会变成下一个培训班的 “Java”?会,但不是近期。

  • Agent 工程有作为工程师大展身手的内容么?有,算法和工程不可兼得,冯诺依曼体系不变,网络还是 TCP,体系结构还是内存-CPU-Cache,Agent 2.0 作为工程师大有可为。


0