行业杂谈 - Agent 工程之研发的三个方向

Warren Zhan

2025-02-10

2025-03-24

工作沉思录, 行业

Agent工程, 预测, 行业, AI

136 7~10 min

我接触大模型行业已有一年多，姑且自我定位为 LLM Agent 应用研发工程师。在我看来，LLM 就是一把通往未来：软件 2.0 的钥匙，而在 2025，可以认为「Agent 即为 2.0 时代的软件。」

前言

2023 & 2024 有惊喜（GPT-3.5、GPT 4）、有爆点（Cursor、Deepseek、Claude-3.5-Sonet、o3）、有营销（Sora），也有焦虑（客服 Bot 取代人工、Cursor 取代初级码农）。

于我个人，我的心情是复杂的，时而悲观，时而重燃信心。不过无论如何，我自己被 AI 取代这种焦虑倒从未有过。我认为软件 2.0 的万里征途中，依然离不开工程研发，只不过需要的不再是软件 1.0 时代的研发。

本文将简单讨论分析我接触大模型行业以来，对于 Agent 工程中的三个工作方向分析。

总体来说，可分为：

模型工程：做模型相关的工作，包括蒸馏、剪枝、训练、微调、对齐、量化、低秩分解、Benchmark 等等。
基础设施工程：做模型落地到硬件相关的工作，包括部署、推理优化、适配、资源调度、服务化等等。
应用工程：做业务落地相关的工作，包括 Workflow、RAG、Tool Use、ReAct、Prompt Enginering、HTTP Over SSE 等等。

我觉得现在行业还没有特别明朗，类似处于混沌初开的时期，但也是在逐渐明朗。所以这个阶段，不少公司招人的时候就把算法混着用，让其做模型工程、也做基础设施、也做应用。只能说非常地费劲。

我认为：

只不过在这个还没有特别成熟的阶段，无论是基础设施工程还是应用工程，都得做一些 Research 工作。即，若你看不懂论文期刊，并将其落地的话，是无法把这两个工作做好的。但这并非要求你有强算法出身的背景。即便如此，也不是培训班出来就能上岗做好的工作，毕竟，培训班可没法将未来论文上的思路给你教会。

我认为 LLM 就是“大脑”，模型工程研究的是如何让“大脑”更聪明的学问，基础设施工程研究的是如何让“大脑”发挥最大潜力的学问，而应用工程（Agent 研发），是让 LLM 从“大脑”蜕变出强大的四肢，让其真正有手有脚的一门学问！

目前 Agent 研发的方法论，或者说技术方案都非常年轻：

对于未来发展，我认为只是需要巨头们围绕着 AGI 的目标，提出一些靠谱的、好的大方向，接下来就可以由我们（Agent 工程师）上场了。回到以下问题：

Agent 会从踉踉跄跄到健步如飞么？会。
Agent 工程会变成下一个培训班的 “Java”？会，但不是近期。
Agent 工程有作为工程师大展身手的内容么？有，算法和工程不可兼得，冯诺依曼体系不变，网络还是 TCP，体系结构还是内存-CPU-Cache，Agent 2.0 作为工程师大有可为。