高级人工智能工程师不断演变的关注重点 | AI生成和翻译
问题:当前AI/Agent/全栈方向资深工程师的热门关注点是否集中在AI掌控、智能体、LLM训练和推理上?
回答:
是的,但需要更细致的看待。 过去6到12个月,前沿领域已经发生了变化。以下是真正热门的方向:
1. 智能体系统与推理(最大的变化) 行业正从“带工具使用的聊天机器人”转向“真正能自主规划与执行的智能体”。这包括:
- 多步推理(OpenAI o1、DeepSeek-R1)
- 大规模工具编排(智能体如何组合API调用?)
- 智能体的工作流(CrewAI、LangGraph、Anthropic的状态性智能体提示缓存)
你在这方面已经处于有利位置。你开发的CLI智能体(ww、iclaw、zz)正是当前资深工程师们在构建的东西。
2. 推理优化(效率之战)
- KV缓存量化(4位、2位)
- 推测解码(草稿模型→验证)
- 智能体批处理策略(智能体具有突发性,而非稳态)
- 运行更小、经过微调的模型,而非调用GPT-4(在H100上进行LoRA、DPO/GRPO的成本低于大规模API调用)
对于你所在银行的负载(每年15亿token),这能带来直接的投资回报:推理速度提升2倍加上量化,可降低50%成本。
3. 训练(确实存在,但范围更窄)
- 领域数据微调(对你而言是金融领域——完美契合)
- 在专有数据上继续预训练(不太常见,成本高昂)
- 用于偏好对齐的RLHF/DPO/GRPO(为什么GPT-4在你的任务上比Llama更聪明)
从零开始训练(就像你做的GPT-2工作)现在已经比较小众——大多数资深工程师都在微调现有模型。例外: 如果你在拥有专有金融数据集和H100的银行工作,那么训练一个领域特定的7B-13B模型是合理的前沿工作。这很罕见且价值极高。
4. 什么已经不再热门
- 直接调用LLM API(人人都在用,对资深工程师的职业发展没有助益)
- 基础RAG(乏味且饱和)
- 不带推理优化的通用微调
你应该重点发力的方向:
考虑到你的环境(拥有H200/H100访问权限、每年消耗15亿token、具备智能体构建经验):
- 智能体架构+推理——构建使用更小、经过微调的模型完成特定推理任务的系统,而非调用GPT-4
- 大规模推理——量化模型、实现推测解码、为银行负载优化批处理
- 微调管线——构建内部工具,在专有数据上训练金融领域专用模型,然后部署它们
- 智能体与模型的协同优化——训练智能体使其知道针对每项任务该使用哪种工具(大模型、小模型、API)——这正是Andrej/Karpathy级别的思考所在
你当前真正的前沿方向:
构建一个系统,该系统能够:
- 接收你银行的专有金融查询
- 路由到7B微调模型(在你自己的数据上训练,并进行DPO)
- 对于复杂推理回退到GPT-4
- 记录推理轨迹以便持续改进
- 成本比纯GPT-4降低80%,同时速度更快
这不是产品推销——这是资深AI工程师的职责。而这正是全球各大银行正在招聘的岗位(或是他们试图内部构建却未能成功的)。
你并没有落后。你正处在这个领域的核心。只需确保“智能体+训练+推理优化”是你的三位一体,而不仅仅是“从零开始训练”。