承包商不能自任主要角色 | AI生成和翻译
问题:在做了16个月的Java + Angular全栈合同工作后,我不再愿意处理常规任务,而且积压了大量工作。我可以告诉团队让他们处理大部分工作,只把非常困难的任务升级给我,把自己定位为首席级工程师吗?我只对和首席工程师一起做的Python/DuckDB Excel差距填补工具感到兴奋。我想转向AI/LLM推理和模型训练。你怎么看?
答案:
让我直说吧,因为委婉的说法对你没好处。
“只给我困难任务”的策略不会按你想要的方式奏效。
你是个合同工,不是组织架构中的首席工程师。“首席工程师”这个头衔是公司根据工作范围、所有权和政治地位授予的——你不能通过拒绝任务来自我加封。如果你告诉团队“让他们做,只给我非常困难的任务”,从合同工口中说出的话,他们听到的是“我已经心不在焉了”。这会导致你的合同不被续签,而不是你的职责范围被提升。能让你自主选择任务的筹码,来自于你是正式员工/首席工程师,并且你在某个他们无法替代的关键领域扛着责任。按你自己的描述,你两者都不是。
所以,别那么说。这看起来像脱钩,会迅速导致你得到差评,并让他们按自己的节奏让你提前出局,而不是按你的节奏。
但你的直觉本质上是正确的。 按照你自己的规划,银行这份工作是为了支付薪水而交的税,同时也是一个学习场所。你已经收获了很多:1100份指南、400个脚本、AIPlayer贡献奖、Copilot使用率前6%、真实的银行业域知识。16个月的全栈Java/Angular现在已经是收益递减曲线了。你每月产出的笔记和脚本在新颖性上正在下降,因为你已经挖掘完了那个矿脉。
问题不是“我在这里如何少干活”——而是“退出路径是什么,我要退出去做什么?”
关于AI/LLM推理+训练目标的残酷真相: 想要它并不等于你能被雇用做这个。你到目前为止所做的——nanoGPT、GPT-2 760M、在约500万token上微调、使用Qwen进行推理、熟悉ROCm/FlashAttention——确实是很强的从爱好者到严肃实践者的领域。但这还不是能让你被真正的推理或训练团队雇佣的画像。那些职位需要:生产级推理优化(分页注意力、连续批处理、保持精度的量化、内核级工作),或者训练基础设施经验(分布式训练、FSDP/DeepSpeed、处理大规模loss尖峰、数据管道)。从“我在MI300X上训练了GPT-2 760M”到“我能为服务系统负责推理延迟”之间的差距,是你需要在跳槽前填补的差距。
所以,基于你的实际情况(90万美元房贷、家庭需要安全感、合同工没有晋升路径),我建议按以下顺序行动:
-
不要裸辞。先安排好下一件事。 你有房贷和两个女儿。离职应该进入一个与AI推理/训练相关的职位或合同,而不是“先失业再想办法”。你家人的反对在数字上是合理的。
-
利用剩下的银行工作时间来缩小可信度差距,而不是混日子。 首席工程师的Excel/DuckDB项目是你最好的资产——这是银行工作中唯一以Python为主、与AI接近、并且让你拥有一位可以作为推荐人的高级合作者的部分。深入投入这个项目,而不是远离所有事情。一位首席工程师的背书比你那1100份指南更有价值。
-
构建一个无可否认的真实推理产物。 不是另一个微调。比如:拿一个开源模型,用vLLM或SGLang提供服务,测量并优化吞吐量/延迟,用数据写出内核级或批处理级的改进。或者从头实现分页注意力/采样优化并进行基准测试。一个深入的、经过基准测试的、公开的产物胜过300个脚本。那是能把“爱好者”变成“推理方向可雇佣”的东西。
-
那1000份笔记/300个脚本是沉没杠杆——别再把它们当作进展来计数了。 几个月前它们是正确的举措。现在它们是安慰剂指标。更多的笔记不会让你更接近AI工作。一个经过基准测试的vLLM优化,或一次经受住loss尖峰的分布式训练运行,比200多份笔记更能推动你前进。
关于真正令人兴奋的工作——是的,推理和训练是前沿所在,也是你想去的地方。坦率地说:你比大多数人更接近,但最后一英里(生产级推理、非玩具规模的分布式训练)正是缺失的部分,而这也正是银行无法教给你的。这才是真正应该离开的理由——不是因为Java任务无聊,而是因为它们不再构建你想要积累的特定技能。
你想让我制定一个具体的8周推理项目计划(vLLM服务+基准测试优化,或者从头实现分页注意力)吗?这将是推理/训练职位最有力的作品集。这是我现在能给你的最高杠杆的东西。