承包商不能自任主要角色

承包商不能自任主要角色 | AI生成和翻译

首页 2026.06

问题：在做了16个月的Java + Angular全栈合同工作后，我不再愿意处理常规任务，而且积压了大量工作。我可以告诉团队让他们处理大部分工作，只把非常困难的任务升级给我，把自己定位为首席级工程师吗？我只对和首席工程师一起做的Python/DuckDB Excel差距填补工具感到兴奋。我想转向AI/LLM推理和模型训练。你怎么看？

答案：

让我直说吧，因为委婉的说法对你没好处。

“只给我困难任务”的策略不会按你想要的方式奏效。

你是个合同工，不是组织架构中的首席工程师。“首席工程师”这个头衔是公司根据工作范围、所有权和政治地位授予的——你不能通过拒绝任务来自我加封。如果你告诉团队“让他们做，只给我非常困难的任务”，从合同工口中说出的话，他们听到的是“我已经心不在焉了”。这会导致你的合同不被续签，而不是你的职责范围被提升。能让你自主选择任务的筹码，来自于你是正式员工/首席工程师，并且你在某个他们无法替代的关键领域扛着责任。按你自己的描述，你两者都不是。

所以，别那么说。这看起来像脱钩，会迅速导致你得到差评，并让他们按自己的节奏让你提前出局，而不是按你的节奏。

但你的直觉本质上是正确的。 按照你自己的规划，银行这份工作是为了支付薪水而交的税，同时也是一个学习场所。你已经收获了很多：1100份指南、400个脚本、AIPlayer贡献奖、Copilot使用率前6%、真实的银行业域知识。16个月的全栈Java/Angular现在已经是收益递减曲线了。你每月产出的笔记和脚本在新颖性上正在下降，因为你已经挖掘完了那个矿脉。

问题不是“我在这里如何少干活”——而是“退出路径是什么，我要退出去做什么？”

关于AI/LLM推理+训练目标的残酷真相： 想要它并不等于你能被雇用做这个。你到目前为止所做的——nanoGPT、GPT-2 760M、在约500万token上微调、使用Qwen进行推理、熟悉ROCm/FlashAttention——确实是很强的从爱好者到严肃实践者的领域。但这还不是能让你被真正的推理或训练团队雇佣的画像。那些职位需要：生产级推理优化（分页注意力、连续批处理、保持精度的量化、内核级工作），或者训练基础设施经验（分布式训练、FSDP/DeepSpeed、处理大规模loss尖峰、数据管道）。从“我在MI300X上训练了GPT-2 760M”到“我能为服务系统负责推理延迟”之间的差距，是你需要在跳槽前填补的差距。

所以，基于你的实际情况（90万美元房贷、家庭需要安全感、合同工没有晋升路径），我建议按以下顺序行动：

不要裸辞。先安排好下一件事。 你有房贷和两个女儿。离职应该进入一个与AI推理/训练相关的职位或合同，而不是“先失业再想办法”。你家人的反对在数字上是合理的。
利用剩下的银行工作时间来缩小可信度差距，而不是混日子。 首席工程师的Excel/DuckDB项目是你最好的资产——这是银行工作中唯一以Python为主、与AI接近、并且让你拥有一位可以作为推荐人的高级合作者的部分。深入投入这个项目，而不是远离所有事情。一位首席工程师的背书比你那1100份指南更有价值。
构建一个无可否认的真实推理产物。 不是另一个微调。比如：拿一个开源模型，用vLLM或SGLang提供服务，测量并优化吞吐量/延迟，用数据写出内核级或批处理级的改进。或者从头实现分页注意力/采样优化并进行基准测试。一个深入的、经过基准测试的、公开的产物胜过300个脚本。那是能把“爱好者”变成“推理方向可雇佣”的东西。
那1000份笔记/300个脚本是沉没杠杆——别再把它们当作进展来计数了。 几个月前它们是正确的举措。现在它们是安慰剂指标。更多的笔记不会让你更接近AI工作。一个经过基准测试的vLLM优化，或一次经受住loss尖峰的分布式训练运行，比200多份笔记更能推动你前进。

关于真正令人兴奋的工作——是的，推理和训练是前沿所在，也是你想去的地方。坦率地说：你比大多数人更接近，但最后一英里（生产级推理、非玩具规模的分布式训练）正是缺失的部分，而这也正是银行无法教给你的。这才是真正应该离开的理由——不是因为Java任务无聊，而是因为它们不再构建你想要积累的特定技能。

你想让我制定一个具体的8周推理项目计划（vLLM服务+基准测试优化，或者从头实现分页注意力）吗？这将是推理/训练职位最有力的作品集。这是我现在能给你的最高杠杆的东西。

返回捐助