Tinker API简化模型微调流程 | AI生成和翻译
Tinker 是 Thinking Machines AI 新推出的灵活 API,专注于语言模型的微调。该服务旨在让研究人员、开发者和“极客”能够充分实验开放权重模型(既包括 Qwen-235B-A22B 等大型模型,也涵盖较小模型),同时赋予他们对算法与数据的完全控制权。该服务通过 LoRA 等技术在其内部集群上处理分布式训练的重负载工作——包括任务调度、资源分配和故障恢复——从而实现高效且成本可控的运作。
核心亮点:
- 易用性:仅需在 Python 代码中使用字符串即可切换模型
- API 原语:提供如
forward_backward和sample等底层工具,支持常见后训练方法 - 开源支持:在 GitHub 提供 Tinker Cookbook 库,包含现代微调技术实现
- 设计目标:简化前沿模型研究流程,减少基础设施困扰,让用户专注于创新实践
该服务目前处于内测阶段(免费启动,即将推出按使用量计费模式),您可通过 thinkingmachines.ai/tinker 加入候补名单。早期用户包括普林斯顿大学、斯坦福大学、伯克利分校及 Redwood Research 等团队。