决策训练下一步 | AI生成和翻译

Home 2026.06

问题:查看完我上传的 Nanochat 760M MI300X 设置文档后,下一步该做什么?

回答:

根据您上传文件中的详细说明,以下是结构化的下一步计划:


1. 确定训练策略

您有两个选择:

选项 A:继续使用当前 SDPA 设置

选项 B:尝试速度优化

建议: 如果可靠性是优先考虑,请坚持当前设置(选项 A)。如果您希望进行实验并能处理潜在的构建问题,可尝试选项 B 的部分优化。


2. 准备训练


3. 运行预训练


4. 训练后流程

基础预训练完成后:

  1. 使用 DCLM CORE 基准评估基础模型。
  2. 在聊天数据(identity_conversations.jsonl)上运行 SFT。
  3. 使用聊天基准评估 SFT 模型。
  4. 启动交互式聊天:

    python -m scripts.chat_cli -p 'Hello!'
    python -m scripts.chat_web
    

5. 未来运行的可选改进


建议的立即下一步


您可以先确认您的优先级:可靠性 vs 速度。这将决定您是立即运行 run_mi300x_d24.sh 还是尝试性能调整。


Back Donate