我的AI作品集——日常AI工作的证据 | 原创,AI翻译

Home 2026.06

我不只是谈论 AI——我每天都在大规模使用它。这篇文章是我的 AI 工作视觉作品集:我构建的工具、消耗的 token 以及获得的认证。


🖥️ LLM 训练与推理——我的硬件配置

2023 年搭建了我的机器学习工作站,并一直进行训练和学习。

硬件经验:

GPU VRAM 经验时长 使用场景
NVIDIA RTX 4070 12 GB 3 年 家庭工作站
NVIDIA H200 141 GB 3 个月 RunPod / DigitalOcean
AMD MI300X 192 GB HBM3 3 个月 AMD Developer Cloud

我训练过的模型:

工作站:

我的机器学习学习站——2023 年搭建,RTX 4070 12GB,用于日常训练和实验

AMD Developer Cloud — MI300X 192GB HBM3:

AMD Dev Cloud — 用于大规模模型训练的 MI300X 实例


🧠 增强版 nanoGPT——我的分支

Fork 了 karpathy/nanoGPT 并扩展了额外的数据集流水线、扩展的训练配置以及用于学习的内联形状注释。45 次提交,2025 年 11 月 – 2026 年 4 月。

新增的数据集流水线:

数据集 路径 描述
FineWeb-Edu data/fineweb/ HuggingFace FineWeb-Edu(100 亿+ token)。基于分片的加载、分块处理、增量训练/验证集划分。
OpenWebText 10k data/openwebtext_10k/ 用于快速迭代的 10k 子集。
Wikipedia Local data/wikipedia_local/ 直接对本地纯文本转储进行分词(无需 HuggingFace 下载)。

新增的训练配置:

配置 目标 备注
train_fineweb.py 在 FineWeb 上训练 125M 针对 RTX 4070 12 GB 调优(n_embd=384, dropout=0.1)。
train_fineweb1_5b.py 在 FineWeb 上训练 1.5B 适用于 H200 80 GB。
train_fineweb_gpt3.py GPT-3 风格 10B token 基于分片的加载器,更宽的调度。
train_fineweb_760m.py 在 FineWeb 上训练 760M 适用于 MI300X 192 GB HBM3。
train_gpt2_200m.py GPT-2 200M 通用中型配置。
train_gpt2_200m_smoke.py 冒烟测试 快速 200M 完整性检查(约几分钟)。

模型更改:

增强版 nanoGPT——45 次提交,数据集流水线,扩展的训练配置,内联形状注释

GitHub: lzwjava/nanoGPT


📊 LLM API 使用量——数据

OpenRouter——过去一年

消耗 11.5 亿 token,花费 239 美元,跨多个模型的 API 请求 15.5 万次。

OpenRouter 活动仪表板——11.5 亿 token,239 美元,一年内 15.5 万次请求

OpenRouter 模型花费明细——Claude 4 Sonnet 44.40 美元,Claude 3.5 Sonnet 9.67 美元,Grok 3, Mistral, Kimi

OpenRouter 各模型 token 使用量——MiniMax 2.4 亿,Gemini 2.03 亿,DeepSeek 1.1 亿

通过 SSSAICode 使用 Claude API——2026 年 4 月

一个月内花费 171.53 美元。2,555 次请求。1.15 亿+ token。缓存命中率 90.9%。

SSSAICode Claude 使用量——Opus 4.6, Opus 4.7, Sonnet 4.6, Haiku 4.5

小米 MIMO 订阅——已使用 5 亿 token

Pro 月度计划,主配额 380 亿 + 补偿配额 87.5 亿(约 46 亿免费额度)。目前已消耗 5 亿 token。

小米 MIMO Pro 计划——已消耗 5 亿 token,剩余约 46 亿免费额度

2026 年 5 月每日 token 使用量

小米 MIMO 2026 年 5 月——mimo-v2.5、mimo-v2.5-pro、mimo-v2-pro 每日 token 使用详情

日期 模型 总 token 输入(缓存命中) 输入(缓存未命中) 输出
2026-05-31 mimo-v2.5 1,498 192 943 363
2026-05-31 mimo-v2.5-pro 132,198,274 128,108,096 3,478,691 611,487
2026-05-30 mimo-v2.5 70,745 3,200 39,429 28,116
2026-05-30 mimo-v2.5-pro 124,459,514 120,774,848 3,111,678 572,988
2026-05-29 mimo-v2.5-pro 17,534,693 16,141,184 1,204,155 189,354
2026-05-28 mimo-v2.5 14,217 1,344 9,589 3,284
2026-05-28 mimo-v2.5-pro 10,946,159 8,842,496 2,010,722 92,941
2026-05-28 mimo-v2-pro 3,389,424 2,860,224 522,989 6,211
2026-05-27 mimo-v2.5 1,631 192 945 494
2026-05-27 mimo-v2.5-pro 12,646,146 12,001,216 580,332 64,598

mimo-v2.5-pro 占主导地位(5 天内约 3 亿 token)。高缓存命中率(约 96% on mimo-v2.5-pro)保持成本高效。

总结

平台 Token 时间周期 费用
OpenRouter 11.5 亿 过去一年 239 美元
SSSAICode (Claude) 1.15 亿+ 2026 年 4 月 171.53 美元
小米 MIMO 5 亿 当前计划 免费 46 亿额度
其他 (GitHub Copilot 等) 5 亿 过去一年
总计 约 23 亿+ 过去一年

🏢 企业 AI 应用——汇丰银行

在汇丰银行(通过 TEKsystems),我在 GitHub Copilot 之上构建了一个自主 AI 代理层,用于自动化脚本编写、日志记录、文档编写和测试。

我构建的内容:

成果:

图片出处:GitHub Copilot — Visual Studio Code 市场

汇丰 AIPlayer 贡献奖


🎤 汇丰 AI 讲座——从神经网络到智能代理

在汇丰银行面向 80 位参与者 做了一场技术讲座——包括高级顾问、专家、副总监、软件工程师和承包商。

讲座: “从神经网络到智能代理”——一个从最简单的神经网络(y = wx)出发,经过 MNIST、Transformers、GPT、nanoGPT,再到构建个人 AI 代理的旅程。

我涵盖的内容:

反馈:

幻灯片: 使用 Claude Code 和 Marp 构建,基于我的公开 AI 回复笔记。


🛠️ ww——跨平台 CLI 工具集

ww 是我的旗舰 CLI 工具集——255+ 次提交,10+ 个命令组,跨平台(macOS + Linux)。涵盖带 AI 提交消息的 git 工作流、笔记管理、图像/PDF 处理、网页搜索、GitHub Copilot 聊天、系统工具和 LLM 驱动的辅助工具。

lzwjava@lzw-mac ww % uv run ww --help
用法: ww <group> [command] [options]

Action:
  ww action [workflow.yml]  触发一个 GitHub Actions 工作流

AMD Dev Cloud:
  ww amd-dev-cloud snapshots    列出快照
  ww amd-dev-cloud start-train  创建用于训练的 GPU 实例
  ww amd-dev-cloud end-train    创建快照并销毁 GPU 实例

Copilot:
  ww copilot auth           通过 GitHub OAuth 认证
  ww copilot chat           与 Copilot 模型聊天

Git:
  ww git gpa            对所有仓库执行 git pull --all
  ww git squash <n>     压缩最近 n 次提交
  ww git amend-push     修改最后一次提交并强制推送

LLM:
  ww llm compare <prompt>   比较多个 LLM 响应
  ww llm query <question>   查询本地 RAG 文档

Note:
  ww note              剪贴板内容保存为笔记(快速捕捉)
  ww note process      清空笔记队列
  ww note watch        自动处理守护进程

Screenshot:
  ww screenshot               截屏并创建笔记
  ww screenshot interact-note  交互式截屏笔记

255+ 次提交。10+ 个命令组。跨平台(macOS + Linux)。

ww——跨平台 CLI 工具集 on GitHub

GitHub: lzwjava/ww


📝 jekyll-ai-blog——AI 驱动的博客平台

jekyll-ai-bloglzwjava.github.io 的源码——一个通过 AI 自动化增强的 Jekyll 博客。10,000+ 英文文章,10,000+ 中文文章,9,700+ AI 回答笔记。过去一个月约 70,000 次页面浏览(Cloudflare Analytics)。

lzwjava@lzw-mac jekyll-ai-blog % ls README.md
README.md

它与标准 Jekyll 博客的不同之处:

规模:

指标 数量
英文文章 10,264
中文文章 10,259
AI 回答笔记 9,794
Python 脚本 323
ML 脚本 191
页面浏览(过去一个月) 约 70,000

jekyll-ai-blog——AI 驱动的博客,拥有 10K+ 文章、翻译、TTS 和 PDF 流水线

Cloudflare 网站分析——38.9K 访问次数,45.2K 页面浏览量,930ms 加载时间,82% 良好的 LCP

GitHub: lzwjava/jekyll-ai-blog


🌳 Tree_Of_Thought——与高中生合作“思维树”推理

Tree_Of_Thought 是一个朋友的项目——一个用于重物理问题解决的外部“思维树”推理系统。它不依赖于模型在一次不透明的生成中隐藏的思维链,而是将推理转化为一个显式、可检查、可控的树结构,带有实时状态、评分、剪枝和确定性工具支持。

该系统结合了:用于持久推理会话的 FastAPI 服务、用于检查和剪枝分支的浏览器 UI、节点级 FSM 和树调度器、用于精确符号计算的 SymPy 后端技能层,以及用于规划、建模、审查和评估的多模型路由。

我的贡献(1 个 PR): 添加了一个兼容 OpenAI 的请求器和 python-dotenv 配置,使系统能够连接到任何兼容 OpenAI 的端点(本地或云端)。

背景: 我指导了一名构建该系统的中学生。在一次会议中,他向我展示了完整的架构——推理树、基于 FSM 的审查、路由本地增量优化。我向他介绍了 AI 博士研究员,并帮助他思考研究方向。他现在正在探索使用 LLM 解决物理问题,使用 Codex(GPT-5.4)等工具,并构建多智能体协作编码系统。

思维树——终端树探索器,具有节点检查、前沿管理和分支剪枝功能

GitHub: Cerynitius/Tree_Of_Thought


🤖 iclaw——终端 AI 代理(REPL)

iclaw 是一个终端 AI 代理,可以自主编写代码、搜索和执行命令——适用于个人机器和受限制的企业环境。一个极简的 openclaw 实现,构建为纯 Python CLI,无需浏览器扩展或 IDE 插件,由 GitHub Copilot 驱动。

lzwjava@lzw-mac iclaw % iclaw

  ██  █████  ██       █████  ██   ██
  ██ ██      ██      ██   ██ ██   ██
  ██ ██      ██      ███████ ██ █ ██
  ██ ██      ██      ██   ██ ██████
  ██  █████  ███████ ██   ██  ███ ██

可用命令:
  /provider_model      选择并认证模型提供商
  /model               从提供商中选择特定模型
  /search              网页搜索(用法:/search <query>)
  /provider_search     选择网页搜索提供商
  /proxy               设置 HTTP/HTTPS 代理(用法:/proxy [url|off])
  /ca_bundle           设置 HTTPS 的 CA 包(用法:/ca_bundle [path|off])
  /log                 设置日志级别(用法:/log [verbose|info])
  /copy                复制上一条 Copilot 响应到剪贴板
  /read                将文件内容打印到终端(用法:/read <path>)
  /clear               清除对话历史
  /compact             使用 LLM 压缩对话历史
  /export              将完整对话历史导出为 JSON 文件
  /status              显示当前设置
  /help                显示可用命令
  /exit                退出 REPL。

关键特性:

iclaw——带有原生工具调用的终端 AI 代理 REPL

iclaw——显示自主编码和 Shell 命令的执行日志

GitHub: lzwjava/iclaw


⚙️ zz——数据集处理与训练工具

zz 是一个用于 ML 训练流水线的工具集——数据集下载、分词、提取和推理工具。用于 RunPod H200、DigitalOcean H100 和家庭 RTX 4070 上的 GPT-2 124M 训练运行。也托管在 Hugging Face

lzwjava@lzw-mac zz % tree -L 1
scripts/
  download/     # 数据集下载脚本 (FineWeb, Wikimedia, HF mirrors)
  extract/      # 数据提取、分词和重命名
  analysis/     # 训练时长和指标评估
  deepseek/     # LLM 推理脚本 (DeepSeek-V2-Lite)
logs/           # 训练日志和输出
datasets/       # 下载的数据集存储

关键能力:

zz on Hugging Face——数据集处理与训练工具,22 次提交,3 位贡献者

GitHub: lzwjava/zz · Hugging Face: lzwjava/zz


🎓 证书

机器学习专项课程——DeepLearning.AI 与斯坦福大学

2023 年 11 月完成。三门课程:监督式机器学习、高级学习算法、无监督学习、推荐系统、强化学习。

Coursera 机器学习专项课程证书——李智维,2023 年 11 月

深度学习专项课程——DeepLearning.AI

2023 年 12 月完成。五门课程:神经网络、超参数调优、结构化机器学习项目、卷积神经网络、序列模型。

Coursera 深度学习专项课程证书——李智维,2023 年 12 月



Back Donate