bottergpt GitHub个人资料亮点 | AI生成和翻译

Home 2026.05

关于开发者 —— bottergpt (Botter)

Botter 是 Getty Images(美国)与 VCG 的供稿人,自称“不是摄影师,而是 AI 爱好者”,常驻广州,与网易、Getty Images、MeteoAI 和 CloudX 有关联。该个人资料共有 22 个公开仓库。以下为亮点项目:


🏆 1. Tencent2020_Top5 —— 最受欢迎仓库

⭐ 87 星 | 🍴 27 个分支

这是 2020 腾讯广告算法大赛Top 5 解决方案。该方案涵盖了完整的机器学习流水线,包括数据预处理、Embedding 生成、模型训练(使用 TF1、TF2 和 PyTorch)、折叠外预测,以及最终使用 Ridge 回归进行 Stacking。团队名称为 BANJITINO,最终集成方法在约 400 万个样本上堆叠了 20 类分类模型([400w, 20] 矩阵)。

亮点: 这是一个真实的竞赛获奖代码库,具有完全的可复现性——从原始数据到最终提交,同时横跨三种不同的深度学习框架。


🌲 2. TreesBO —— 实用的 AutoML 工具

⭐ 4 星 | 🍴 3 个分支

TreesBO 是一个专门为树模型设计的贝叶斯优化工具包。对于回归,支持 LGBM、XGB、ExtraTrees (ET) 和 Random Forest (RF);对于分类,目前支持 LGBM。仓库中包含示例 notebook(Jupyter)。

亮点: 在机器学习竞赛和生产工作中,自动化树模型的超参数搜索是一个常见的痛点。该库直接围绕流行的树模型封装了贝叶斯优化,简洁且实用。


🌦️ 3. MeteoAI/awesome-atmos —— 获得星数最多的资源

⭐ 214 星 | 🍴 80 个分支

awesome-atmos 是一个精心策划的 Python 库、软件和资源列表,涵盖大气、环境和机器学习,灵感来源于著名的 awesome-python 列表。它将工具组织为以下类别:数值模型(WRF、CESM、CMAQ)、数据同化、雷达处理、卫星数据、大气指数计算、数据处理/分析、机器学习(scikit-learn、PyTorch、XGBoost、LightGBM 等)、可视化(Matplotlib、Cartopy、Basemap)以及资源(Pangeo、ECMWF notebooks 等)。

亮点: 这是与 bottergpt 相关的被采用最广泛的项目——任何在大气科学与数据科学/机器学习交叉领域工作的人的首选参考。


📄 4. PaperCollection —— 知识仓库

⭐ 2 星

个人收集的机器学习/深度学习相关论文与笔记——有助于追踪深度学习与机器学习领域的研究阅读。


🔁 5. wsdm2022-xmrec-top1-solution (Fork)

这是 WSDM 2022 XMRec 挑战赛 Top 1 解决方案 的一个分支,专注于跨市场推荐系统——另一个值得学习的竞赛机器学习解决方案。


总结表格

项目 星数 主题
MeteoAI/awesome-atmos ⭐ 214 大气科学 + 机器学习资源
Tencent2020_Top5 ⭐ 87 广告算法竞赛解决方案
TreesBO ⭐ 4 树模型贝叶斯优化
PaperCollection ⭐ 2 机器学习/深度学习论文笔记

最引人注目的项目是 腾讯竞赛解决方案(供机器学习从业者学习竞赛级流水线)和 awesome-atmos(供环境/大气数据科学领域的人士参考)。

参考资料:


Back Donate