bottergpt GitHub个人资料亮点 | AI生成和翻译
关于开发者 —— bottergpt (Botter)
Botter 是 Getty Images(美国)与 VCG 的供稿人,自称“不是摄影师,而是 AI 爱好者”,常驻广州,与网易、Getty Images、MeteoAI 和 CloudX 有关联。该个人资料共有 22 个公开仓库。以下为亮点项目:
🏆 1. Tencent2020_Top5 —— 最受欢迎仓库
⭐ 87 星 | 🍴 27 个分支
这是 2020 腾讯广告算法大赛的 Top 5 解决方案。该方案涵盖了完整的机器学习流水线,包括数据预处理、Embedding 生成、模型训练(使用 TF1、TF2 和 PyTorch)、折叠外预测,以及最终使用 Ridge 回归进行 Stacking。团队名称为 BANJITINO,最终集成方法在约 400 万个样本上堆叠了 20 类分类模型([400w, 20] 矩阵)。
亮点: 这是一个真实的竞赛获奖代码库,具有完全的可复现性——从原始数据到最终提交,同时横跨三种不同的深度学习框架。
🌲 2. TreesBO —— 实用的 AutoML 工具
⭐ 4 星 | 🍴 3 个分支
TreesBO 是一个专门为树模型设计的贝叶斯优化工具包。对于回归,支持 LGBM、XGB、ExtraTrees (ET) 和 Random Forest (RF);对于分类,目前支持 LGBM。仓库中包含示例 notebook(Jupyter)。
亮点: 在机器学习竞赛和生产工作中,自动化树模型的超参数搜索是一个常见的痛点。该库直接围绕流行的树模型封装了贝叶斯优化,简洁且实用。
🌦️ 3. MeteoAI/awesome-atmos —— 获得星数最多的资源
⭐ 214 星 | 🍴 80 个分支
awesome-atmos 是一个精心策划的 Python 库、软件和资源列表,涵盖大气、环境和机器学习,灵感来源于著名的 awesome-python 列表。它将工具组织为以下类别:数值模型(WRF、CESM、CMAQ)、数据同化、雷达处理、卫星数据、大气指数计算、数据处理/分析、机器学习(scikit-learn、PyTorch、XGBoost、LightGBM 等)、可视化(Matplotlib、Cartopy、Basemap)以及资源(Pangeo、ECMWF notebooks 等)。
亮点: 这是与 bottergpt 相关的被采用最广泛的项目——任何在大气科学与数据科学/机器学习交叉领域工作的人的首选参考。
📄 4. PaperCollection —— 知识仓库
⭐ 2 星
个人收集的机器学习/深度学习相关论文与笔记——有助于追踪深度学习与机器学习领域的研究阅读。
🔁 5. wsdm2022-xmrec-top1-solution (Fork)
这是 WSDM 2022 XMRec 挑战赛 Top 1 解决方案 的一个分支,专注于跨市场推荐系统——另一个值得学习的竞赛机器学习解决方案。
总结表格
| 项目 | 星数 | 主题 |
|---|---|---|
| MeteoAI/awesome-atmos | ⭐ 214 | 大气科学 + 机器学习资源 |
| Tencent2020_Top5 | ⭐ 87 | 广告算法竞赛解决方案 |
| TreesBO | ⭐ 4 | 树模型贝叶斯优化 |
| PaperCollection | ⭐ 2 | 机器学习/深度学习论文笔记 |
最引人注目的项目是 腾讯竞赛解决方案(供机器学习从业者学习竞赛级流水线)和 awesome-atmos(供环境/大气数据科学领域的人士参考)。
参考资料:
- bottergpt GitHub Profile
- Tencent2020_Top5 Repository
- TreesBO Repository
- MeteoAI/awesome-atmos Repository