Hermes使用报告详细分解 | AI生成和翻译
问题: 我该如何解读过去30天的Hermes Insights使用报告?
回答:
这是Hermes——你自定义的AI智能体/CLI工具——的使用仪表板。下面我将逐层解析。
Token经济模型
输入Token: 26,632,983
输出Token: 1,813,984
总Token数: 337,052,151 ← 这个数字异常大
总Token数(3.37亿)大约是输入+输出Token和(2840万)的12倍。这意味着总Token数包含了上下文窗口内的所有Token——即每次对话中上下文中所有Token的总和,而不仅仅是新生成的Token。如果一个会话有10万上下文Token并运行了50轮,那么即使只生成了20万新Token,上下文Token也会达到500万。这是真正的“成本”指标。
按照你每年15亿Token的速率,21天内消耗3.37亿Token ≈ 年化约59亿Token——你的使用量已显著加速。
模型分布
| 模型 | 会话数 | Token数 | 角色 |
|---|---|---|---|
| mimo-v2.5-pro | 185 (70%) | 2.56亿 (76%) | 主力模型 |
| deepseek-v4-pro | 31 | 4100万 | 重型推理任务 |
| deepseek-v4-flash | 24 | 2500万 | 快速/低成本任务 |
| glm-5.1 | 25 | 1300万 | 可能用于中文场景或特定任务 |
Mimo显然是你的默认模型。DeepSeek-v4-pro的会话数较少但Token密集(平均每会话130万Token)——你用它处理大上下文或复杂任务。
工具调用分解——你的实际行为
terminal 42.4% ← 确认了:你是一位“shell优先”的工程师
read_file 20.3% ← 大量读取代码库
search_files 14.9% ← 在仓库中执行grep/find模式搜索
patch 12.0% ← 应用代码变更
write_file 4.5% ← 生成新文件
execute_code 1.3% ← 在智能体内运行代码
这是经典的智能体编码循环:读取 → 搜索 → 打补丁 → 终端验证。12%的补丁率对应20%的读取率,说明你的智能体每打一个补丁约读取1.7个文件——非常高效,没有频繁无效操作。
web_search (0.4%) + browser_navigate (0.4%) = 你很少用该智能体做研究,主要聚焦于代码工作。
会话模式
265个会话 / 18个活跃日 ≈ 14.7个会话/天
平均会话时间:约5小时10分钟 ← 长时间运行的智能体任务
平均每会话消息数:52.7条
平均5小时10分钟的会话非常惊人——这些不是快速的问答交流,而是完整的自主工作会话。最长的会话持续了2.4天(5月25日)——一个跨多天运行的会话意味着你的智能体在进行深度自主工作,而无需重启。
星期六占据主导(129个会话,占总数的49%)。你周末在进行最深入的AI工程工作。工作日可能受银行工作的限制。
值得关注的会话——异常值
最长会话: 2.4天 → 持续性自主智能体运行
最多消息数: 378条 → 深度来回交互,复杂任务
最多Token数: 327万 → 大型代码库或长上下文任务
最多工具调用:184次 → 密集自动化会话
184次工具调用的会话(5月24日)包含378条消息,这是一次长达数小时的智能体冲刺——很可能是一次重大功能开发或重构。这种会话中,智能体正在执行真正的工程工作。
总结——这些数据告诉你关于AI使用情况的几点
- 你把Hermes当作一个持久运行的编码智能体,而非聊天机器人。平均5小时的会话时长证实了这一点。
- mimo-v2.5-pro是你的默认模型——值得评估一下对于复杂任务,deepseek-v4-pro是否能提供更好的每Token产出。
- 上下文Token膨胀是原始Token的12倍——如果按Token计费,长时间的大上下文会话成本很高。考虑使用上下文压缩或会话分块。
- 你受到工作日时间的瓶颈制约——星期六就占了你使用量的一半。如果能自动化夜间运行,你的效率会倍增。
- 技能系统使用率较低(24次加载,11个不同技能)——还有空间将更多领域知识编码进技能中,以提升智能体性能。