Hermes使用报告详细分解 | AI生成和翻译

Home 2026.05

问题: 我该如何解读过去30天的Hermes Insights使用报告?

回答:

这是Hermes——你自定义的AI智能体/CLI工具——的使用仪表板。下面我将逐层解析。


Token经济模型

输入Token:    26,632,983
输出Token:     1,813,984
总Token数:   337,052,151   ← 这个数字异常大

总Token数(3.37亿)大约是输入+输出Token和(2840万)的12倍。这意味着总Token数包含了上下文窗口内的所有Token——即每次对话中上下文中所有Token的总和,而不仅仅是新生成的Token。如果一个会话有10万上下文Token并运行了50轮,那么即使只生成了20万新Token,上下文Token也会达到500万。这是真正的“成本”指标。

按照你每年15亿Token的速率,21天内消耗3.37亿Token ≈ 年化约59亿Token——你的使用量已显著加速。


模型分布

模型 会话数 Token数 角色
mimo-v2.5-pro 185 (70%) 2.56亿 (76%) 主力模型
deepseek-v4-pro 31 4100万 重型推理任务
deepseek-v4-flash 24 2500万 快速/低成本任务
glm-5.1 25 1300万 可能用于中文场景或特定任务

Mimo显然是你的默认模型。DeepSeek-v4-pro的会话数较少但Token密集(平均每会话130万Token)——你用它处理大上下文或复杂任务。


工具调用分解——你的实际行为

terminal      42.4%   ← 确认了:你是一位“shell优先”的工程师
read_file     20.3%   ← 大量读取代码库
search_files  14.9%   ← 在仓库中执行grep/find模式搜索
patch         12.0%   ← 应用代码变更
write_file     4.5%   ← 生成新文件
execute_code   1.3%   ← 在智能体内运行代码

这是经典的智能体编码循环:读取 → 搜索 → 打补丁 → 终端验证。12%的补丁率对应20%的读取率,说明你的智能体每打一个补丁约读取1.7个文件——非常高效,没有频繁无效操作。

web_search (0.4%) + browser_navigate (0.4%) = 你很少用该智能体做研究,主要聚焦于代码工作。


会话模式

265个会话 / 18个活跃日 ≈ 14.7个会话/天
平均会话时间:约5小时10分钟  ← 长时间运行的智能体任务
平均每会话消息数:52.7条

平均5小时10分钟的会话非常惊人——这些不是快速的问答交流,而是完整的自主工作会话。最长的会话持续了2.4天(5月25日)——一个跨多天运行的会话意味着你的智能体在进行深度自主工作,而无需重启。

星期六占据主导(129个会话,占总数的49%)。你周末在进行最深入的AI工程工作。工作日可能受银行工作的限制。


值得关注的会话——异常值

最长会话:    2.4天     → 持续性自主智能体运行
最多消息数:  378条     → 深度来回交互,复杂任务
最多Token数: 327万      → 大型代码库或长上下文任务
最多工具调用:184次     → 密集自动化会话

184次工具调用的会话(5月24日)包含378条消息,这是一次长达数小时的智能体冲刺——很可能是一次重大功能开发或重构。这种会话中,智能体正在执行真正的工程工作。


总结——这些数据告诉你关于AI使用情况的几点

  1. 你把Hermes当作一个持久运行的编码智能体,而非聊天机器人。平均5小时的会话时长证实了这一点。
  2. mimo-v2.5-pro是你的默认模型——值得评估一下对于复杂任务,deepseek-v4-pro是否能提供更好的每Token产出。
  3. 上下文Token膨胀是原始Token的12倍——如果按Token计费,长时间的大上下文会话成本很高。考虑使用上下文压缩或会话分块。
  4. 你受到工作日时间的瓶颈制约——星期六就占了你使用量的一半。如果能自动化夜间运行,你的效率会倍增。
  5. 技能系统使用率较低(24次加载,11个不同技能)——还有空间将更多领域知识编码进技能中,以提升智能体性能。

Back Donate