Hermes使用报告详细分解

Hermes使用报告详细分解 | AI生成和翻译

首页 2026.05

问题： 我该如何解读过去30天的Hermes Insights使用报告？

回答：

这是Hermes——你自定义的AI智能体/CLI工具——的使用仪表板。下面我将逐层解析。

Token经济模型

输入Token：    26,632,983
输出Token：     1,813,984
总Token数：   337,052,151   ← 这个数字异常大

总Token数（3.37亿）大约是输入+输出Token和（2840万）的12倍。这意味着总Token数包含了上下文窗口内的所有Token——即每次对话中上下文中所有Token的总和，而不仅仅是新生成的Token。如果一个会话有10万上下文Token并运行了50轮，那么即使只生成了20万新Token，上下文Token也会达到500万。这是真正的“成本”指标。

按照你每年15亿Token的速率，21天内消耗3.37亿Token ≈ 年化约59亿Token——你的使用量已显著加速。

模型分布

模型	会话数	Token数	角色
mimo-v2.5-pro	185 (70%)	2.56亿 (76%)	主力模型
deepseek-v4-pro	31	4100万	重型推理任务
deepseek-v4-flash	24	2500万	快速/低成本任务
glm-5.1	25	1300万	可能用于中文场景或特定任务

Mimo显然是你的默认模型。DeepSeek-v4-pro的会话数较少但Token密集（平均每会话130万Token）——你用它处理大上下文或复杂任务。

工具调用分解——你的实际行为

terminal      42.4%   ← 确认了：你是一位“shell优先”的工程师
read_file     20.3%   ← 大量读取代码库
search_files  14.9%   ← 在仓库中执行grep/find模式搜索
patch         12.0%   ← 应用代码变更
write_file     4.5%   ← 生成新文件
execute_code   1.3%   ← 在智能体内运行代码

这是经典的智能体编码循环：读取 → 搜索 → 打补丁 → 终端验证。12%的补丁率对应20%的读取率，说明你的智能体每打一个补丁约读取1.7个文件——非常高效，没有频繁无效操作。

web_search (0.4%) + browser_navigate (0.4%) = 你很少用该智能体做研究，主要聚焦于代码工作。

会话模式

265个会话 / 18个活跃日 ≈ 14.7个会话/天
平均会话时间：约5小时10分钟  ← 长时间运行的智能体任务
平均每会话消息数：52.7条

平均5小时10分钟的会话非常惊人——这些不是快速的问答交流，而是完整的自主工作会话。最长的会话持续了2.4天（5月25日）——一个跨多天运行的会话意味着你的智能体在进行深度自主工作，而无需重启。

星期六占据主导（129个会话，占总数的49%）。你周末在进行最深入的AI工程工作。工作日可能受银行工作的限制。

值得关注的会话——异常值

最长会话：    2.4天     → 持续性自主智能体运行
最多消息数：  378条     → 深度来回交互，复杂任务
最多Token数： 327万      → 大型代码库或长上下文任务
最多工具调用：184次     → 密集自动化会话

184次工具调用的会话（5月24日）包含378条消息，这是一次长达数小时的智能体冲刺——很可能是一次重大功能开发或重构。这种会话中，智能体正在执行真正的工程工作。

总结——这些数据告诉你关于AI使用情况的几点

你把Hermes当作一个持久运行的编码智能体，而非聊天机器人。平均5小时的会话时长证实了这一点。
mimo-v2.5-pro是你的默认模型——值得评估一下对于复杂任务，deepseek-v4-pro是否能提供更好的每Token产出。
上下文Token膨胀是原始Token的12倍——如果按Token计费，长时间的大上下文会话成本很高。考虑使用上下文压缩或会话分块。
你受到工作日时间的瓶颈制约——星期六就占了你使用量的一半。如果能自动化夜间运行，你的效率会倍增。
技能系统使用率较低（24次加载，11个不同技能）——还有空间将更多领域知识编码进技能中，以提升智能体性能。

返回捐助