Hermes 上下文占用真相：121 个技能到底吃了多少 token？

背景

Hermes 默认加载全部技能（不是技能索引）。刚装完系统，一条消息发过去，系统提示里就塞满了所有技能的定义。

直觉告诉我这很浪费。但浪费多少？哪些优化手段真的有效？

用 Hermes 内置的统计功能实测各模块的 token 占用：

技能占了大头。注意这只是系统提示的初始占用，还没算对话历史。

很多人（包括我）一开始以为关闭工具集就能减少上下文占用。但翻 Hermes 源码后发现：

disabled_toolsets 只是不显示这些技能分组，并不阻止加载技能描述。121 个技能的描述文本早就在系统提示里了，disabled_toolsets 只控制界面层面的可见性。

真正能减少技能描述加载的只有一个方案：--skills 启动参数。

启动 Hermes 时指定只加载需要的技能：

hermes chat --skills shell,web_search,memory

这样系统提示里只有 3 个技能的定义，而不是 121 个。

效果对比：

模式	技能占用	节省
默认（121 技能）	~13,000 tokens	-
`--skills shell,web_search,memory`	~500 tokens	~12,500

节省出来的 12K tokens 可以放更多对话历史，或者降低压缩频率。

按 ROI 排序：

优化前（默认）：~30K tokens

[系统提示]
[核心指令] 3-4K
[121 个技能] 12-15K
[MCP 工具] 8-10K
[记忆] 1-2K

优化后（--skills + 关 MCP）：~7K tokens

[系统提示]
[核心指令] 3-4K
[3 个技能] ~500
[记忆] 1-2K

省出来 20K+ tokens，对话可以持续更久才触发压缩，Agent 的「记忆力」显著提升。