Posts
All the articles I've posted.
-
20GB 显存本地 Agent 模型选型:Qwen3.5-9B 为什么是甜点?
RTX 3080 20GB 能塞哪些模型?从 7B 到 14B,从量化到蒸馏,实测对比各模型在工具调用、中文能力、速度上的表现。
-
Hermes 接入 DuckDuckGo 搜索:内置 provider 零成本配置
Hermes 内置了 DuckDuckGo 搜索 provider,但默认没开。装一个 pip 包、改两行配置,就能让 Agent 拥有联网搜索能力,不需要 API Key。
-
Hermes 配置迁移与平台差异化:微信、终端、Discord 各自的上下文策略
Hermes 支持多频道接入——微信、终端、Discord 可以跑同一个 Agent,但每个平台的消息长度、互动习惯完全不同。一套配置打天下肯定不行。这篇文章讲 Hermes 的配置覆盖规则和平台差异化方案。
-
不改模型只改 Prompt:用中文强指令驯服本地 Agent
Qwen3.5-9B 被训练得太礼貌了,每做一步都要问用户。不改模型不重训,在 Hermes 的 prompt_builder.py 里追加 5 条中文指令,直接让 Agent 从「每步都问」变成「全自动执行」。实测有效的中文指令设计原则。