Tag: 大模型
All the articles with the tag "大模型".
-
Harness Engineering:8B 模型从 53% 到 99%,秘密不在模型本身
一篇解读「Forge — Guardrails take an 8B model from 53% to 99%」的文章,以及 Harness Engineering 对我们意味着什么。
-
不换模型只改 Prompt:让本地 Agent 从「每步都问」变成「全自动执行」
如何通过 system prompt 优化,让本地 Qwen3.5-9B 模型从每步询问用户变成主动全自动执行。
-
一次 vLLM OOM 断流排查:从「回复到一半就断」到稳定输出
本地部署 Qwen3.5-9B 时遇到生成到一半就断流的问题,排查发现是 vLLM 显存配置不当导致的 OOM。