Tag: 运维
All the articles with the tag "运维".
-
我们在 Qwen3.5-9B 部署中踩过的所有坑(及参数调优全记录)
从输出乱码到思考泄露到 KV Cache OOM,这是在一台 RTX 3080 上部署 Qwen3.5-9B 的全过程记录。
-
生产环境 vs 测试环境:模型参数配置的那些坑
一台 RTX 3080、20GB 显存、9B 模型,能撑起生产服务吗?能。但照搬测试参数,等着你的就是乱码、OOM 和思考泄露。
-
Hermes 断流排查实录:从「回复到一半就停」到 vLLM OOM 根因修复
Hermes Agent 回复到一半突然卡住,没有报错、没有超时,就这么停了。花了两天时间从现象倒推根因,最终定位到 vLLM 显存不足导致的流式中断。这篇文章记录完整的排查思路和修复过程。
-
微信公众号 API 发布文章踩坑记:40066、45003 与那些说不清的 BUG
用微信公众号 API 自动化发布文章,本以为只是调几个接口的事,结果被三个错误码硬控了一整天。这篇记录真实的踩坑过程,从 40066 到 45003,从「接口已废弃」到「标题字节玄学」,希望能帮后来人省点时间。