Tag: 显存
All the articles with the tag "显存".
-
20GB 显存本地 Agent 模型选型:Qwen3.5-9B 为什么是甜点?
RTX 3080 20GB 能塞哪些模型?从 7B 到 14B,从量化到蒸馏,实测对比各模型在工具调用、中文能力、速度上的表现。
-
vLLM 显存参数调优全解析:从 OOM 到稳定输出
在 RTX 3080 20GB 上跑 Qwen3.5-9B,从频繁 OOM 到稳定运行,逐个参数调优的实测记录和数据。
All the articles with the tag "显存".
RTX 3080 20GB 能塞哪些模型?从 7B 到 14B,从量化到蒸馏,实测对比各模型在工具调用、中文能力、速度上的表现。
在 RTX 3080 20GB 上跑 Qwen3.5-9B,从频繁 OOM 到稳定运行,逐个参数调优的实测记录和数据。