深入解析 AI 模型显存估算方法,涵盖 .safetensors 与 .gguf 格式区别、量化精度原理、潜在空间压缩机制及激活值显存占用,提供 OOM 排错与参数调优路线图。
从零开始的显存占用教程,用生活类比讲清模型权重、激活值与 batch_size 的关系,并给出不同显卡的推荐配置与查表口诀。