分享
ComfyUI BitsandBytes_NF4 Flux
输入“/”快速插入内容
ComfyUI BitsandBytes_NF4 Flux
飞书用户9940
2024年9月16日修改
BitsandBytes是工具,而NF4是这个工具中的一种特定技术。解决显卡显存是6-8G的,FLUX的运行,使用。
BitsandBytes(简称bnb)
BitsandBytes是一个提供量化工具的库,而NF4是这个库中实现的一种特定的4位量化技术
。使用BitsandBytes,开发者可以方便地将NF4等量化方法应用到他们的深度学习项目中,以减少模型大小和加速推理。
BitsandBytes 这是一个Python库,已经被大多数大型语言模型(如 LLama、Phi 等)使用。它在相关技术领域中具有重要作用,是实现某些功能和优化性能的关键组件。
NF4(NormFloat4)
NF4是一种量化技术,
用于将不同精度的浮点数压缩为4位表示
,全称为"NormFloat4"。它的主要目的是减少模型的内存占用和计算复杂度,同时尽可能保持模型的性能。实现: 通常通过专门的库来实现,如NVIDIA的bitsandbytes库。
NF4将输入的浮点数(无论是32位、16位还是其他)映射到16个离散的量化级别(因为位二进制数可以表示16个不同的值2^4 = 16)虽然名称中包含"4",但这种方法的基本原理可以扩展到其他位宽,比如3位或5位等,只是4位在效率和精度之间提供了一个很好的平衡点。
映射过程: NF4的核心思想是将整个浮点数范围划分为16个区间,每个区间对应一个4位的表示。
网盘资源
https://pan.baidu.com/s/1nV26Fhn3WYBLrg2hSA0_YQ?pwd=cycy