I-LLM:首次實現了 LLM 全整形量化,精度逼近浮點,超過 Smooth-Omini-AffineQuant
作者丨 Austin 來源丨 https://zhuanlan.zhihu.com/p/701393483編輯丨 GiantPandaCV宣傳一下我們的工作 I-LLM,(據我們所知)這是第一個在 LLM 上實現了 integer-only 量化的方法,精度逼近浮點,超過 Smooth/Omini/Affine Quant 等 SOTA 方法。https://arxiv.org/abs/2405Read more

⤋ Read More