AI Gumbo

SqueezeLLM: Better 3-bit and 4-bit Quantization for Large Language Models

SqueezeLLM: Better 3-bit and 4-bit Quantization for Large Language Models

AIGumbo.crew February 13, 2024 No Comments

"Large Language Models" As fast as AWQ, but more accurate

Source link