Qwen2.5 1.5B Instruct

1.5B

Alibaba Qwen2.5

Tiny Qwen with 128K context. Surprisingly capable for summarisation and chat.

⬇ 283.6K HF downloads♥ 121 likesQwen/Qwen2.5-1.5B-Instruct-GGUF· stats from 6/24/2026

Consumer GPUMac / Apple SiliconCPU / VPS

131K

Max Context

Quant Variants

GGUF Q8_0

Best Quality

99.6%

Accuracy Retained

Quantization Variants

Per-quant VRAM, quality loss, and inference speed on RTX 4090

Format	Level	BPW	VRAM	PPL Loss	Speed	Actions
GGUF	Q4_K_M	4.85	1.4 GB	4.0%	480 tok/s	Calc HF
GGUF	Q8_0	8.5	2.2 GB	0.4%	410 tok/s	Calc HF