automatic

Author	SHA1	Message	Date
Disty0	dc7b25d387	Cleanup SDNQ and add SDNQ_USE_TENSORWISE_FP8_MATMUL env var	2025-08-11 14:50:17 +03:00
Disty0	3f45c4e570	Cleanup SDNQ and skip transpose on packed int8 matmul	2025-08-10 19:31:34 +03:00
Disty0	c3d007b02c	SDNQ split forward.py into layers and cleanup	2025-08-02 17:36:55 +03:00
Disty0	25a4731a97	SDNQ use static compile	2025-07-20 16:25:57 +03:00
Disty0	86cd272b96	SDNQ fix Dora	2025-06-18 16:24:42 +03:00
Disty0	26800a1ef9	Cleanup sdnq	2025-06-17 02:05:13 +03:00
Disty0	d31df8c1eb	SDNQ fuse bias into dequantizer with matmul	2025-06-14 22:10:10 +03:00
Disty0	5e013fb154	SDNQ optimize input quantization and use the word quantize instead of compress	2025-06-12 12:06:57 +03:00