Quantization para inferencia LLM: FP8, INT4 (GPTQ, AWQ) y GGUF — el zoom contable del modelo27 may. 2026
eBPF en inferencia local y detección estadística de drift: el cierre del ciclo de observabilidad LLM en 202620 may. 2026