Quantization para inferencia LLM: FP8, INT4 (GPTQ, AWQ) y GGUF — el zoom contable del modelo27 may. 2026
Tracing LLM con OpenTelemetry GenAI: la caja negra del avión que el campo estabilizó en 202627 may. 2026
LLM-as-judge: el corrector de oposiciones que evalúa a otros modelos sin convertirse en oráculo27 may. 2026
Alignment moderno: DPO, KTO, ORPO y SimPO — el sumiller que aprende sin recibir reward model27 may. 2026
Reranker y hybrid retrieval: el comité que decide los 5 chunks que el LLM va a leer de verdad25 may. 2026