Servir modelos de razonamiento: el borrador invisible que decide tu latencia y tu factura12 jun. 2026