Volcano y Kueue: gang scheduling, colas y cuotas GPU para cargas distribuidas en Kubernetes16 jun. 2026
La puerta de la cocina que el maître no miró: NUMA de red, Cilium eBPF y DRANET, la cuarta pata del pinning6 jun. 2026
El maître que solo te sienta si cabéis en una mesa: CPU, Memory y Topology Manager en RKE26 jun. 2026
Siete fases de despliegue greenfield de una plataforma LLM on-premise: del hardware en la sala al primer token productivo31 may. 2026
Cinco niveles de madurez de la plataforma debajo del LLM: del servidor con Linux al cluster listo para vLLM31 may. 2026
Anatomía de un stack de inferencia LLM on-premise: las siete capas que tienen que sostenerse las unas a las otras30 may. 2026
El cluster GPU como plataforma: cómo convertir un cluster compartido en un servicio multi-tenant que tus equipos puedan consumir21 may. 2026
Hubble: observabilidad de red en eBPF, estado del arte 2026 y la nueva frontera con los agentes IA19 may. 2026
Operators de inferencia LLM en Kubernetes: OME, vLLM Production Stack, NVIDIA Dynamo y llm-d18 may. 2026