Comparativa de motores de serving LLM en frontera de Pareto: vLLM, SGLang, TRT-LLM y Dynamo16 jun. 2026
El router de inferencia LLM: la centralita L7 que en el post de canary llamábamos LoadBalancer2 jun. 2026
Operators de inferencia LLM en Kubernetes: OME, vLLM Production Stack, NVIDIA Dynamo y llm-d18 may. 2026