Menu
Inicio
Empieza aquí
IA
Kubernetes
Networking
Sobre
|
LIGHT
DARK
Optimización
2026
Optimizando el decode en vLLM: exprimir cada token en hardware pequeño
4 jun. 2026
Optimizando el prefill en vLLM: los knobs que tu TTFT no perdona
4 jun. 2026
Instrumentar vLLM con OTel: medir lo que las optimizaciones realmente hacen
4 jun. 2026
Knowledge Distillation: enseñar a un modelo pequeño a pensar como uno grande
4 jun. 2026
Poda de modelos LLM: eliminar sin amputar
4 jun. 2026