H100 | lo0 — Blog Técnico

2026

TCO completo de un cluster GPU on-premise: del capex al €/GPU-hora all-in y el break-even contra cloud

16 jun. 2026

Compartir una GPU entre varias cargas: time-slicing, MPS y MIG

11 jun. 2026

La mesa compartida: NVLink, NVSwitch y NCCL, el cable por el que pasa cada token en tensor parallel

6 jun. 2026

FP8 end-to-end: activar, medir calidad y decidir con datos

5 jun. 2026

Capacity planning para inferencia LLM on-premise: cómo dimensionar GPUs a partir de un SLO

1 jun. 2026

FlashAttention v1/v2/v3/v4: el bibliotecario que nunca despeja la mesa — IO-awareness, async y la asimetría de Blackwell

29 may. 2026

El cluster GPU como plataforma: cómo convertir un cluster compartido en un servicio multi-tenant que tus equipos puedan consumir

21 may. 2026