Ttft | lo0 — Blog Técnico

2026

GenAI-Perf a fondo: perfilado de inferencia LLM con datos reales

15 jun. 2026

Benchmarking de inferencia LLM: frameworks, métricas y estado del arte (ficha a ficha)

13 jun. 2026

Prefix cache: ingeniería del hit rate para pasar del 15% al 75%

5 jun. 2026

Capacity planning para inferencia LLM on-premise: cómo dimensionar GPUs a partir de un SLO

1 jun. 2026