Anatomía de un stack de inferencia LLM on-premise: las siete capas que tienen que sostenerse las unas a las otras30 may. 2026