<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Opex on lo0 — Blog Técnico</title><link>https://blog.lo0.es/tags/opex/</link><description>Recent content in Opex on lo0 — Blog Técnico</description><generator>Hugo -- gohugo.io</generator><language>es</language><lastBuildDate>Tue, 16 Jun 2026 06:00:00 +0200</lastBuildDate><atom:link href="https://blog.lo0.es/tags/opex/index.xml" rel="self" type="application/rss+xml"/><item><title>TCO completo de un cluster GPU on-premise: del capex al €/GPU-hora all-in y el break-even contra cloud</title><link>https://blog.lo0.es/posts/tco-on-premise-gpu-cluster/</link><pubDate>Tue, 16 Jun 2026 06:00:00 +0200</pubDate><guid>https://blog.lo0.es/posts/tco-on-premise-gpu-cluster/</guid><description>&lt;blockquote>
&lt;p>Notación: importes en &lt;strong>N €&lt;/strong> o &lt;strong>N USD&lt;/strong> (fuente denominada en dólares); decimales con coma; separador de millar con espacio. No se usa el símbolo de dólar (delimitador de fórmula). Datos centrados en Europa/España. Hardware de ejemplo genérico: cluster de N nodos, cada uno con 4×H100 SXM5 80 GB.&lt;/p>
&lt;/blockquote>
&lt;h2 id="tldr">TL;DR&lt;/h2>
&lt;p>Un nodo 4×H100 SXM5 cuesta entre &lt;strong>150 000 USD y 200 000 USD&lt;/strong> de capex total (GPUs + servidor + red + almacenamiento + rack prorrateo). Amortizado a 3 años con opex europeo (energía a ~0,116 €/kWh industrial, PUE 1,54 medio o 1,2 con líquido, 0,3 FTE personal), el coste &lt;strong>all-in&lt;/strong> oscila entre &lt;strong>3,10 USD/GPU-hora&lt;/strong> (utilización 100 %) y &lt;strong>6,20 USD/GPU-hora&lt;/strong> (utilización 50 %). El break-even frente a AWS p5 on-demand (~6,88 USD/GPU-hora) se cruza en torno al &lt;strong>70 % de utilización&lt;/strong>; frente a un neocloud reserved 3 años (~1,49–2,10 USD/GPU-hora), el on-prem nunca cierra la brecha en ese escenario. La utilización es la variable que decide el eje de coste, no el precio del hardware.&lt;/p>
&lt;hr>
&lt;h2 id="el-modelo-supuestos-declarados">El modelo: supuestos declarados&lt;/h2>
&lt;p>Todos los cálculos siguientes parten de estos supuestos. Cambiar cualquiera de ellos mueve la conclusión; se cuantifica en la sección de sensibilidad.&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Parámetro&lt;/th>
&lt;th>Valor base&lt;/th>
&lt;th>Rango de sensibilidad&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Nodo&lt;/td>
&lt;td>4×H100 SXM5 80 GB (HGX baseboard)&lt;/td>
&lt;td>—&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Cluster&lt;/td>
&lt;td>N nodos (modelo por nodo; escala linealmente)&lt;/td>
&lt;td>1–32 nodos&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Amortización capex&lt;/td>
&lt;td>3 años (lineal)&lt;/td>
&lt;td>3–5 años&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Utilización GPU&lt;/td>
&lt;td>70 %&lt;/td>
&lt;td>30 %–100 %&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Precio energía&lt;/td>
&lt;td>0,116 €/kWh (industrial España, sept. 2025)&lt;/td>
&lt;td>0,06–0,20 €/kWh&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>PUE&lt;/td>
&lt;td>1,54 (media global Uptime Institute 2025)&lt;/td>
&lt;td>1,15–1,80&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Tipo de cambio&lt;/td>
&lt;td>1 USD = 0,93 € (referencia jun. 2026)&lt;/td>
&lt;td>—&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>Fuente energía: &lt;a href="https://www.globalpetrolprices.com/Spain/electricity_prices/">GlobalPetrolPrices · Spain Business Electricity, sept. 2025&lt;/a>. Fuente PUE: &lt;a href="https://datacenter.uptimeinstitute.com/rs/711-RIA-145/images/2025.Annual.Survey.Report.pdf">Uptime Institute Global Data Center Survey 2025&lt;/a> — PUE global medio estancado en 1,54 por sexto año consecutivo; hyperscalers 1,10–1,15; colocación/empresa 1,58–1,80; instalaciones con menos de 5 años de antigüedad, 1,48. PUE 1,2 alcanzable con refrigeración líquida directa al chip.&lt;/p>
&lt;/blockquote>
&lt;hr>
&lt;h2 id="desglose-capex-por-nodo-4h100-sxm5">Desglose capex por nodo 4×H100 SXM5&lt;/h2>
&lt;h3 id="gpus">GPUs&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Componente&lt;/th>
&lt;th>Precio unitario (USD)&lt;/th>
&lt;th>Cantidad&lt;/th>
&lt;th>Subtotal (USD)&lt;/th>
&lt;th>Fuente y fecha&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>H100 SXM5 80 GB (tarjeta)&lt;/td>
&lt;td>30 000–40 000&lt;/td>
&lt;td>4&lt;/td>
&lt;td>120 000–160 000&lt;/td>
&lt;td>&lt;a href="https://www.gmicloud.ai/en/blog/nvidia-h100-gpu-pricing-2026-rent-vs-buy-cost-analysis">GMI Cloud, abr. 2026&lt;/a> · &lt;a href="https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model">Introl, abr. 2026&lt;/a>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>El rango refleja variabilidad de mercado y descuentos por volumen (5–15 % para pedidos &amp;gt;50 unidades). Las H100 SXM5 requieren el &lt;strong>HGX baseboard&lt;/strong> de NVIDIA; no se venden sueltas para instalación directa en servidores estándar.&lt;/p>
&lt;h3 id="servidor--hgx-baseboard">Servidor / HGX baseboard&lt;/h3>
&lt;p>El nodo completo 4×H100 SXM utiliza el &lt;strong>HGX H100 4-GPU baseboard&lt;/strong> de NVIDIA más un servidor host compatible. Modelos de referencia: Supermicro SYS-421GU-TNXR (4U, Dual Intel Xeon 4th Gen, HGX H100 4-GPU) y su equivalente en Dell.&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Componente&lt;/th>
&lt;th>Coste estimado (USD)&lt;/th>
&lt;th>Nota&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Servidor chassis + CPU (2× Xeon) + RAM (512 GB DDR5) + PSU redundante&lt;/td>
&lt;td>18 000–25 000&lt;/td>
&lt;td>Basado en Supermicro SYS-821GE bare sin GPUs a ~24 806 USD (&lt;a href="https://www.xicomputer.com/Solutions/Data-Center-Servers/SYS-821GE-TNHR.asp">xicomputer.com&lt;/a>, jun. 2026); proporcional al 4-GPU&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>HGX H100 4-GPU baseboard&lt;/td>
&lt;td>incluido en precio GPU&lt;/td>
&lt;td>NVIDIA HGX plataforma; no precio separado público&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>NVLink inter-GPU (dentro del nodo)&lt;/td>
&lt;td>incluido en baseboard&lt;/td>
&lt;td>4 GPUs conectadas por NVLink 4.0 en el baseboard HGX&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>Claim de marketing (sin verificación independiente): Supermicro anuncia reducción de costes de energía del datacenter de hasta el 40 % con refrigeración líquida en sus servidores HGX H100 (&lt;a href="https://www.supermicro.com/en/pressreleases/supermicro-launches-industrys-first-nvidia-hgx-h100-8-and-4-gpu-h100-servers-with-liquid-cooling">Supermicro press release&lt;/a>).&lt;/p>
&lt;/blockquote>
&lt;h3 id="red-infiniband-ndr">Red InfiniBand NDR&lt;/h3>
&lt;p>Para un cluster multi-nodo con paralelismo tensorial entre nodos, la red GPU-GPU es crítica. NDR InfiniBand (400 Gb/s por puerto) es el estándar de facto para clusters HGX.&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Componente&lt;/th>
&lt;th>Coste estimado por nodo (USD)&lt;/th>
&lt;th>Fuente / Nota&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Switch NVIDIA Quantum-2 NDR 400G (64 puertos, prorrateado entre N nodos)&lt;/td>
&lt;td>2 000–4 000&lt;/td>
&lt;td>Switch ~35 000 USD (&lt;a href="https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model">Introl, abr. 2026&lt;/a>); a 16 nodos, ~2 200 USD/nodo&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Cables/transceptores InfiniBand NDR (4 puertos por nodo × ~1 000 USD/puerto)&lt;/td>
&lt;td>4 000&lt;/td>
&lt;td>Estimación basada en ~1 000 USD/transceptor óptico (&lt;a href="https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model">Introl, abr. 2026&lt;/a>)&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Red InfiniBand (prorrateado por nodo 4-GPU)&lt;/strong>&lt;/td>
&lt;td>&lt;strong>~6 000–8 000&lt;/strong>&lt;/td>
&lt;td>—&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>Para inferencia serving dentro de un nodo (4 GPUs con NVLink), la red inter-nodo es menos crítica que para training multi-nodo. Para cargas de prefill-decode disaggregated entre nodos, InfiniBand NDR es necesaria.&lt;/p>
&lt;/blockquote>
&lt;h3 id="almacenamiento-nvme">Almacenamiento NVMe&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Componente&lt;/th>
&lt;th>Coste estimado (USD)&lt;/th>
&lt;th>Nota&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>NVMe local (4 TB × 2 unidades U.2/E1.S, datasets de trabajo y checkpoints)&lt;/td>
&lt;td>2 000–4 000&lt;/td>
&lt;td>~500–1 000 USD/TB NVMe enterprise 2025&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Almacenamiento de objetos compartido (NAS/MinIO, prorrateado por nodo)&lt;/td>
&lt;td>2 000–5 000&lt;/td>
&lt;td>Varía según capacidad total del cluster&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Almacenamiento total por nodo&lt;/strong>&lt;/td>
&lt;td>&lt;strong>~4 000–9 000&lt;/strong>&lt;/td>
&lt;td>—&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>Introl modela 50 TB por GPU para operaciones efectivas en clusters de training (&lt;a href="https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model">Introl, abr. 2026&lt;/a>); para inferencia pura, el requerimiento es significativamente menor (pesos del modelo + logs).&lt;/p>
&lt;/blockquote>
&lt;h3 id="rack-pdu-y-conectividad-de-datacenter">Rack, PDU y conectividad de datacenter&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Componente&lt;/th>
&lt;th>Coste estimado por nodo (USD/año)&lt;/th>
&lt;th>Fuente&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Colocación rack (alta densidad, 10–15 kW por nodo)&lt;/td>
&lt;td>5 000–12 000/año&lt;/td>
&lt;td>&lt;a href="https://encoradvisors.com/data-center-colocation-pricing/">Encoradvisors · Colocation Pricing 2026&lt;/a>: alta densidad 3 000–6 000 USD/mes por rack; a 2 nodos por rack, ~1 500–3 000 USD/mes por nodo = 18 000–36 000 USD/año en tier-1; menor en España&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>PDU rack, cableado eléctrico (prorrateo)&lt;/td>
&lt;td>500–1 000 por nodo (capex amortizado)&lt;/td>
&lt;td>Dentro de la partida de colocación o CPD propio&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>Colocación en España/Europa es estructuralmente más barata que en mercados tier-1 de EE. UU. (Nueva York, Silicon Valley). Para CPD propio, sustituir por coste de espacio propio + amortización de infraestructura eléctrica y de refrigeración.&lt;/p>
&lt;/blockquote>
&lt;h3 id="resumen-capex-por-nodo-4h100-sxm5">Resumen capex por nodo 4×H100 SXM5&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Partida&lt;/th>
&lt;th>Rango (USD)&lt;/th>
&lt;th>Punto medio&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>GPUs (4× H100 SXM5)&lt;/td>
&lt;td>120 000–160 000&lt;/td>
&lt;td>140 000&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Servidor chassis + CPU/RAM/PSU&lt;/td>
&lt;td>18 000–25 000&lt;/td>
&lt;td>21 500&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Red InfiniBand NDR (prorrateo)&lt;/td>
&lt;td>6 000–8 000&lt;/td>
&lt;td>7 000&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Almacenamiento NVMe + objetos&lt;/td>
&lt;td>4 000–9 000&lt;/td>
&lt;td>6 500&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>PDU/rack/otros (capex)&lt;/td>
&lt;td>2 000–5 000&lt;/td>
&lt;td>3 500&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Capex total por nodo&lt;/strong>&lt;/td>
&lt;td>&lt;strong>150 000–207 000&lt;/strong>&lt;/td>
&lt;td>&lt;strong>178 500&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>Fuentes: &lt;a href="https://www.gmicloud.ai/en/blog/nvidia-h100-gpu-pricing-2026-rent-vs-buy-cost-analysis">GMI Cloud (abr. 2026)&lt;/a>, &lt;a href="https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model">Introl (abr. 2026)&lt;/a>, &lt;a href="https://www.spheron.network/blog/llm-inference-on-premise-vs-cloud/">Spheron (abr. 2026)&lt;/a>, &lt;a href="https://www.xicomputer.com/Solutions/Data-Center-Servers/SYS-821GE-TNHR.asp">xicomputer.com (jun. 2026)&lt;/a>.&lt;/p>
&lt;hr>
&lt;h2 id="desglose-opex-por-nodo-4h100-sxm5-anual">Desglose opex por nodo 4×H100 SXM5 (anual)&lt;/h2>
&lt;h3 id="energía">Energía&lt;/h3>
&lt;p>Un nodo 4×H100 SXM5 en carga completa consume aproximadamente:&lt;/p>
&lt;p>$$P_{\text{nodo}} = 4 \times 700,\text{W (TDP H100 SXM5)} + 800,\text{W (servidor)} \approx 3{,}6,\text{kW (IT)}$$&lt;/p>
&lt;p>La potencia total del datacenter incluye el overhead de refrigeración, expresado por el &lt;strong>PUE&lt;/strong>:&lt;/p>
&lt;p>$$P_{\text{total}} = P_{\text{IT}} \times \text{PUE}$$&lt;/p>
&lt;p>$$\text{coste energía anual} = P_{\text{IT}} \times \text{PUE} \times 8,760,\text{h} \times \text{precio kWh}$$&lt;/p>
&lt;p>Con los valores base (PUE 1,54; 0,116 €/kWh):&lt;/p>
&lt;p>$$\text{energía/año} = 3{,}6,\text{kW} \times 1{,}54 \times 8,760,\text{h} \times 0{,}116,\text{EUR/kWh} \approx 5,475,\text{EUR}$$&lt;/p>
&lt;p>Con PPA solar España (precio referencia Q3 2025: ~34 €/MWh = 0,034 €/kWh según &lt;a href="https://www.pv-tech.org/european-solar-ppa-prices-fall-below-35-mwh-q3-2025/">PV Tech, oct. 2025&lt;/a>):&lt;/p>
&lt;p>$$\text{energía/año (PPA solar)} = 3{,}6 \times 1{,}54 \times 8,760 \times 0{,}034 \approx 1,604,\text{EUR}$$&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Escenario energético&lt;/th>
&lt;th>Precio (€/kWh)&lt;/th>
&lt;th>Coste energía/año por nodo 4-GPU&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>PPA solar España (Q3 2025)&lt;/td>
&lt;td>0,034&lt;/td>
&lt;td>~1 604 €&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Industrial España (sept. 2025)&lt;/td>
&lt;td>0,116&lt;/td>
&lt;td>~5 475 €&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Europa media (tarifa industrial)&lt;/td>
&lt;td>0,160&lt;/td>
&lt;td>~7 550 €&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Peor caso (sin PPA, tarifa alta)&lt;/td>
&lt;td>0,200&lt;/td>
&lt;td>~9 437 €&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;h3 id="personal--operación">Personal / operación&lt;/h3>
&lt;p>El coste de personal es la partida más variable según el tamaño del cluster. Para un cluster pequeño (2–8 nodos), la regla práctica es &lt;strong>0,3–0,5 FTE por cluster&lt;/strong> de soporte de infraestructura GPU (&lt;a href="https://www.spheron.network/blog/llm-inference-on-premise-vs-cloud/">Spheron, abr. 2026&lt;/a>).&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Tamaño cluster&lt;/th>
&lt;th>FTE estimado&lt;/th>
&lt;th>Coste FTE (€/año, Europa Occ.)&lt;/th>
&lt;th>Coste por nodo 4-GPU (€/año)&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>2–4 nodos&lt;/td>
&lt;td>0,3 FTE&lt;/td>
&lt;td>~120 000&lt;/td>
&lt;td>36 000–18 000&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>8–16 nodos&lt;/td>
&lt;td>0,5 FTE&lt;/td>
&lt;td>~120 000&lt;/td>
&lt;td>7 500&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>32+ nodos&lt;/td>
&lt;td>1–2 FTE&lt;/td>
&lt;td>~120 000&lt;/td>
&lt;td>3 750–7 500&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>Referencia salarial orientativa: ingeniero de infraestructura GPU con conocimiento de CUDA, InfiniBand y Kubernetes en Europa Occidental, ~90 000–140 000 €/año coste total empresa. Las cifras de Introl (&lt;a href="https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model">abr. 2026&lt;/a>) en USD (~275 000 USD/año para EE. UU.) reflejan el mercado norteamericano, sensiblemente más alto.&lt;/p>
&lt;/blockquote>
&lt;h3 id="mantenimiento-y-soporte">Mantenimiento y soporte&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Partida&lt;/th>
&lt;th>Coste anual (% del capex hardware)&lt;/th>
&lt;th>Por nodo 4-GPU (punto medio)&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Mantenimiento / soporte vendor&lt;/td>
&lt;td>5–10 % del capex&lt;/td>
&lt;td>~7 000–14 000 USD → ~6 500–13 000 €&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Tasa de fallos GPU (~5 % anual) × coste reposición&lt;/td>
&lt;td>5 % × 4 GPUs × ~35 000 USD = ~7 000 USD esperados&lt;/td>
&lt;td>~6 500 € (amortizado como provisión)&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Recambios menores (cables, módulos)&lt;/td>
&lt;td>~500–1 000 €&lt;/td>
&lt;td>—&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>Introl cita tasas de fallo de GPU del 2–3 % anual en clusters pequeños; Google Research documentó ~9 % anualizado en el cluster H100 de 16 384 GPUs de Meta (&lt;a href="https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model">Introl, abr. 2026&lt;/a>). Se usa 5 % como valor conservador intermedio.&lt;/p>
&lt;/blockquote>
&lt;h3 id="depreciación-a-efectos-contables">Depreciación (a efectos contables)&lt;/h3>
&lt;p>La depreciación lineal convierte el capex en un flujo anual equiparable al coste del cloud committed:&lt;/p>
&lt;p>$$\text{depreciación anual} = \frac{\text{capex nodo}}{\text{años amortización}}$$&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Capex nodo (USD)&lt;/th>
&lt;th>Amortización 3 años (USD/año)&lt;/th>
&lt;th>Amortización 5 años (USD/año)&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>150 000 (mínimo)&lt;/td>
&lt;td>50 000&lt;/td>
&lt;td>30 000&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>178 500 (medio)&lt;/td>
&lt;td>59 500&lt;/td>
&lt;td>35 700&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>207 000 (máximo)&lt;/td>
&lt;td>69 000&lt;/td>
&lt;td>41 400&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>El hardware H100 deprecia rápidamente: los análisis de mercado secundario sitúan el valor residual en el 20–40 % del precio de compra a los 3 años (&lt;a href="https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model">Introl, abr. 2026&lt;/a>). La llegada de Blackwell GB200/GB300 acelera la obsolescencia percibida.&lt;/p>
&lt;/blockquote>
&lt;h3 id="resumen-opex-anual-por-nodo-4h100-sxm5-escenario-base-cluster-de-8-nodos">Resumen opex anual por nodo 4×H100 SXM5 (escenario base, cluster de 8 nodos)&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Partida&lt;/th>
&lt;th>Escenario base (€/año)&lt;/th>
&lt;th>Rango&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Energía (PUE 1,54; 0,116 €/kWh)&lt;/td>
&lt;td>5 475&lt;/td>
&lt;td>1 604–9 437&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Personal (0,5 FTE × 8 nodos, prorrateado)&lt;/td>
&lt;td>7 500&lt;/td>
&lt;td>3 750–36 000&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Mantenimiento / soporte / fallos&lt;/td>
&lt;td>9 000&lt;/td>
&lt;td>5 000–15 000&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Colocación rack (España, alta densidad)&lt;/td>
&lt;td>6 000&lt;/td>
&lt;td>3 000–15 000&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Opex total por nodo&lt;/strong>&lt;/td>
&lt;td>&lt;strong>~28 000&lt;/strong>&lt;/td>
&lt;td>&lt;strong>~13 000–75 000&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>El rango extremo refleja la diferencia entre un datacenter propio bien amortizado con PPA solar y energía barata (opex mínimo) frente a colocación tier-1 con tarifas de mercado y personal sénior.&lt;/p>
&lt;hr>
&lt;h2 id="derivación-del-gpu-hora-all-in">Derivación del €/GPU-hora all-in&lt;/h2>
&lt;h3 id="fórmula">Fórmula&lt;/h3>
&lt;p>$$\text{EUR/GPU-hora all-in} = \frac{\frac{\text{capex nodo}}{\text{años}} + \text{opex anual nodo}}{4,\text{GPUs} \times 8,760,\text{h} \times u}$$&lt;/p>
&lt;p>donde (u) es la utilización media anual (0 a 1).&lt;/p>
&lt;p>Véase la identidad de coste por token en &lt;a href="https://blog.lo0.es/posts/coste-por-token-y-por-request/">coste por token y por request&lt;/a> para la conexión con el throughput.&lt;/p>
&lt;h3 id="tabla-de-gpu-hora-según-utilización-y-escenario">Tabla de €/GPU-hora según utilización y escenario&lt;/h3>
&lt;p>&lt;strong>Capex medio (178 500 USD → ~166 000 €), amortización 3 años → 55 300 €/año.&lt;/strong>&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Utilización&lt;/th>
&lt;th>Opex/año (base, €)&lt;/th>
&lt;th>Coste total/año (€)&lt;/th>
&lt;th>GPU-horas útiles/año&lt;/th>
&lt;th>&lt;strong>€/GPU-hora&lt;/strong>&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>30 %&lt;/td>
&lt;td>28 000&lt;/td>
&lt;td>83 300&lt;/td>
&lt;td>10 512&lt;/td>
&lt;td>&lt;strong>7,93&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>50 %&lt;/td>
&lt;td>28 000&lt;/td>
&lt;td>83 300&lt;/td>
&lt;td>17 520&lt;/td>
&lt;td>&lt;strong>4,75&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>70 %&lt;/td>
&lt;td>28 000&lt;/td>
&lt;td>83 300&lt;/td>
&lt;td>24 528&lt;/td>
&lt;td>&lt;strong>3,39&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>80 %&lt;/td>
&lt;td>28 000&lt;/td>
&lt;td>83 300&lt;/td>
&lt;td>28 032&lt;/td>
&lt;td>&lt;strong>2,97&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>100 %&lt;/td>
&lt;td>28 000&lt;/td>
&lt;td>83 300&lt;/td>
&lt;td>35 040&lt;/td>
&lt;td>&lt;strong>2,38&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>&lt;strong>Escenario opex bajo&lt;/strong> (PPA solar, CPD propio, cluster grande): opex/año ~13 000 €.&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Utilización&lt;/th>
&lt;th>Coste total/año (€)&lt;/th>
&lt;th>&lt;strong>€/GPU-hora&lt;/strong>&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>50 %&lt;/td>
&lt;td>68 300&lt;/td>
&lt;td>&lt;strong>3,90&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>70 %&lt;/td>
&lt;td>68 300&lt;/td>
&lt;td>&lt;strong>2,78&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>80 %&lt;/td>
&lt;td>68 300&lt;/td>
&lt;td>&lt;strong>2,43&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>100 %&lt;/td>
&lt;td>68 300&lt;/td>
&lt;td>&lt;strong>1,95&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>&lt;strong>Escenario opex alto&lt;/strong> (tarifa mercado, colocation cara, cluster pequeño): opex/año ~75 000 €.&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Utilización&lt;/th>
&lt;th>Coste total/año (€)&lt;/th>
&lt;th>&lt;strong>€/GPU-hora&lt;/strong>&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>50 %&lt;/td>
&lt;td>130 300&lt;/td>
&lt;td>&lt;strong>7,44&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>70 %&lt;/td>
&lt;td>130 300&lt;/td>
&lt;td>&lt;strong>5,31&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>80 %&lt;/td>
&lt;td>130 300&lt;/td>
&lt;td>&lt;strong>4,65&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>100 %&lt;/td>
&lt;td>130 300&lt;/td>
&lt;td>&lt;strong>3,72&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;hr>
&lt;h2 id="del-gpu-hora-al-1m-tokens">Del €/GPU-hora al €/1M tokens&lt;/h2>
&lt;p>La identidad de coste por token conecta el coste de hardware con el coste de inferencia:&lt;/p>
&lt;p>$$\text{EUR/1M tokens} = \frac{\text{EUR/GPU-hora} \times 10^6}{\text{throughput (tok/s)} \times 3,600}$$&lt;/p>
&lt;p>Para throughputs de referencia en H100 SXM5 con vLLM (ver &lt;a href="https://blog.lo0.es/posts/capacity-planning-inferencia-llm-on-premise/">capacity planning de inferencia on-premise&lt;/a>):&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Modelo&lt;/th>
&lt;th>Throughput típico (tok/s por GPU)&lt;/th>
&lt;th>Fuente&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Llama-3 70B FP8, batch alto&lt;/td>
&lt;td>~2 800&lt;/td>
&lt;td>Benchmarks serie B&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Llama-3 8B FP16, batch medio&lt;/td>
&lt;td>~9 000&lt;/td>
&lt;td>Benchmarks serie B&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Mixtral 8×7B, batch alto&lt;/td>
&lt;td>~4 500&lt;/td>
&lt;td>Benchmarks serie B&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>&lt;strong>Tabla €/1M tokens en escenario base (€/GPU-hora 3,39 al 70 % de utilización):&lt;/strong>&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Modelo&lt;/th>
&lt;th>Throughput (tok/s)&lt;/th>
&lt;th>€/1M tokens&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Llama-3 70B FP8&lt;/td>
&lt;td>2 800&lt;/td>
&lt;td>&lt;strong>~0,336&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Llama-3 8B FP16&lt;/td>
&lt;td>9 000&lt;/td>
&lt;td>&lt;strong>~0,105&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Mixtral 8×7B&lt;/td>
&lt;td>4 500&lt;/td>
&lt;td>&lt;strong>~0,209&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>&lt;strong>Al 50 % de utilización (€/GPU-hora 4,75):&lt;/strong>&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Modelo&lt;/th>
&lt;th>€/1M tokens&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Llama-3 70B FP8&lt;/td>
&lt;td>&lt;strong>~0,471&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Llama-3 8B FP16&lt;/td>
&lt;td>&lt;strong>~0,147&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>La ocupación (batching) multiplica el throughput efectivo y baja el €/1M tokens sin cambiar el hardware; se analiza en &lt;a href="https://blog.lo0.es/posts/utilizacion-gpu-como-finops/">utilización GPU como palanca FinOps&lt;/a>.&lt;/p>
&lt;hr>
&lt;h2 id="break-even-on-prem-vs-cloud">Break-even on-prem vs cloud&lt;/h2>
&lt;h3 id="la-fórmula-del-break-even">La fórmula del break-even&lt;/h3>
&lt;p>El break-even se da cuando el coste total anual on-prem iguala el coste anual del cloud a igual utilización:&lt;/p>
&lt;p>$$\text{coste cloud anual} = \text{precio GPU-hora cloud} \times 4,\text{GPUs} \times 8,760,\text{h} \times u$$&lt;/p>
&lt;p>$$\text{break-even}: \quad \frac{\text{capex/año} + \text{opex/año}}{4 \times 8,760 \times u} = \text{precio GPU-hora cloud}$$&lt;/p>
&lt;p>Despejando la utilización de break-even:&lt;/p>
&lt;p>$$u^* = \frac{\text{capex/año} + \text{opex/año}}{4 \times 8,760 \times \text{precio GPU-hora cloud}}$$&lt;/p>
&lt;h3 id="tabla-de-break-even-por-modalidad-cloud-y-escenario-on-prem">Tabla de break-even por modalidad cloud y escenario on-prem&lt;/h3>
&lt;p>&lt;strong>Escenario base on-prem&lt;/strong> (capex/año 55 300 €, opex/año 28 000 €, total 83 300 €/año por nodo 4-GPU):&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Referencia cloud (precio/GPU-hora)&lt;/th>
&lt;th>USD equiv.&lt;/th>
&lt;th>Utilización break-even (u^*)&lt;/th>
&lt;th>Nota&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>Neocloud on-demand (Lambda/Spheron ~2,90 USD)&lt;/td>
&lt;td>2,90 USD (~2,70 €)&lt;/td>
&lt;td>&lt;strong>&amp;gt;100 %&lt;/strong> — el on-prem no compite&lt;/td>
&lt;td>El cloud on-demand de neocloud es más barato incluso a utilización plena&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Neocloud reserved 3 años (CoreWeave ~1,49–2,10 USD)&lt;/td>
&lt;td>~1,80 USD (~1,67 €)&lt;/td>
&lt;td>&lt;strong>&amp;gt;100 %&lt;/strong> — imposible&lt;/td>
&lt;td>El reserved neocloud supera al on-prem en cualquier escenario de este modelo&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>AWS p5 on-demand (6,88 USD/GPU-hora)&lt;/td>
&lt;td>6,88 USD (~6,40 €)&lt;/td>
&lt;td>&lt;strong>~47 %&lt;/strong>&lt;/td>
&lt;td>A más del 47 %, el on-prem medio bate a AWS on-demand&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>AWS p5 reserved 3 años (~2,97 USD/GPU-hora)&lt;/td>
&lt;td>2,97 USD (~2,76 €)&lt;/td>
&lt;td>&lt;strong>&amp;gt;100 %&lt;/strong>&lt;/td>
&lt;td>—&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>GCP A3 on-demand (~10,98 USD/GPU-hora)&lt;/td>
&lt;td>10,98 USD (~10,21 €)&lt;/td>
&lt;td>&lt;strong>~29 %&lt;/strong>&lt;/td>
&lt;td>A más del 29 %, el on-prem bate a GCP on-demand&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Azure ND H100 v5 on-demand (~12,29 USD/GPU-hora)&lt;/td>
&lt;td>12,29 USD (~11,43 €)&lt;/td>
&lt;td>&lt;strong>~26 %&lt;/strong>&lt;/td>
&lt;td>—&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>&lt;strong>Escenario opex bajo&lt;/strong> (total 68 300 €/año):&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Referencia cloud&lt;/th>
&lt;th>Utilización break-even&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>AWS p5 on-demand (6,88 USD ≈ 6,40 €)&lt;/td>
&lt;td>&lt;strong>~38 %&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Neocloud on-demand (2,90 USD ≈ 2,70 €)&lt;/td>
&lt;td>&lt;strong>~91 %&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Neocloud reserved 3a (1,80 USD ≈ 1,67 €)&lt;/td>
&lt;td>&lt;strong>&amp;gt;100 %&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>&lt;strong>Escenario opex alto&lt;/strong> (total 130 300 €/año):&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Referencia cloud&lt;/th>
&lt;th>Utilización break-even&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>AWS p5 on-demand (6,88 USD ≈ 6,40 €)&lt;/td>
&lt;td>&lt;strong>~72 %&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>GCP A3 on-demand (~10,21 €)&lt;/td>
&lt;td>&lt;strong>~45 %&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>Azure on-demand (~11,43 €)&lt;/td>
&lt;td>&lt;strong>~41 %&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;h3 id="lectura-de-la-tabla-de-break-even">Lectura de la tabla de break-even&lt;/h3>
&lt;ul>
&lt;li>Frente a &lt;strong>neoclouds&lt;/strong> (on-demand o reserved), el TCO on-prem &lt;strong>no cierra el break-even&lt;/strong> en ningún escenario del modelo base. El neocloud reserved bate al on-prem incluso a utilización del 100 %, porque su precio/hora es inferior al coste all-in del hardware propio. Esto es coherente con el análisis de &lt;a href="https://blog.lo0.es/posts/cloud-gpu-commitment-spot-neoclouds/">cloud GPU: on-demand, reserved y spot&lt;/a>.&lt;/li>
&lt;li>Frente a &lt;strong>hyperscalers on-demand&lt;/strong> (AWS, GCP, Azure), el on-prem sí tiene break-even alcanzable: en torno al &lt;strong>26–72 %&lt;/strong> de utilización según el escenario. A utilización media-alta (&amp;gt;70 %), el on-prem bate claramente a AWS/GCP/Azure on-demand.&lt;/li>
&lt;li>La variable que más mueve el break-even es el &lt;strong>opex&lt;/strong> (especialmente el personal), no el capex del hardware. Un cluster bien dimensionado en colocación barata con energía PPA puede bajar el umbral 20 puntos porcentuales respecto al escenario alto.&lt;/li>
&lt;li>Para datos RGPD, el break-even frente a hyperscalers estadounidenses está sesgado: el eje de soberanía descarta los hyperscalers US antes que el coste (ver &lt;a href="https://blog.lo0.es/posts/on-premise-soberano-vs-hyperscalers-datos/">on-premise soberano vs hyperscalers&lt;/a>).&lt;/li>
&lt;/ul>
&lt;div class="diagram" style="max-width:760px;margin:1rem auto;">
&lt;svg viewBox="0 0 760 260" role="img" aria-label="Break-even on-prem vs cloud segun utilización: el on-prem base cruza AWS on-demand al 47 por ciento, GCP al 29 por ciento y Azure al 26 por ciento de utilización. Los neoclouds no tienen break-even factible." xmlns="http://www.w3.org/2000/svg">
&lt;style>.ax{fill:none;stroke:currentColor;stroke-width:1}.cv{fill:none;stroke:currentColor;stroke-width:1.8}.dsh{fill:none;stroke:currentColor;stroke-width:1.2;stroke-dasharray:5 3}.ts{font:11px sans-serif;fill:currentColor}.tl{font:600 11.5px sans-serif;fill:currentColor}&lt;/style>
&lt;line class="ax" x1="60" y1="30" x2="60" y2="210"/>
&lt;line class="ax" x1="60" y1="210" x2="730" y2="210"/>
&lt;text x="22" y="125" class="ts" transform="rotate(-90 22 125)">€/GPU-hora&lt;/text>
&lt;text x="350" y="235" class="ts">utilización (%) →&lt;/text>
&lt;text x="65" y="226" class="ts">0&lt;/text>
&lt;text x="220" y="226" class="ts">30&lt;/text>
&lt;text x="375" y="226" class="ts">60&lt;/text>
&lt;text x="535" y="226" class="ts">90&lt;/text>
&lt;text x="700" y="226" class="ts">100&lt;/text>
&lt;line class="ax" x1="220" y1="207" x2="220" y2="213"/>
&lt;line class="ax" x1="375" y1="207" x2="375" y2="213"/>
&lt;line class="ax" x1="535" y1="207" x2="535" y2="213"/>
&lt;line class="ax" x1="700" y1="207" x2="700" y2="213"/>
&lt;path class="cv" d="M80,40 C150,65 250,110 375,148 C480,178 600,195 710,203"/>
&lt;text x="82" y="36" class="tl">on-prem (capex fijo)&lt;/text>
&lt;line class="cv" x1="60" y1="155" x2="730" y2="155"/>
&lt;text x="632" y="149" class="ts">AWS p5 OD (~6,40 €)&lt;/text>
&lt;line class="cv" x1="60" y1="190" x2="730" y2="190"/>
&lt;text x="620" y="186" class="ts">GCP OD (~10,21 €)&lt;/text>
&lt;line class="cv" x1="60" y1="200" x2="730" y2="200"/>
&lt;text x="620" y="198" class="ts">Azure OD (~11,43 €)&lt;/text>
&lt;line class="cv" x1="60" y1="95" x2="730" y2="95"/>
&lt;text x="632" y="91" class="ts">neocloud OD (~2,70 €)&lt;/text>
&lt;line class="dsh" x1="310" y1="30" x2="310" y2="210"/>
&lt;text x="272" y="48" class="tl">≈47 % (AWS)&lt;/text>
&lt;line class="dsh" x1="187" y1="30" x2="187" y2="210"/>
&lt;text x="148" y="48" class="ts">≈29 % (GCP)&lt;/text>
&lt;/svg>
&lt;/div>
&lt;hr>
&lt;h2 id="análisis-de-sensibilidad">Análisis de sensibilidad&lt;/h2>
&lt;h3 id="tco-vs-utilización">TCO vs utilización&lt;/h3>
&lt;p>El coste all-in por GPU-hora varía inversamente con la utilización porque el capex es fijo:&lt;/p>
&lt;p>$$\frac{d(\text{EUR/GPU-hora})}{du} = -\frac{\text{capex/año} + \text{opex/año}}{4 \times 8,760 \times u^2} &amp;lt; 0$$&lt;/p>
&lt;p>Pasar del 50 % al 80 % de utilización reduce el €/GPU-hora en (\frac{4{,}75 - 2{,}97}{4{,}75} \approx 37,%) en el escenario base. Esta reducción del 37 % no requiere ningún cambio de hardware; solo scheduling más eficiente (ver &lt;a href="https://blog.lo0.es/posts/utilizacion-gpu-como-finops/">utilización GPU como palanca FinOps&lt;/a>).&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Utilización&lt;/th>
&lt;th>€/GPU-hora (escenario base)&lt;/th>
&lt;th>Variación vs 50 %&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>30 %&lt;/td>
&lt;td>7,93&lt;/td>
&lt;td>+67 %&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>50 %&lt;/td>
&lt;td>4,75&lt;/td>
&lt;td>referencia&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>70 %&lt;/td>
&lt;td>3,39&lt;/td>
&lt;td>−29 %&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>80 %&lt;/td>
&lt;td>2,97&lt;/td>
&lt;td>−37 %&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>100 %&lt;/td>
&lt;td>2,38&lt;/td>
&lt;td>−50 %&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;h3 id="tco-vs-precio-de-energía">TCO vs precio de energía&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Precio energía (€/kWh)&lt;/th>
&lt;th>Opex energía/año&lt;/th>
&lt;th>€/GPU-hora (70 % util.)&lt;/th>
&lt;th>Variación vs base&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>0,034 (PPA solar)&lt;/td>
&lt;td>1 604 €&lt;/td>
&lt;td>&lt;strong>3,00&lt;/strong>&lt;/td>
&lt;td>−12 %&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>0,116 (industrial ES, base)&lt;/td>
&lt;td>5 475 €&lt;/td>
&lt;td>&lt;strong>3,39&lt;/strong>&lt;/td>
&lt;td>referencia&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>0,160 (Europa media)&lt;/td>
&lt;td>7 550 €&lt;/td>
&lt;td>&lt;strong>3,54&lt;/strong>&lt;/td>
&lt;td>+4 %&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>0,200 (tarifa alta)&lt;/td>
&lt;td>9 437 €&lt;/td>
&lt;td>&lt;strong>3,67&lt;/strong>&lt;/td>
&lt;td>+8 %&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>La energía tiene un impacto &lt;strong>moderado&lt;/strong> en el TCO total (8–12 % de variación frente a extremos), porque el capex del hardware domina. Sin embargo, a muy larga amortización (5 años) y PPA solar, la energía baja del 6 % al 1 % del TCO total y el diferencial se amplifica. El precio de la energía importa más para la huella de carbono (CSRD) que para el TCO cuando el capex es dominante.&lt;/p>
&lt;h3 id="tco-vs-pue">TCO vs PUE&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>PUE&lt;/th>
&lt;th>Overhead refrigeración&lt;/th>
&lt;th>Energía/año (0,116 €/kWh)&lt;/th>
&lt;th>€/GPU-hora (70 % util.)&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>1,15 (refrigeración líquida, nuevas instalaciones)&lt;/td>
&lt;td>+15 %&lt;/td>
&lt;td>2 166 €&lt;/td>
&lt;td>&lt;strong>3,21&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>1,20 (líquido, datacenter moderno)&lt;/td>
&lt;td>+20 %&lt;/td>
&lt;td>2 259 €&lt;/td>
&lt;td>&lt;strong>3,23&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>1,48 (instalaciones &amp;lt;5 años, Uptime 2025)&lt;/td>
&lt;td>+48 %&lt;/td>
&lt;td>3 490 €&lt;/td>
&lt;td>&lt;strong>3,33&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>1,54 (media global Uptime 2025)&lt;/td>
&lt;td>+54 %&lt;/td>
&lt;td>3 627 €&lt;/td>
&lt;td>&lt;strong>3,39&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>1,80 (colocación legacy)&lt;/td>
&lt;td>+80 %&lt;/td>
&lt;td>4 260 €&lt;/td>
&lt;td>&lt;strong>3,47&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>La diferencia entre PUE 1,15 (líquido) y 1,80 (legacy) es de apenas &lt;strong>~8 %&lt;/strong> en el €/GPU-hora al 70 % de utilización, porque la energía solo representa una fracción del TCO. El PUE importa mucho más para el &lt;strong>coste de energía absoluto&lt;/strong> y el &lt;strong>reporte CSRD&lt;/strong> que para el TCO total cuando el hardware es el componente dominante.&lt;/p>
&lt;h3 id="tco-vs-años-de-amortización">TCO vs años de amortización&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Amortización&lt;/th>
&lt;th>Capex/año (nodo medio, USD)&lt;/th>
&lt;th>€/GPU-hora (70 % util., escenario base opex)&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>3 años&lt;/td>
&lt;td>59 500 USD (~55 300 €)&lt;/td>
&lt;td>&lt;strong>3,39&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>4 años&lt;/td>
&lt;td>44 625 USD (~41 500 €)&lt;/td>
&lt;td>&lt;strong>2,99&lt;/strong>&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>5 años&lt;/td>
&lt;td>35 700 USD (~33 200 €)&lt;/td>
&lt;td>&lt;strong>2,72&lt;/strong>&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;p>Alargar la amortización de 3 a 5 años baja el €/GPU-hora en ~&lt;strong>20 %&lt;/strong>, asumiendo que el hardware sigue siendo competitivo y el mercado de reventa soporta el valor residual. Con el ciclo de refreshing acelerado por Blackwell GB200/GB300, una amortización a 5 años conlleva mayor riesgo de obsolescencia tecnológica.&lt;/p>
&lt;h3 id="mapa-de-calor-de-sensibilidad-gpu-hora-al-70--de-utilización-escenario-base">Mapa de calor de sensibilidad (€/GPU-hora al 70 % de utilización, escenario base)&lt;/h3>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>&lt;/th>
&lt;th>PUE 1,15&lt;/th>
&lt;th>PUE 1,54&lt;/th>
&lt;th>PUE 1,80&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>&lt;strong>Amort. 3 años, PPA solar (0,034 €)&lt;/strong>&lt;/td>
&lt;td>2,72&lt;/td>
&lt;td>2,74&lt;/td>
&lt;td>2,76&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Amort. 3 años, industrial (0,116 €)&lt;/strong>&lt;/td>
&lt;td>3,21&lt;/td>
&lt;td>3,39&lt;/td>
&lt;td>3,47&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Amort. 5 años, industrial (0,116 €)&lt;/strong>&lt;/td>
&lt;td>2,54&lt;/td>
&lt;td>2,72&lt;/td>
&lt;td>2,80&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Amort. 3 años, tarifa alta (0,200 €)&lt;/strong>&lt;/td>
&lt;td>3,44&lt;/td>
&lt;td>3,67&lt;/td>
&lt;td>3,78&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;hr>
&lt;h2 id="tabla-de-decisión-pareto-costecontrolsoberanía">Tabla de decisión: Pareto coste/control/soberanía&lt;/h2>
&lt;p>La tabla siguiente cruza las cuatro dimensiones sin jerarquía implícita; la lectura ordinal depende de las restricciones de cada organización.&lt;/p>
&lt;table>
&lt;thead>
&lt;tr>
&lt;th>Opción&lt;/th>
&lt;th>€/GPU-hora&lt;/th>
&lt;th>Capex inicial&lt;/th>
&lt;th>Control total stack&lt;/th>
&lt;th>Soberanía UE&lt;/th>
&lt;th>Elasticidad&lt;/th>
&lt;th>Riesgo operativo&lt;/th>
&lt;/tr>
&lt;/thead>
&lt;tbody>
&lt;tr>
&lt;td>&lt;strong>On-prem (util. &amp;gt;70 %, opex bajo)&lt;/strong>&lt;/td>
&lt;td>2,40–3,00&lt;/td>
&lt;td>alto (150–207 k USD/nodo)&lt;/td>
&lt;td>total&lt;/td>
&lt;td>total&lt;/td>
&lt;td>ninguna&lt;/td>
&lt;td>fallo hardware, idle&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>On-prem (util. &amp;lt;50 %, opex base)&lt;/strong>&lt;/td>
&lt;td>4,75–7,93&lt;/td>
&lt;td>alto&lt;/td>
&lt;td>total&lt;/td>
&lt;td>total&lt;/td>
&lt;td>ninguna&lt;/td>
&lt;td>capex sin retorno&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Neocloud reserved 3 años (CoreWeave, Lambda)&lt;/strong>&lt;/td>
&lt;td>1,49–2,10 USD&lt;/td>
&lt;td>ninguno&lt;/td>
&lt;td>parcial (API)&lt;/td>
&lt;td>depende del proveedor&lt;/td>
&lt;td>contrato rígido&lt;/td>
&lt;td>interrupción mínima&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Neocloud on-demand (Lambda, Spheron)&lt;/strong>&lt;/td>
&lt;td>2,49–3,44 USD&lt;/td>
&lt;td>ninguno&lt;/td>
&lt;td>parcial&lt;/td>
&lt;td>depende&lt;/td>
&lt;td>total&lt;/td>
&lt;td>sin interrupción&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>AWS p5 on-demand&lt;/strong>&lt;/td>
&lt;td>6,88 USD&lt;/td>
&lt;td>ninguno&lt;/td>
&lt;td>mínimo&lt;/td>
&lt;td>NO (CLOUD Act)&lt;/td>
&lt;td>total&lt;/td>
&lt;td>sin interrupción&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>AWS p5 reserved 3 años&lt;/strong>&lt;/td>
&lt;td>~2,97 USD&lt;/td>
&lt;td>compromiso financiero&lt;/td>
&lt;td>mínimo&lt;/td>
&lt;td>NO (CLOUD Act)&lt;/td>
&lt;td>rígida&lt;/td>
&lt;td>sin interrupción&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Cloud EU soberano (Scaleway, Nebius EU)&lt;/strong>&lt;/td>
&lt;td>2,15–3,85 USD&lt;/td>
&lt;td>ninguno&lt;/td>
&lt;td>parcial&lt;/td>
&lt;td>sí (UE)&lt;/td>
&lt;td>total&lt;/td>
&lt;td>sin interrupción&lt;/td>
&lt;/tr>
&lt;tr>
&lt;td>&lt;strong>Híbrido on-prem base + cloud EU pico&lt;/strong>&lt;/td>
&lt;td>2,00–3,50 (ponderado)&lt;/td>
&lt;td>medio&lt;/td>
&lt;td>alto&lt;/td>
&lt;td>sí (UE)&lt;/td>
&lt;td>pico elástico&lt;/td>
&lt;td>complejidad operativa&lt;/td>
&lt;/tr>
&lt;/tbody>
&lt;/table>
&lt;blockquote>
&lt;p>Columna &amp;ldquo;Soberanía UE&amp;rdquo;: los hyperscalers estadounidenses (AWS, GCP, Azure) están sujetos a la US CLOUD Act independientemente de la región del datacenter. Nebius tiene entidad legal neerlandesa; CoreWeave es empresa estadounidense. Ver análisis completo en &lt;a href="https://blog.lo0.es/posts/on-premise-soberano-vs-hyperscalers-datos/">on-premise soberano vs hyperscalers&lt;/a>.&lt;/p>
&lt;/blockquote>
&lt;blockquote>
&lt;p>Columna &amp;ldquo;Control total stack&amp;rdquo;: on-prem permite elegir versión de driver, kernel, configuración NCCL, particionado MIG, y cualquier parámetro del sistema. Las opciones cloud ofrecen control a nivel de contenedor/pod, con el hipervisor y el firmware opaco.&lt;/p>
&lt;/blockquote>
&lt;p>La frontera de Pareto coste/soberanía para datos RGPD excluye los hyperscalers US, dejando: &lt;strong>on-prem&lt;/strong>, &lt;strong>cloud EU soberano&lt;/strong>, y el &lt;strong>híbrido&lt;/strong>. Entre estos tres, la variable que decide es la utilización sostenida y la predecibilidad del tráfico (ver &lt;a href="https://blog.lo0.es/posts/capacity-planning-inferencia-llm-on-premise/">capacity planning de inferencia LLM on-premise&lt;/a>).&lt;/p>
&lt;hr>
&lt;h2 id="integración-con-el-modelo-finops-de-la-serie">Integración con el modelo FinOps de la serie&lt;/h2>
&lt;p>El €/GPU-hora all-in del on-prem es el número que alimenta el pipeline de cost allocation de la serie:&lt;/p>
&lt;ol>
&lt;li>&lt;strong>Identidad de coste por token&lt;/strong> (&lt;a href="https://blog.lo0.es/posts/coste-por-token-y-por-request/">coste por token y por request&lt;/a>): throughput del motor × €/GPU-hora → €/1M tokens.&lt;/li>
&lt;li>&lt;strong>Chargeback y showback&lt;/strong> (&lt;a href="https://blog.lo0.es/posts/opencost-cost-allocation-kubernetes/">chargeback y showback multitenancy GPU&lt;/a>): el €/GPU-hora all-in es el precio interno que se imputa a cada tenant del cluster multi-tenant.&lt;/li>
&lt;li>&lt;strong>Utilización como palanca&lt;/strong> (&lt;a href="https://blog.lo0.es/posts/utilizacion-gpu-como-finops/">utilización GPU como FinOps&lt;/a>): subir la utilización del 50 % al 80 % reduce el €/GPU-hora en un 37 % sin cambiar el hardware — el ROI más alto del FinOps on-prem.&lt;/li>
&lt;li>&lt;strong>Capacity planning&lt;/strong> (&lt;a href="https://blog.lo0.es/posts/capacity-planning-inferencia-llm-on-premise/">capacity planning de inferencia LLM on-premise&lt;/a>): el número de nodos a comprar depende del percentil de carga base que se quiere cubrir en hierro.&lt;/li>
&lt;li>&lt;strong>Comparativa cloud&lt;/strong> (&lt;a href="https://blog.lo0.es/posts/cloud-gpu-commitment-spot-neoclouds/">cloud GPU: on-demand, reserved y spot&lt;/a>): el €/GPU-hora all-in se enfrenta directamente al precio cloud de la tabla A7 para calcular el break-even.&lt;/li>
&lt;/ol>
&lt;hr>
&lt;h2 id="fuentes">Fuentes&lt;/h2>
&lt;ul>
&lt;li>Spheron · LLM Inference On-Premise vs GPU Cloud: 2026 Cost and Break-Even Analysis (abr. 2026) — &lt;a href="https://www.spheron.network/blog/llm-inference-on-premise-vs-cloud/">https://www.spheron.network/blog/llm-inference-on-premise-vs-cloud/&lt;/a>&lt;/li>
&lt;li>Introl · GPU Infrastructure TCO Model: 5-Year Cost Analysis for Enterprise AI (abr. 2026) — &lt;a href="https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model">https://introl.com/blog/gpu-infrastructure-tco-5-year-cost-model&lt;/a>&lt;/li>
&lt;li>GMI Cloud · NVIDIA H100 GPU Pricing: 2026 Rent vs. Buy Cost Analysis (abr. 2026) — &lt;a href="https://www.gmicloud.ai/en/blog/nvidia-h100-gpu-pricing-2026-rent-vs-buy-cost-analysis">https://www.gmicloud.ai/en/blog/nvidia-h100-gpu-pricing-2026-rent-vs-buy-cost-analysis&lt;/a>&lt;/li>
&lt;li>Uptime Institute · Global Data Center Survey 2025 (PDF oficial) — &lt;a href="https://datacenter.uptimeinstitute.com/rs/711-RIA-145/images/2025.Annual.Survey.Report.pdf">https://datacenter.uptimeinstitute.com/rs/711-RIA-145/images/2025.Annual.Survey.Report.pdf&lt;/a>&lt;/li>
&lt;li>Uptime Institute · Global Data Center PUE Stalls at 1.54 (comunicado, oct. 2025) — &lt;a href="https://mgrid.org/2025/10/01/uptime-institute-data-center-pue-stagnation-2025-liquid-cooling/">https://mgrid.org/2025/10/01/uptime-institute-data-center-pue-stagnation-2025-liquid-cooling/&lt;/a>&lt;/li>
&lt;li>GlobalPetrolPrices · Spain Business Electricity Price (sept. 2025) — &lt;a href="https://www.globalpetrolprices.com/Spain/electricity_prices/">https://www.globalpetrolprices.com/Spain/electricity_prices/&lt;/a>&lt;/li>
&lt;li>PV Tech · European Solar PPA Prices Fall Below 35 €/MWh in Q3 2025 (oct. 2025) — &lt;a href="https://www.pv-tech.org/european-solar-ppa-prices-fall-below-35-mwh-q3-2025/">https://www.pv-tech.org/european-solar-ppa-prices-fall-below-35-mwh-q3-2025/&lt;/a>&lt;/li>
&lt;li>Xi Computers · Supermicro SYS-821GE-TNHR 8U GPU Server Pricing (jun. 2026) — &lt;a href="https://www.xicomputer.com/Solutions/Data-Center-Servers/SYS-821GE-TNHR.asp">https://www.xicomputer.com/Solutions/Data-Center-Servers/SYS-821GE-TNHR.asp&lt;/a>&lt;/li>
&lt;li>Encoradvisors · Data Center Colocation Pricing 2026 — &lt;a href="https://encoradvisors.com/data-center-colocation-pricing/">https://encoradvisors.com/data-center-colocation-pricing/&lt;/a>&lt;/li>
&lt;li>CloudZero · H100 GPU Cost In 2026: Buy, Rent, and Cloud Pricing Compared — &lt;a href="https://www.cloudzero.com/blog/h100-gpu-cost/">https://www.cloudzero.com/blog/h100-gpu-cost/&lt;/a>&lt;/li>
&lt;li>Spheron · AI Inference Power Consumption and GPU Electricity Costs: 2026 Guide — &lt;a href="https://www.spheron.network/blog/ai-inference-power-electricity-cost-2026/">https://www.spheron.network/blog/ai-inference-power-electricity-cost-2026/&lt;/a>&lt;/li>
&lt;li>NVIDIA · DGX SuperPOD H100 Electrical Specifications (documentación oficial) — &lt;a href="https://docs.nvidia.com/dgx-superpod/design-guides/dgx-superpod-data-center-design-h100/latest/electrical.html">https://docs.nvidia.com/dgx-superpod/design-guides/dgx-superpod-data-center-design-h100/latest/electrical.html&lt;/a>&lt;/li>
&lt;/ul></description></item></channel></rss>