Del vatio al carbono, honestamente: PUE, intensidad del grid y gCO₂ por token

Notación: importes en euros (N €), decimales con coma. No se usa el símbolo de dólar (en este sitio es delimitador de fórmula). Hardware de ejemplo genérico (4×H100 SXM 80 GB); sin infra real. Cifras de emisiones en gCO₂eq/kWh (equivalentes de CO₂).

TL;DR

Un modelo que consume 2 J/token en placa (4×H100 SXM, PUE 1,45) emite entre (0{,}08) y (1{,}05) gCO₂ por cada 1.000 tokens según la región y la hora: (0{,}08) en Francia nuclear de madrugada, (0{,}22) en España solar al mediodía, (0{,}72) en España con gas nocturno, y (1{,}05) en Alemania con carbón. La diferencia —factor ×13— la determinan tres variables externas al hardware: el PUE del datacenter (Uptime Institute 2025: media global 1,54; hiperscale 1,10–1,15), la intensidad de carbono del grid (varía en tiempo real, de 5 a 600+ gCO₂/kWh según zona y hora), y el tipo de emisiones que se contabiliza (location-based, market-based, marginal). Mover carga batch a horas de menor intensidad de carbono —carbon-aware shifting temporal— reduce entre un 20 % y un 65 % las emisiones del trabajo diferible sin tocar el hardware. La especificación SCI (Software Carbon Intensity, Green Software Foundation, ISO/IEC 21031:2022) formaliza la métrica como (\text{SCI} = (E \times I + M) / R), donde (M) captura el carbono embebido del hardware —la parte que casi ningún análisis de inferencia LLM incluye hoy—.


Contexto del track

Este artículo es el C6 del pilar de energía. Los anteriores:

El punto de partida es el J/token ya medido (metodología en C2 y herramientas en C3). Este artículo convierte ese número en gCO₂/token.


PUE: el primer multiplicador

Definición

El PUE (Power Usage Effectiveness) mide qué fracción de la energía total consumida por un datacenter llega realmente al equipamiento IT:

$$\text{PUE} = \frac{\text{energía total del datacenter (W)}}{\text{energía del equipamiento IT (W)}}$$

Un PUE de 1,0 sería perfecto (toda la energía al cómputo). Un PUE de 2,0 significa que por cada vatio que consume la GPU, otro vatio se consume en refrigeración, distribución eléctrica, iluminación y pérdidas de conversión. El PUE convierte la potencia de placa —la que miden DCGM o NVML— en la potencia total del datacenter que se extrae de la red.

Valores actuales

El Uptime Institute Global Data Center Survey 2025 (15.ª edición anual) reporta:

SegmentoPUE típicoFuente
Media global1,54 (6.º año consecutivo sin cambio)Uptime Institute 2025
Hiperscale (Google, Meta, Microsoft, Amazon)1,10–1,15Uptime Institute 2025
Colocación / enterprise1,58–1,80Uptime Institute 2025
On-premise sin optimizar1,6–2,0sector, varios
Límite teórico (aire frío, clima favorable)1,10–1,20ASHRAE / sector

La estagnación del PUE medio en 1,54 refleja que las instalaciones legacy —con refrigeración ineficiente— siguen operando junto a las nuevas. Para una plataforma on-premise típica sin inversión específica en eficiencia, asumir PUE entre 1,4 y 1,6 es razonable. Las instalaciones con refrigeración líquida directa pueden llegar a 1,10–1,20.

Cómo infla el J/token

Si el nodo de referencia (4×H100 SXM) consume 3.200 W a carga máxima (GPU + CPU + DRAM + fans):

PUEPotencia total datacenterFactor de inflación sobre placa
1,103.520 W+10 %
1,404.480 W+40 %
1,54 (media global)4.928 W+54 %
1,80 (enterprise legacy)5.760 W+80 %

La energía por token del leaderboard —medida a nivel de GPU o de nodo— no incluye PUE. El impacto: pasar de PUE 1,10 (hiperscale) a PUE 1,54 (media global) multiplica el consumo energético efectivo por 1,40×. Es la misma GPU, el mismo modelo, el mismo throughput; la diferencia la pone la instalación.

Potencia (W)PUE 1,03.200PUE 1,103.520PUE 1,404.480PUE 1,544.928PUE 1,805.760Nodo 4×H100 SXM a 3.200 W IT. Cada barra añade el overhead de refrigeración y distribución según PUE.

Intensidad de carbono del grid

Qué mide y por qué varía

La intensidad de carbono de la red eléctrica expresa cuántos gramos de CO₂eq se emiten por cada kilovatio-hora generado, en función del mix de fuentes (nuclear, eólica, solar, gas, carbón, hidráulica). Es la variable más heterogénea del cálculo: varía por país, por región dentro del país, y por hora del día.

Las herramientas OSS de referencia son:

HerramientaTipo de señalCoberturaAcceso
ElectricityMapsMedia horaria (production-based y flow-traced)60+ países en tiempo realAPI (plan gratuito limitado); OSS en GitHub
WattTimeMarginal horaria (MOER)EE.UU. + cobertura global crecienteAPI; datos gratuitos desde 2025 (alianza REsurety-WattTime)
Carbon Aware SDK (Green Software Foundation)Wrapper sobre ElectricityMaps y WattTimeIdem fuentesOSS, Apache 2.0; github.com/Green-Software-Foundation/carbon-aware-sdk

ElectricityMaps (anteriormente electricityMap) publica la intensidad de carbono en gCO₂eq/kWh hora a hora vía API y en su mapa interactivo (app.electricitymaps.com). WattTime publica la tasa marginal de emisiones (MOER, Marginal Operating Emissions Rate), útil para calcular el impacto causal de añadir o quitar carga. El Carbon Aware SDK de la GSF integra ambas señales como backends intercambiables.

Datos por país (medias anuales 2024–2025)

PaísIntensidad media 2024 (gCO₂eq/kWh)Rango horario aproximadoFuente
España~10830–250Nowtricity / REE 2025
Francia~21,7 (2024); ~19,6 (2025)5–80RTE Bilan Électrique 2025
Alemania~363 (2024); ~328 (2025)100–600Fraunhofer ISE 2025
UE media~213Ember European Electricity Review 2025

Francia tiene la intensidad más baja de Europa continental gracias a su parque nuclear (>90 % de generación baja en carbono en 2025, según RTE). España cerró 2024 con un récord histórico: 56,8 % de generación renovable, con una intensidad media de 108 gCO₂/kWh —entre las más bajas de la UE no nuclear—. Alemania, en transición acelerada pero todavía dependiente del lignito y el gas, triplica a España en intensidad media.

Variación horaria: el dato que más importa para el scheduling

Dentro de un mismo país, la variación horaria de la intensidad de carbono es enorme. Datos del grid review 2025 de ElectricityMaps para España:

Momento del díaCondición típicaIntensidad estimada (gCO₂eq/kWh)
Mediodía solar (11:00–15:00, verano)Solar cubre >40 % demanda30–80
Valle nocturno (02:00–06:00, verano)Solar cero; eólica variable80–180
Pico demanda (19:00–21:00, invierno)Gas como marginal180–280
Madrugada fría sin viento (invierno)Gas + ciclo combinado dominan220–300

La correlación precio-carbono en España es fuerte y negativa (coeficiente −0,70 en 2025 según ElectricityMaps): las horas baratas son también las más limpias, porque ambas están marcadas por la penetración de renovables. Las 477 horas con precios negativos en 2025 fueron también las horas de menor intensidad de carbono.

gCO₂/kWhhora del día →0h6h12h18h24h|||||300150mínimo solar (~50 gCO₂/kWh)gas nocturno (~150–200)Curva esquemática día verano España. Fuente: ElectricityMaps grid review 2025 + REE.

España vs Francia vs Alemania: impacto en gCO₂/token

Para anclar la diferencia en términos operativos, con el nodo de referencia (4×H100 SXM, throughput orientativo 1.000 tok/s a carga, PUE 1,45):

Energía por token en el datacenter:

$$E_{\text{DC}} = \frac{3{.}200\ \text{W} \times 1{,}45}{1{.}000\ \text{tok/s}} = 4{,}64\ \text{J/tok} = 1{,}29 \times 10^{-3}\ \text{Wh/tok}$$

País / horaIntensidad (gCO₂/kWh)gCO₂ por 1.000 tokensgCO₂ por 1M tokens
Francia (media 2025)19,60,02525,3
España solar (mediodía verano)~500,06464,5
España media 2024~1080,140139,3
España gas nocturno (invierno)~2200,284283,8
Alemania media 2025~3280,423423,0
Alemania pico carbón~5500,709709,0

El rango es de ×28 entre Francia media y Alemania pico. Entre los dos extremos horarios de España (solar vs. gas nocturno invierno) la diferencia es ×4,4. La elección del país y de la hora de ejecución mueve el carbono por token más que cualquier optimización de hardware o motor en ese rango.


Scope 2 y Scope 3: qué se contabiliza y qué no

Scopes del GHG Protocol

El GHG Protocol define tres alcances para las emisiones corporativas:

ScopeDefiniciónEjemplo en datacenter
Scope 1Emisiones directas de fuentes propias o controladasGeneradores diésel de emergencia
Scope 2Emisiones indirectas por consumo de electricidad compradaConsumo eléctrico del cluster
Scope 3Otras emisiones indirectas en la cadena de valorFabricación del hardware (embodied carbon)

Para una plataforma de inferencia on-premise, el Scope 2 es la partida dominante en operación; el Scope 3 upstream (fabricación de servidores y GPUs) es típicamente la segunda partida más grande en el ciclo de vida del hardware.

Scope 2: location-based vs market-based

El GHG Protocol Scope 2 Guidance (2015, en revisión pública 2025–2027) establece dos métodos de contabilización, ambos obligatorios en el reporte corporativo:

MétodoQué mideCómo se obtiene
Location-basedIntensidad real de la red eléctrica donde se ubica la instalaciónFactor de emisión de la red nacional o regional (publicado por operadores como REE, RTE)
Market-basedIntensidad según los instrumentos contractuales de compra de energíaGarantías de Origen (GdO), PPAs o tarifas con atributo renovable

La revisión en consulta pública (octubre 2025) propone exigir por primera vez la correspondencia horaria (hourly matching) para el método market-based: comprar 100 MWh de solar en un año no basta si se consumen en horas sin sol. El objetivo es que el market-based refleje la electricidad física y no solo los certificados contables.

Para un cluster de inferencia, el método location-based con intensidad horaria (no media anual) es el más informativo para operación carbon-aware: permite ver en tiempo real qué emisiones genera cada token.

Emisiones marginales vs medias

Esta distinción —documentada por ElectricityMaps y WattTime— es fundamental para evaluar el impacto real de decisiones de scheduling:

TipoDefiniciónCuándo usar
Media (average)Proporción de todas las emisiones del grid que corresponde al consumidor según su cuotaReporte de carbono Scope 2 location-based
Marginal (MOER)Emisiones del generador que respondería a un incremento marginal de cargaEvaluar el impacto causal de añadir o mover carga

Ejemplo doctrinal de ElectricityMaps: en un grid con 50 % eólica (0 gCO₂/kWh) y 50 % gas (500 gCO₂/kWh), la intensidad media es 250 gCO₂/kWh, pero el factor marginal es ~500 gCO₂/kWh (el gas es la planta que responde al incremento de demanda). Reducir carga evita 500 gCO₂/kWh, aunque el reporte Scope 2 registre solo 250 gCO₂/kWh.

Marginal y media nunca deben mezclarse en la misma contabilidad: representan paradigmas de atribución distintos (GHG Protocol y ElectricityMaps lo explicitan).

Scope 3: el carbono embebido del hardware

El carbono embebido (embodied carbon) es la huella de CO₂eq generada durante la fabricación, transporte y fin de vida del hardware. Para GPUs y servidores de alto rendimiento, esta partida es significativa:

ConceptoValor orientativoFuente
Vida útil de un servidor en datacenter3–5 añosAWS / sector
Vida útil de la instalación datacenter15–20 añossector
Metodología de amortizaciónEmbodied carbon / años de vida útilGHG Protocol / AWS methodology 2025
Embodied carbon de un servidor AI (orientativo)1.000–3.000 kgCO₂eq (cradle-to-gate)AWS Embodied Carbon methodology

El carbono embebido se amortiza sobre la vida útil del hardware: un servidor con 1.500 kgCO₂eq de embodied carbon y 4 años de vida útil aporta 375 kgCO₂eq/año de Scope 3, independientemente de cuánto se use. La tasa de utilización alta reduce el carbono embebido por token (el mismo hardware produce más valor funcional).

Ninguno de los leaderboards públicos de energía de LLM (HF AI Energy Score, ML.ENERGY, MLPerf Power) incluye el Scope 3 en sus métricas. La especificación SCI lo incorpora explícitamente.


La conversión completa: de J/token a gCO₂/token

La ecuación

$$\text{gCO}{2}\text{/token} = \frac{E{\text{placa}}\ [\text{Wh/tok}] \times \text{PUE} \times I_{\text{grid}}\ [\text{gCO}_{2}\text{/kWh}]}{1{.}000}$$

donde:

  • (E_{\text{placa}}) es la energía por token medida a nivel de GPU/nodo (sin PUE)
  • (\text{PUE}) multiplica por el overhead del datacenter
  • (I_{\text{grid}}) es la intensidad de carbono del grid en el momento de ejecución
  • La división por 1.000 convierte Wh a kWh

Para el nodo de referencia (4×H100 SXM, throughput 1.000 tok/s, consumo GPU+CPU+RAM 3.200 W, PUE 1,45):

$$E_{\text{placa}} = \frac{3{.}200\ \text{W}}{1{.}000\ \text{tok/s}} = 3{,}2\ \text{J/tok} = 8{,}9 \times 10^{-4}\ \text{kWh/tok}$$

Luego, aplicando PUE 1,45:

$$E_{\text{DC}} = 8{,}9 \times 10^{-4} \times 1{,}45 = 1{,}29 \times 10^{-3}\ \text{kWh/tok}$$

Y las emisiones:

$$\text{gCO}{2}/\text{tok} = 1{,}29 \times 10^{-3} \times I{\text{grid}}$$

Tabla completa por región y hora

EscenarioPUEIntensidad grid (gCO₂/kWh)gCO₂/1.000 tokgCO₂/1M tok
Francia media 20251,4519,60,02525,3
España solar (mediodía verano)1,45500,06464,5
España media 20241,451080,139139,3
España gas nocturno (invierno)1,452200,284283,8
Alemania media 20251,453280,423423,0
Alemania pico carbón1,455500,709709,0
España solar + PUE hiperscale1,12500,05050,0
España gas nocturno + PUE legacy1,802200,354354,0

El factor PUE importa más en los escenarios de alta intensidad: pasar de PUE 1,12 a 1,80 en Alemania pico carbón mueve el resultado de ~617 a ~860 gCO₂/1M tok (+39 %). En España solar, el mismo cambio de PUE mueve de 50 a 79 gCO₂/1M tok; la intensidad baja del grid amortigua el impacto del PUE deficiente.


Carbon-aware shifting: temporal y espacial

Principio y herramientas

El carbon-aware computing consiste en ejecutar carga flexible —batch, entrenamiento, fine-tuning, ingestión documental— cuando y donde la intensidad de carbono del grid es menor. La herramienta OSS de referencia es el Carbon Aware SDK (Green Software Foundation, Apache 2.0): un wrapper que consulta ElectricityMaps o WattTime y devuelve la intensidad actual y prevista para una zona y ventana temporal.

El SDK distingue dos tipos de shifting:

TipoDescripciónAplicable a
TemporalRetrasar o adelantar la ejecución dentro del mismo datacenter hasta una hora de menor carbonoBatch, entrenamiento, tareas diferibles con deadline holgado
EspacialMover la carga a una región geográfica con menor intensidad en ese momentoMulti-cloud o multi-datacenter; requiere replicación de modelo/datos

Para una plataforma on-premise en un único datacenter, solo el shifting temporal es inmediatamente aplicable. El shifting espacial requiere infraestructura multi-sitio.

Cuantificación del ahorro temporal

La investigación reciente (arXiv 2512.07799, 2512.08725; Microsoft Carbon-Aware Computing Whitepaper) cuantifica el ahorro de shifting temporal de carga batch:

Estudio / casoAhorro de emisionesCondiciones
Carga batch con shifting 24 h (simulación, varios grids)20–40 % de reducción de emisionesVentana de 24 h, grid con mezcla renovables-fósil
Entrenamiento ML con shifting contra previsión grid (Microsoft)~30 %Azure, shifting contra intensidad prevista
Heurísticas greedy vs óptimo (arXiv 2512.07799)≥ 90 % del óptimoSimple one-migration o greedy deferral
UBS + Microsoft, Azure Batch, ventana 24 hValidado con Carbon Aware SDKShifting temporal real en producción

Para España, donde la correlación precio-carbono es −0,70, el shifting a horas solares reduce simultáneamente el coste eléctrico y las emisiones por token. En los 477 horas con precio negativo registradas en 2025 (ElectricityMaps / REE), la intensidad de carbono era también mínima. La coincidencia entre hora limpia y hora barata hace que el scheduling carbon-aware no tenga coste de oportunidad económico en España: optimizar carbono y coste apuntan a la misma ventana horaria.

Cuantificación para el nodo de referencia

Para una tarea batch de 1 hora en el nodo de referencia (4×H100 SXM, 4.640 W totales con PUE 1,45), generando ~3.600 millones de tokens por hora:

EscenarioIntensidad (gCO₂/kWh)Emisiones por hora de batchAhorro vs ejecución no diferida
Sin shifting (España media)108501 gCO₂
Con shifting a hora solar (50 gCO₂/kWh)50232 gCO₂−54 %
Con shifting a hora gas nocturno (220 gCO₂/kWh)2201.021 gCO₂+104 % (peor momento)

El rango entre el peor y el mejor momento para ejecutar ese batch es ×4,4 en emisiones. El shifting a la hora más limpia disponible en una ventana de 24 horas en España evita típicamente entre el 40 % y el 60 % de las emisiones del trabajo diferible.


El estándar SCI: Software Carbon Intensity

Especificación

La Software Carbon Intensity (SCI) es una especificación de la Green Software Foundation, publicada como estándar ISO/IEC 21031:2022 y mantenida en GitHub (github.com/Green-Software-Foundation/sci). Define una tasa de emisiones de carbono por unidad funcional de software:

$$\text{SCI} = \frac{(E \times I) + M}{R}$$

donde:

SímboloSignificadoUnidades
(E)Energía consumida por el sistema software (servidores, red, dispositivos de usuario)kWh
(I)Intensidad de carbono de la energía consumida (location-based u otra declarada)gCO₂eq/kWh
(M)Carbono embebido del hardware, amortizado por tiempo de uso y porcentaje de utilizacióngCO₂eq
(R)Unidad funcional (el denominador que normaliza la tasa)por API call, por token, por usuario, etc.

Para una plataforma de inferencia LLM, (R) es naturalmente el token de salida o la query. El SCI en gCO₂eq/token incluye así los tres componentes que la mayoría de los análisis actuales omiten: PUE implícito en (E), intensidad horaria en (I), y embodied carbon en (M).

Diferencia clave respecto al cálculo simple

El cálculo (E \times I) (energía × intensidad de grid) es el Scope 2 operacional. El SCI añade (M), el Scope 3 del hardware, que tiene una estructura diferente:

$$M = \frac{\text{embodied carbon total (gCO2eq)}}{\text{vida útil (horas)}} \times \frac{\text{horas de uso}}{1} \times \frac{\text{recursos asignados}}{\text{recursos totales del servidor}}$$

Para un servidor AI con 1.500 kgCO₂eq de embodied carbon, 4 años de vida útil (~35.040 horas) y utilización del 80 %:

$$M_{\text{hora}} = \frac{1{.}500{.}000\ \text{gCO2eq}}{35{.}040\ \text{h}} \times 0{,}80 \approx 34\ \text{gCO2eq/h}$$

Con 3.600 millones de tokens por hora:

$$M_{\text{por token}} \approx \frac{34}{3{,}6 \times 10^{9}} \approx 9{,}4 \times 10^{-9}\ \text{gCO2eq/tok}$$

A esta escala, el embodied carbon por token es despreciable frente al Scope 2 operacional durante la operación. Sin embargo, (M) se vuelve dominante en dos casos: hardware subutilizado (baja utilización amplifica el coste por token) y hardware con ciclo de vida muy corto (chips reemplazados cada 2 años en vez de 4).

El SCI como métrica de referencia para el track

La especificación SCI y su extensión para IA (github.com/Green-Software-Foundation/sci-ai) están siendo adoptadas como métrica de referencia para reportar la huella de carbono de sistemas de IA en empresas sujetas a CSRD. Proporciona un denominador común —gCO₂eq por unidad funcional— que permite comparar arquitecturas, regiones y estrategias de scheduling sobre la misma base.


Límites del cálculo y honestidad

Ningún cálculo de gCO₂/token captura la realidad completa. Los límites del modelo expuesto en este artículo:

LímiteDescripción
Intensidad media anual vs horariaUsar la media anual del país como factor de emisión da un resultado estable pero ficticio. La intensidad varía ×4–10× intradía. Para reporting Scope 2 location-based con datos horarios, la diferencia puede ser del 30–50 % respecto a la media.
PUE estáticoEl PUE varía con la temperatura exterior (la refrigeración trabaja más en verano) y con la carga IT. El PUE declarado es una media; en días calurosos puede ser 10–20 % peor.
Throughput constanteEl cálculo usa throughput a carga máxima. En producción con variabilidad de demanda, el consumo no escala linealmente con el throughput; la eficiencia por token empeora con baja carga.
Scope 3 parcialEl carbono embebido aquí cubre solo el hardware IT. No incluye la construcción del edificio del datacenter, la fabricación de equipos de refrigeración, ni la cadena de suministro de la energía.
Factores de emisión nacionalesLos valores por país son medias anuales. Francia tiene variación intradiaria baja (nuclear domina); España y Alemania tienen variación alta. El factor nacional es útil para comparaciones de orden de magnitud, no para scheduling operativo.
Carbono embebido de las GPUsLos datos de lifecycle assessment de chips AI como H100 no son públicos. Las estimaciones se basan en modelos de área de die, que tienen incertidumbre ±30–50 %.
Shifting espacial omitidoEste artículo cubre solo shifting temporal. El shifting espacial (mover carga entre regiones) puede añadir otro 20–40 % de reducción pero requiere infraestructura multi-sitio.
Cooling water y otros impactosEl gCO₂eq no captura el consumo de agua de refrigeración (WUE, Water Usage Effectiveness), otro indicador de impacto ambiental relevante para zonas áridas como el sur de España.

Ver también


Fuentes