FinOps de GPU/LLM: frameworks, métricas y estado del arte (ficha a ficha)

Qué cubre esta introducción

Segundo artículo de la serie de datos. Aquí se inventaría el tooling de FinOps para infraestructura GPU/LLM: qué métricas maneja, en qué fases opera y qué hace cada framework, ficha a ficha. Sin recomendaciones: la elección se decide en el artículo de síntesis con la tabla de Pareto; aquí solo están los hechos.


Métricas de FinOps

MétricaDefiniciónUnidad
CPM (coste/1M tokens)coste del cluster ÷ tokens producidos$ / 1M tok
Coste por peticióncoste imputado a una request$ / req
$/GPU-horacoste horario de una GPU (amortizado o alquiler)$/h
Utilizaciónfracción de la GPU realmente usada% (MFU, GPU-hour util)
Showbackreportar el coste a cada equipo (sin cobrar)$ / equipo
Chargebackimputar/cobrar el coste a cada equipo$ / equipo

Las tres fases de FinOps (FinOps Foundation)

FaseObjetivoAcción típica
Informvisibilidad y asignaciónmedir coste por namespace/equipo/producto
Optimizereducir el gastorightsizing, spot, cuotas, apagar lo ocioso
Operategobierno continuopresupuestos, alertas, chargeback automatizado

El estándar emergente para intercambiar datos de coste entre herramientas es FOCUS (FinOps Open Cost & Usage Specification), que normaliza el formato de facturación/uso.


Frameworks, ficha a ficha

HerramientaÁmbitoSoporte GPULicencia / modeloDiferenciador
OpenCostKubernetesSí (asignación por pod)Apache 2.0 (CNCF), gratisEstándar CNCF de asignación de coste en K8s
KubecostK8s + cloud (3.0)Sí, vía NVIDIA DCGM (Kubecost 3.0)Comercial sobre OpenCost (IBM)Rightsizing (Turbonomic), enterprise
CloudZeroMulti-cloud + unit economicsIndirecto (coste a feature/producto)ComercialMapea coste a features/productos/equipos
VantageMulti-cloud (20+ integraciones)Vía K8s/proveedorComercialAWS/Azure/GCP/K8s/Snowflake/Datadog/OpenAI
FinoutMulti-cloudVía K8s/proveedorComercialVirtual tagging (etiqueta sin tocar el recurso)

Notas de datos:

  • OpenCost mide CPU, memoria, GPU, almacenamiento y red por pod, lo valora al precio real del nodo y lo agrega por la dimensión que elijas (namespace, deployment, label), sin necesidad de un etiquetado upstream perfecto (CloudZero · Kubecost vs OpenCost).
  • Kubecost está construido sobre OpenCost; Kubecost 3.0 (2025) añadió monitorización de GPU vía NVIDIA DCGM e integración con IBM Turbonomic para rightsizing automático. IBM adquirió Kubecost e integró Kubecost/OpenCost en su FinOps Suite (CloudZero).
  • CloudZero/Vantage lideran en unit economics y reporting multi-cloud; Finout despliega más rápido con virtual tagging; CloudZero ofrece asignación más profunda (CloudZero · FinOps Tools).

Modelos de precio del tooling comercial

ModeloCómo cobraRango
Savings-based% de los ahorros entregados15–35 %
Fixed-fee% del gasto cloud anual1–3 %

(CloudZero · FinOps Tools)


Estado del arte 2026

  • Consolidación K8s: OpenCost es el estándar CNCF de asignación; Kubecost (IBM) el comercial de referencia para cargas Kubernetes, ya con GPU vía DCGM.
  • Del recurso al token: las plataformas fuertes de 2026 trackean el coste a nivel de token y de GPU, no solo de recurso; el coste/token es la métrica que permite comparar on-prem vs cloud (se desarrolla en el artículo A4 y en la síntesis).
  • FOCUS como capa de interoperabilidad de datos de coste entre herramientas.
  • La instrumentación GPU se apoya en DCGM (la misma base que la observabilidad — ver observabilidad GPU para inferencia LLM), y el reparto multi-tenant conecta con FinOps y multi-tenancy del cluster GPU.

Fuentes