Qué cubre esta introducción
Segundo artículo de la serie de datos. Aquí se inventaría el tooling de FinOps para
infraestructura GPU/LLM: qué métricas maneja, en qué fases opera y qué hace cada
framework, ficha a ficha. Sin recomendaciones: la elección se decide en el artículo
de síntesis con la tabla de Pareto; aquí solo están los hechos.
Métricas de FinOps
| Métrica | Definición | Unidad |
|---|
| CPM (coste/1M tokens) | coste del cluster ÷ tokens producidos | $ / 1M tok |
| Coste por petición | coste imputado a una request | $ / req |
| $/GPU-hora | coste horario de una GPU (amortizado o alquiler) | $/h |
| Utilización | fracción de la GPU realmente usada | % (MFU, GPU-hour util) |
| Showback | reportar el coste a cada equipo (sin cobrar) | $ / equipo |
| Chargeback | imputar/cobrar el coste a cada equipo | $ / equipo |
Las tres fases de FinOps (FinOps Foundation)
| Fase | Objetivo | Acción típica |
|---|
| Inform | visibilidad y asignación | medir coste por namespace/equipo/producto |
| Optimize | reducir el gasto | rightsizing, spot, cuotas, apagar lo ocioso |
| Operate | gobierno continuo | presupuestos, alertas, chargeback automatizado |
El estándar emergente para intercambiar datos de coste entre herramientas es FOCUS
(FinOps Open Cost & Usage Specification), que normaliza el formato de facturación/uso.
Frameworks, ficha a ficha
| Herramienta | Ámbito | Soporte GPU | Licencia / modelo | Diferenciador |
|---|
| OpenCost | Kubernetes | Sí (asignación por pod) | Apache 2.0 (CNCF), gratis | Estándar CNCF de asignación de coste en K8s |
| Kubecost | K8s + cloud (3.0) | Sí, vía NVIDIA DCGM (Kubecost 3.0) | Comercial sobre OpenCost (IBM) | Rightsizing (Turbonomic), enterprise |
| CloudZero | Multi-cloud + unit economics | Indirecto (coste a feature/producto) | Comercial | Mapea coste a features/productos/equipos |
| Vantage | Multi-cloud (20+ integraciones) | Vía K8s/proveedor | Comercial | AWS/Azure/GCP/K8s/Snowflake/Datadog/OpenAI |
| Finout | Multi-cloud | Vía K8s/proveedor | Comercial | Virtual tagging (etiqueta sin tocar el recurso) |
Notas de datos:
- OpenCost mide CPU, memoria, GPU, almacenamiento y red por pod, lo valora al precio
real del nodo y lo agrega por la dimensión que elijas (namespace, deployment, label),
sin necesidad de un etiquetado upstream perfecto (CloudZero · Kubecost vs OpenCost).
- Kubecost está construido sobre OpenCost; Kubecost 3.0 (2025) añadió monitorización
de GPU vía NVIDIA DCGM e integración con IBM Turbonomic para rightsizing automático.
IBM adquirió Kubecost e integró Kubecost/OpenCost en su FinOps Suite (CloudZero).
- CloudZero/Vantage lideran en unit economics y reporting multi-cloud; Finout
despliega más rápido con virtual tagging; CloudZero ofrece asignación más profunda
(CloudZero · FinOps Tools).
| Modelo | Cómo cobra | Rango |
|---|
| Savings-based | % de los ahorros entregados | 15–35 % |
| Fixed-fee | % del gasto cloud anual | 1–3 % |
(CloudZero · FinOps Tools)
Estado del arte 2026
- Consolidación K8s: OpenCost es el estándar CNCF de asignación; Kubecost (IBM) el
comercial de referencia para cargas Kubernetes, ya con GPU vía DCGM.
- Del recurso al token: las plataformas fuertes de 2026 trackean el coste a nivel
de token y de GPU, no solo de recurso; el coste/token es la métrica que permite
comparar on-prem vs cloud (se desarrolla en el artículo A4 y en la síntesis).
- FOCUS como capa de interoperabilidad de datos de coste entre herramientas.
- La instrumentación GPU se apoya en DCGM (la misma base que la observabilidad — ver
observabilidad GPU para inferencia LLM), y
el reparto multi-tenant conecta con FinOps y multi-tenancy del cluster GPU.
Fuentes