Evals para LLMs: la capa después del tracing que decide si tu modelo rinde o sólo parece rendir25 may. 2026