Este é um caso de uso incrível para evals. Os clientes devem sempre obter as implementações de modelos da mais alta qualidade, e os dados são a melhor maneira de diferenciar. Fico feliz que o openbench tenha sido útil aqui 🫡🫡