🚀 Presentamos SWE-Bench Pro, un nuevo punto de referencia para evaluar a los agentes de codificación de LLM en tareas reales de ingeniería de software de nivel empresarial. Este es el siguiente paso más allá de SWE-Bench: más duro, resistente a la contaminación y más cercano a los repositorios del mundo real.