🚀 Introductie van SWE-Bench Pro — een nieuwe benchmark om LLM-codingagenten te evalueren op echte, enterprise-grade software engineering taken. Dit is de volgende stap voorbij SWE-Bench: moeilijker, contaminatieresistent en dichter bij echte repositories.