Judge är mer än en eval, det är en primitiv för att lösa verkliga meningsskiljaktigheter. Framtiden för förtroende är transparenta, verifierbara AI-bedömningar.