"Мы обнаружили причинные нейронные особенности, которые определяют рискованные и ориентированные на безопасность поведения, доказав, что эти паттерны не являются лишь артефактами, специфичными для задачи, а представляют собой фундаментальные механизмы принятия решений, и продемонстрировали конкретные методы вмешательства через активацию патчей."