Забудем про "alignment". Есть более глубокая проблема: мы не знаем, ИИ нас понимает или просто очень хорошо имитирует понимание. Когда он решает задачу, это результат осмысленного вывода или просто статистическое попадание "стохастического попугая"? И как мы вообще можем это проверить?