Креативность ИИ. Правда которую открыл эксперимент ученых

Мы привыкли думать, что искусственный интеллект вот-вот отберет кисть у художника и перо у поэта. Но масштабное исследование, опубликованное в Nature Human Behaviour, ставит под сомнение саму природу машинного творчества. По крайней мере в ближайшем будущем. Ученые из США и Гонконга совместно провели беспрецедентный эксперимент, сравнив 215 000 тестов AI с результатами 9 000 живых людей. Вывод оказался слегка неожиданным. Нейросети научились блестяще имитировать средний уровень креативности, но они бессильны перед настоящими человеческими озарениями. Статистика обмана. Как AI победил толпу На первый взгляд, цифры говорят в пользу машин. В тесте на дивергентное мышление (нужно назвать 10 максимально далеких друг от друга по смыслу слов) ChatGPT-4 Turbo набрала 81.78 балла. Для сравнения, средний результат человека колеблется в районе 78–80. Другие модели тоже показали себя достойно: Казалось бы, победа за машинами. ИИ статистически обходит большинство обывателей, выдавая стабильно качественные ассоциации. Но дьявол кроется в деталях распределения. Феномен Лучших. Где ломается алгоритм Картина кардинально меняется, если отсечь середнячков и посмотреть на элиту. Лучшие 10% креатива у людей уверенно обошли лучшие 10% генераций ChatGPT-4 Turbo. Разница оказалась статистически значимой (p < 0.001). В чем секрет? У людей колоссальная дисперсия. Мы способны выдавать откровенно глупые ответы, но в моменты озарения наш мозг рождает уникальные, прорывные результаты. Нейросети же зажаты в золотой середине. Они боятся рисковать. Их креативность создается, как безопасный путь по протоптанным статистическим дорожкам. Кроме того, словарный запас AI оказался скудным на уникальность. Пока люди доставали из глубин разума редкие понятия, модели зацикливались на клише вроде happiness (счастье) или freedom (свобода), повторяя их из раза в раз. Креативная мимикрия и ловушка Зефира Ученые ввели термин - креативная мимикрия. Это когда LLM не понимают смысла слов, они просто манипулируют вероятностями. Проще говоря это не творчество, а жонглирование словами. Яркий пример тому - поведение Claude. При низком показатели параметров случайности модель 485 раз из 750 выдала слово zephyr (зефир/западный ветер). Видимо, в её весах это слово помечено как очень редкое и красивое. Но стоило повысить параметры, как zephyr исчез, уступив место банальному freedom. Модели мечутся между двумя крайностями - либо безопасная банальность, либо (при высоких параметрах) полная галлюцинация и бессмыслица. У них нет человеческого чувства меры и вкуса. Провал Стива Джобса и цифровые предрассудки Исследование разрушило миф о всесилии промпт-инжиниринга. Популярный трюк - Представь, что ты Стив Джобс не сделал модель гениальнее. Наоборот, результаты ухудшились. AI просто сузил свой лексикон до IT-терминов, вместо того чтобы перенять способ мышления Джобса. Еще страшнее оказались демографические эксперименты, вскрывшие подсознание нейросетей: Это зеркало наших собственных предрассудков, на которых обучались модели. Они не расисты и не сексисты сами по себе, они лишь эхо интернета. Вывод. Рутина для роботов, прорывы для людей Практический вывод исследования отрезвляет. Нейросети - это идеальный инструмент для того, чтобы поднять двоечника до уровня хорошиста. Они отлично справляются с рутинным креативом - написать типичный пост, составить средний план, накидать базовые идеи. Но если вам нужен прорыв, идея на миллион, или сенсационное открытие, то тут AI вам не помощник. Пики человеческого мышления всё еще недосягаемы для алгоритмов. И возможно, именно эта способность совершать нелогичные, рискованные скачки в мышлении останется нашим главным преимуществом перед ИИ.