
Чи здатні генеративні системи штучного інтелекту, такі як ChatGPT, до справжньої креативності — це питання стало предметом масштабного дослідження під керівництвом професора Каріма Джербі з Монреальського університету. До команди також увійшов Йошуа Бенхіо — один із піонерів глибинного навчання та професор того ж університету. Разом вони провели найбільше на сьогодні порівняння людської креативності та творчих здібностей великих мовних моделей.

Результати, опубліковані в журналі Scientific Reports, засвідчили важливий зсув. Деякі системи генеративного ШІ досягли рівня, за якого вони можуть перевершувати середньостатистичну людину у визначених тестах креативності. Водночас дослідження чітко показало, що найкреативніші люди все ще значно випереджають навіть найпотужніші моделі ШІ.
У межах роботи дослідники порівняли результати кількох великих мовних моделей — зокрема ChatGPT (GPT-4), Claude, Gemini — з даними понад 100 000 учасників-людей. Деякі моделі отримали вищі бали, ніж середній людський показник, у завданнях на «дивергентну лінгвістичну креативність».
Професор Карім Джербі зазначає: «Наше дослідження показує, що деякі системи штучного інтелекту тепер можуть перевершити середню людську креативність у чітко визначених завданнях». Водночас він підкреслює, що верхній рівень людської творчості залишається недосяжним для машин.
Подальший аналіз, проведений разом із постдокторантом Антуаном Бельмар-Пепеном та дослідником Франсуа Леспінассом з Університету Конкордія, показав, що найкреативніша половина людей стабільно перевершує всі протестовані системи ШІ. Різниця стає ще більш разючою серед 10 % найкреативніших учасників.
Для об’єктивного порівняння дослідники використали Завдання на дивергентні асоціації (DAT) — психологічний тест, розроблений Джеєм Олсоном з Університету Торонто. DAT оцінює здатність генерувати семантично віддалені ідеї, наприклад добір десяти максимально несхожих слів. Цей інструмент добре корелює з іншими тестами креативності та застосовується як до людей, так і до ШІ.
Окрім словесних асоціацій, команда перевірила творче письмо — написання хайку, сюжетів фільмів і коротких оповідань. І тут повторилася та сама закономірність: ШІ іноді перевершує середнього учасника, але досвідчені людські автори зберігають чітку перевагу.
Окрему увагу дослідники приділили питанню керованості креативності ШІ. Виявилося, що такі параметри, як «температура моделі», суттєво впливають на результат: вищі значення стимулюють ризикованіші та оригінальніші ідеї, тоді як нижчі — більш передбачувані відповіді. Також важливу роль відіграє формулювання підказок, зокрема звернення до етимології та структури слів.
У підсумку дослідження пропонує збалансований погляд на майбутнє творчості. «Генеративний ШІ не замінить творців, а радше змінить спосіб, у який вони уявляють, досліджують і створюють», — наголошує Карім Джербі.
Отже, результати вказують не на протистояння людей проти машин, а на нову модель співпраці, у якій штучний інтелект стає інструментом посилення людської уяви, а не її заміною.
ШІ досяг середнього рівня людської креативності з’явилася спочатку на Цікавості.

2595