Про те, як працюють нейромережі, чи можна вважати творіння ШІ мистецтвом та що таке мистецький твір, роздумує у колонці інженер машинного навчання і письменник Андрій Тужиков.
Останні роки дедалі більше ми зустрічаємо у стрічці новин заголовки на кшталт «Штучний інтелект допише Десяту симфонію Бетховена », «Алгоритми машинного навчання пишуть замітки замість журналістів», «AI пише картини, які продаються на аукціоні». У часи першої індустріальної революції, коли машини лише почали витісняти людську працю, ми ще могли з цим миритися, адже автоматизувалася нудна, монотонна та механічна праця. Нині бачимо, що сучасні технології зазіхають на експертизу, яка подекуди перевищує компетенції людини, наприклад, діагностування онкозахворювань та прогноз фінансових ринків. Саме такий стрімкий розвиток та гучні, подекуди гіперболізовані, заголовки створюють ілюзію, що штучний інтелект — це автономна свідома сутність, яка у вільний час пише картини та музику, немов нагадуючи, що SkyNet та агент Сміт не за горами. Насправді це не зовсім так. Я не буду детально розповідати, як саме працюють алгоритми машинного навчання, наукпопу на цю тему достатньо, але декілька важливих тез, допускаючи певні грубі спрощення, все ж нагадаю.
1. Перевага машин лише в одному — вони швидко рахують. Дуже швидко. Все решта — надбудова над цією перевагою.
2. Штучний інтелект — це свого роду назва-комплімент для класу алгоритмів, які імітують когнітивну діяльність людини: розпізнавання зображень, генерація тексту, пошук неочевидних закономірностей.
Від «класичного» програмування ці алгоритми відрізняються тим, що програміст не наказує машині, що та у якій послідовності робити. Він дає їй лишень можливість навчитися самостійно знайти правильну відповідь.
Наприклад, ми хочемо навчити комп’ютер відрізнити грушу від яблука. Як я вже казав, машини нічого не вміють, окрім як швидко здійснювати декілька математичних операцій. Без алгоритмів машинного навчання програміст був би змушений самостійно написати всі правила, які відрізняють яблуко від груші: колір пікселів, геометрична форма, текстура. Перебрати всі можливі варіанти не так легко. Тому у машинному навчанні ми просто показуємо алгоритму тисячі яблук і кажемо, що це є яблука, а потім тисячі груш, і кажемо, що це груші. Різні складні (і не дуже) математичні трюки відповідають за цей процес навчання так, щоб під час кожної нової демонстрації машина вдосконалювала свій навик відрізняти ці два фрукти. Й ось, коли все готово, ми беремо фото щойно зірваної груші, яку ми ще не встигли показати алгоритму, і він каже, що це груша з точністю 95%.
3. Майже досконало навчена розпізнавати котиків та песиків нейромережа ламається, якщо їй показати білку, яку вона не бачила під час тренування. Вона скаже, що це кіт з імовірністю 30%. Це говорить про те, що сам алгоритм не має розуміння, що таке сутність «кіт» та «пес». Для нього це просто купа чисел, які представляють пікселі, які своєю чергою є фотографією білки. Тож у нього немає суб’єктивного досвіду, який необхідний бодай для саморефлексії.
4. Навчання нейромережі — це не магічний ритуал, а просто тривалий, навіть для машин, процес математичних обрахунків дуже великого обсягу чисел. Наприклад, одна з останніх моделей для обробки природної мови від організації OpenAI GPT-3 має 178 мільярдів параметрів (тобто факторів, які впливають на прийняття остаточного рішення).
Отже, чи можемо ми сказати, що навіть якщо вчити писати або малювати нейромережу, вона виявляє якийсь мистецький хист? Навіть якщо ми маємо чітке розуміння, як відбувається цей процес «творення» з точки зору математики, питання все ще відкрите. Адже ми намагаємося натягнути розуміння «людського» акту творення на безпристрасний детермінований процес, у якому (майже) немає місця випадковості. Тому, починаючи відповідь на це запитання, варто поміркувати над означенням «людського» акту творення, його генезу і компонентів цього процесу, щоб віднайти спільні знаменники.
Означивши мистецтво як фізичну інтерпретацію внутрішніх переживань однієї особи або групи, ми приходимо до висновку, що самим драйвом цього фізичного акту є певна внутрішня рефлексія чи переживання, яка спонукає до дій і кристалізується у конкретну форму мистецького твору. Тут варто зазначити, що історично вже визначили види такої діяльности, які умовно належать до групи «мистецтво» та «не-мистецтво». Тобто ми бачимо намір, який є основним джерелом генерації мистецького твору. Цей намір майже завжди усвідомлений. Тут ми приходимо до питання свідомости — непростого філософського питання, упершись в яке, ми можемо лише будувати гіпотези. Виходячи з гіпотези, що основна відмінність між нами й машинами є не інтелект (адже автопілот Тесли має його достатньо, аби безпечно проїхати відстань між двома містами через затори та автобани), а свідомість.
Однак гляньте на це «полотно»:
Це одна з робіт серії «Сімейство Беламі», яку створила нейромережа класу GAN. Позбавлений свідомости (але не інтелекту) алгоритм продемонстрував роботу, яку продали на аукціоні за 432 тисячі доларів. Погодьтеся, не кожен «живий» художник, представник вуглецевої форми життя, може досягти такої високої фінансової оцінки своєї роботи. І з власних досягнень самого алгоритму тут те, що він переглянув та опрацював близько 15 тисяч портретів, датованих від XIV до XX століття.
Для створення мистецького твору (неважливо, новаторського чи просто якісного), митцеві необхідно опиратися на досвід своїх попередників, розуміти, що вже зробили у тому чи іншому жанрі мистецтва, переймати досвід тощо. Йдеться про, наприклад, те, що митці епохи Ренесансу надихалися мистецтвом Античности, а без методу лінійної перспективи, яку почали застосовувати в епоху того ж Ренесансу, важко уявити багато наступних творів образотворчого мистецтва. Або ж навпаки, якщо говорити про модернізм, то без знання та розуміння мистецтва попередніх поколінь митців тим же модерністам не було би що заперечувати своїми творами.
Тож якщо відштовхуватися від думки, що митець повинен бути знайомий із досвідом своїх попередників, то було б цілком логічно та справедливо вважати штучний інтелект повноцінним митцем, якщо його «натренувати» достатньою кількістю творів мистецтва (в цій категорії він навіть може перевершити митця-людину, адже не кожна людина зможе опрацювати такий масив інформації, як це може зробити ШІ). Однак якщо все ж ідеться про мистецтво, то варто сказати, що якщо машину натренують інформацією і вона певним чином здобуде цей досвід та так звану наглянутість, набаченість, то їй буде недоступний певний емоційний досвід, який є важливим для митця-людини. Тож машина зможе лише механічно «натренуватися», певним чином «побачити» мистецький твір, але аж ніяк не зможе його осягнути.
Однак нам це здаватиметься мистецьким твором, бо ми не можемо ні заперечити, ні довести в алгоритмі наявність суб’єктивного досвіду. Проведімо уявний експеримент, який зветься «Китайська кімната», опублікований 1990 року у популярній статті «Is the Brain’s Mind a Computer Program?» («Чи є мислення комп’ютерною програмою?»).
Уявіть, що вас помістили в ізольовану кімнату, яка має маленьке віконце — єдиний спосіб спілкуватися з навколишнім світом. Всередині кімнати ви маєте нескінченно довгий перелік правил, які пояснюють закономірність поєднання символів китайської мови та які ієрогліфи потрібно висунути у віконце назад. Абсолютно не знаючи китайської мови та користуючись правилами, ви отримуватимете зовні ієрогліфи, знаходитимете таку послідовність у своєму переліку правил та віддаватимете необхідні ієрогліфи назад через віконце. У людей назовні виникне ілюзія, що вони спілкуються з китайськомовною людиною, хоча ви й гадки не маєте не лише про контекст розмови, а й про якісь базові граматичні правила цієї мови.
Те саме і з роботами серії «Сімейство Беламі»: ми сприймаємо її як «картину» у мистецькому сенсі цього слова, тоді як для нейромережі це просто набір пікселів, які з’явилися як певні правила перетворень з інших пікселів (побачених оцифрованих картин «реальних» художників).
Ми приходимо до висновку, що у нас зовсім немає проблем зі створенням нового мистецького твору: тексти, музика, зображення, сценарії — це все може згенерувати ШІ. Однак чи є він митцем? Відкрите питання, у якому радше варто схилятися до зміни формулювання. Інженери та/або митці створили мистецький твір завдяки бездушному інструменту (такому ж як і пензель, просто набагато складнішому) — алгоритмам штучного інтелекту. Однак даючи таку відповідь та безапелятивно забравши у ШІ право бути митцем, ми відкриваємо іншу скриньку Пандори. Де є ця якість, яка робить нас усвідомленими істотами з наміром, на відміну від роботів із Boston Dynamics? Який орган або ділянка мозку дає нам ексклюзивне право на усвідомлений акт творіння? І чи є він взагалі чи це «ілюзія»?
Колонка є відображенням суб’єктивної позиції автора. Редакція «Шпальти» може не поділяти думку, висловлену у матеріалі.