Штучний інтелект уперше навчили говорити живою українською, без застарілостей та цензури

24.07.2020 09:23

1 095

Аби нейромережа не «спілкувалася» старомодно, до мовного корпусу додали субтитри сучасних фільмів, серіалів, блогів, твітів та інший контент із соцмереж.

Фото Unsplash.com

Штучний інтелект (ШІ) уперше навчили говорити українською мовою зі сленгом і без цензури. Це зробила креативна агенції ISD Group, пише AIN.ua.

Свою версію ШІ розробники створили на базі нейромережі GPT-2 від Hugging Face. Це дозволяє генерувати зв’язний текст, який максимально нагадує мову людей.

«Головним викликом було створити таку модель, яка зможе спілкуватися українською як звичайна людина, зі сленгом і без цензури», – розповідає гендиректор ISD Group Віктор Шкурба.

Спершу ШІ створили мовний корпус нейромережі з відкритих баз словників українських розробників. За основу для тренування взяли 3 гігабайти творів українською з онлайн-бібліотек. Доповнили генератор інструментами, які допомагають будувати контекст і вибирати правильну послідовність слів.

Аби нейромережа не «спілкувалася» старомодно, до мовного корпусу додали субтитри сучасних фільмів, серіалів, блогів, твітів та інший контент із соцмереж. Так, ШІ почав «говорити» сучасно та зі сленгом.