Новини

Штучний інтелект уперше навчили говорити живою українською, без застарілостей та цензури

Аби нейромережа не «спілкувалася» старомодно, до мовного корпусу додали субтитри сучасних фільмів, серіалів, блогів, твітів та інший контент із соцмереж.

Фото Unsplash.com

Штучний інтелект (ШІ) уперше навчили говорити українською мовою зі сленгом і без цензури. Це зробила креативна агенції ISD Group, пише AIN.ua.

Свою версію ШІ розробники створили на базі нейромережі GPT-2 від Hugging Face. Це дозволяє генерувати зв’язний текст, який максимально нагадує мову людей.

«Головним викликом було створити таку модель, яка зможе спілкуватися українською як звичайна людина, зі сленгом і без цензури», – розповідає гендиректор ISD Group Віктор Шкурба.

Спершу ШІ створили мовний корпус нейромережі з відкритих баз словників українських розробників. За основу для тренування взяли 3 гігабайти творів українською з онлайн-бібліотек. Доповнили генератор інструментами, які допомагають будувати контекст і вибирати правильну послідовність слів.

Аби нейромережа не «спілкувалася» старомодно, до мовного корпусу додали субтитри сучасних фільмів, серіалів, блогів, твітів та інший контент із соцмереж. Так, ШІ почав «говорити» сучасно та зі сленгом.

Вирішили не створювати нейтральну систему у форматі порадника, а піти далі й надати йому характер. 

«Це поганий хлопець, навіть трохи божевільний, який постійно підштовухує своїх друзів на якісь шалені вчинки», – пояснює Шкурба.

Для цього залучили молодь через відкриті ігрові телеграм-боти. Користувачі давали відповіді на запитання, чим навчали нейромережу спілкування.

 

Коментарі