Система тренується за допомогою дій та спостережень.
Лондонська компанія DeepMind, дочірнє підприємство Alphabet, створила систему навчання MuZero. Саме вона перемагає в іграх навіть без знання їх правил. Наприклад, у шахах.
Про це повідомляє Spectrum.
У виданні пояснили, що система робить різні дії та таким чином тренується, а згодом спостерігає за нагородами, які вона отримує. Наприклад, у шахах треба поставити мат, а у Pac Man — проковтнути жовту крапку. Аби покращувати свої вміння, система змінює методи гри.
Навчання за допомогою спостереження підходить для будь-якого штучного інтелекту, що має вирішити складні проблеми.
До речі, радимо вам прочитати колонку інженера машинного навчання і письменника Андрія Тужикова. Він писав про те, як працюють нейромережі, чи можна вважати творіння штучного інтелекту мистецтвом та що таке мистецький твір.
Також нагадаємо, що штучний інтелект уперше навчили говорити українською мовою зі сленгом і без цензури. Це зробила креативна агенції ISD Group.