ПоглибленийІнформатика

Теорія ігор в ІТ

Алгоритм Мінімакс, рівновага Неша та як ШІ навчився блефувати в покер.

Звідки комп'ютер знає, як виграти?

Уявіть старі хрестики-нулики. Як комп'ютер завжди грає так, щоб не програти? Він використовує Алгоритм "Мінімакс". Комп'ютер спочатку В УЯВІ симулює абсолютно ВСІ можливі ходи на кілька кроків вперед, створюючи "Дерево рішень". Далі він завжди обирає ту гілку (хід), яка МІНІМІЗУЄ його максимальні втрати і максимально збільшує шанси на поразку опонента. Він просто прорахував математично, чим все закінчиться в майбутньому!

Рівновага Неша та Дилема В'язня

💡

Двох злочинців схопили копи і розсадили в різні камери і запропонували угоду (Дилема в'язня)! Якщо обидва мовчать — отримають по 1 року тюрми. Якщо один здасть іншого — зрадник виходить вільним, а інший сяде на 10 років! Якщо здадуть ОДИН ОДНОГО — обидва сядуть на 5 років. Геніальний математик Джон Неш довів математично, що найкраща логічна стратегія (хоч це парадоксально і погано для обох!) — ЗАВЖДИ ЗРАДЖУВАТИ! Цей закон зараз керує ціновою війною корпорацій і геополітикою.

Покер і Блеф Штучного Інтелекту

Приклад

Шахи легкі: штучний інтелект завжди бачить ВСІ фігури на дошці. Це гра з Повною Інформацією. Але Покер — це гра з Неповною Інформацією! Ти не бачиш, які карти у суперника! У 2017 році ШІ "Libratus" розгромив 4 найкращих гравців світу в Техаський Холдем. Машина навчилася БЛЕФУВАТИ. Алгоритми вчаться аналізувати ставки людей, розуміти блеф і створювати математично бездоганні, непередбачувані комбінації обману задля власної вигоди.