покер играчи

Компютрите вече могат да побеждават професионалните покер играчи в директен сблъсък на Texas Hold’em без ограничение

26.05.2017

 

В битката на разума между хората и машините, компютрите отскоро са повдигнали летвата. Две нови покер програми за игра могат да играят срещу най-добрите професионални покер играчи в директен сблъсък на Texas Hold’em без ограничение – версия на покера без ограничения за размера на залозите.




покер играчи

Учени от Университета Алберта в Канада съобщават, че тяхната програма, известна като DeepStack, побеждава професионалните покер играчи и може да изиграе 3 000 ръце срещу всеки един. Програмата не е успяла да спечели всяка ръка – понякога късметът на равенството е бил срещу нея, но след като резултатите са били събрани, DeepStack е победила с 10 от 11 раздавания.

Учените, водени от Tuomas Sandholm от университета Карнеги Мелън в Питсбърг, наскоро разбиха четири елитни покер играчи в Texas Hold’em без ограничение с програма, наречена Libratus. Всеки състезател изигра 30 000 ръце срещу програмата по време на турнир, проведен през януари в Питсбърг. Libratus беше “много по-твърд от всеки човек, с когото някога съм играл”, каза професионалният покер играч Jason Les.

Преди това Michael Bowling – един от създателите на DeepStack – и неговите колеги създадоха програма, която може да играе версия с двама души на покера, в която размерът на залозите е ограничен. Програмата показа почти перфектни показатели, като беше статистически ненадмината в рамките на човешкия живот. Но покера без лимит е много по-комплексен, защото когато е разрешен размера на залога, има много повече вероятни действия.

За разлика от шаха, където и двамата играчи могат да видят всички пионки на масата, в покера има някаква скрита информация, а именно двете карти в ръката на всеки играч. Такива игри, известни като игри с непълна информация, са особено трудни за управление от компютрите.

За да усъвършенстват техниката на DeepStack, изследователите са използвали метод на машинно обучение, който формулира интуитивен смисъл за това кога да задържи ръката с картите и кога да ги фолдва. Когато настъпи реда за игра на програмата, тя сортира опциите за следващите няколко действия и решава какво да прави. В резултат на това DeepStack се доближава и прилича до голяма степен на човек.

Libratus прави изчисления върху стратегия за играта в самото начало и се адаптира към опонента, като открива недостатъци от тактиката му. В края на играта Libratus преминава към изчисление в реално време, по време на което усъвършенства методите си. Libratus е толкова производителен и гладен за ресурс, че изисква суперкомпютър за да може да работи, докато DeepStack може да работи и на лаптоп.

Обучението на компютрите, за да играят игри със скрита информация, като покера, в крайна сметка може да доведе до интересни приложения в реалния живот, като например биха могли да помогнат при бизнес преговори или търгове и биха могли да помогнат за предпазване от скрити рискове, например в киберсигурността.