Mohl by AlphaGo Bluffovat svou cestu pokerem?

Jeden z vědců zodpovědných za AlphaGo, software Google DeepMind, který nedávno porazil jednoho z nejlepších světových hráčů Go, říká, že stejný přístup může přinést překvapivě schopný pokerový bot .





Na rozdíl od deskových her jako Go nebo šachy je poker hrou s nedokonalými informacemi, a proto se ukázal být ještě odolnější vůči komputerizaci než Go.

Hra v pokeru zahrnuje vymýšlení strategie založené na kartách, které máte v ruce, a hádání, co je v rukou vašich soupeřů. Hráči pokeru se snaží číst chování ostatních u stolu pomocí kombinace statistik a jemnějších behaviorálních vodítek.

Umělá inteligence: je to druh magie.



Z tohoto důvodu může být vytvoření efektivního pokerového robota pomocí strojového učení důležité pro aplikace umělé inteligence v reálném světě. Hra je relevantní pro teorii her, která se týká situací zahrnujících vyjednávání a spolupráci.

Přestože je Go neuvěřitelně komplexní a jeho strategické principy nelze snadno zakódovat, AlphaGo alespoň mohl vidět každou část hry. AlphaGo použil kombinaci dvou technik umělé inteligence, hlubokého učení a hledání stromu, aby přišel s vítěznými Go pohyby. Učení s hlubokým posílením zahrnuje trénink velké neuronové sítě s pozitivními a negativními odměnami a hledání ve stromech je matematickou strategií, jak se ve hře dívat dopředu.

David Stříbrný , hlavní výzkumník AlphaGo a přednášející na University College London, zveřejnil papír na začátku tohoto měsíce popisující snahy o vybudování pokerového bota pomocí podobných technik.



Dohromady s John Henry , student výzkumu na UCL, Silver použil hluboké učení k vytvoření efektivní herní strategie jak v Leduc, zjednodušené verzi pokeru zahrnující balíček pouhých šesti karet, tak v Texas hold’em, nejoblíbenější formě hry. S Leduc dosáhl software Nashovy rovnováhy, což znamená optimální přístup definovaný teorií her. V Texas hold’em dosáhl výkonu expertního lidského hráče.

Mezitím tým výzkumníků z Oxfordské univerzity a Google DeepMind obrátil svou pozornost na dvě karetní hry inspirované fantazií – Magic: the Gathering a Hearthstone.

Tyto hry zahrnují hraní karet představujících různá kouzla, zbraně nebo stvoření proti protivníkům. Tato práce je mnohem předběžnější a jednoduše obsáhlá trénování neuronové sítě pro interpretaci informací zobrazených na každé kartě , který může být buď strukturovaný, jako v konkrétní barvě nebo čísle, nebo nestrukturovaný, jako v textu popisujícím, co se stane, když je karta zahrána.



Přesto tým společnosti Google pro umělou inteligenci zjevně neskončil s vytvářením nadlidských herních robotů.

(Přečtěte si více: Kotaku , Opatrovník , Pět lekcí z historického vítězství AlphaGo)

skrýt