Co stojí za botou OpenAI, která porazila nejlepšího světového hráče Dota

Minulý týden byla historie vytvořeno v říších Dota 2 a AI. Ve společnosti The International Dendi, jeden z nejlepších hráčů této hry, byl nemilosrdně poražen v 1v1 botem, dvakrát za sebou. Dotyčný robot byl vyroben OpenAI, spuštění Elon Musk.




Nyní můžete mít nějaké otázky. Co je Dota? Co je OpenAI? A proč je to dokonce důležité? Začít, Dota je bezplatná hra MOBA, kterou ovládáte Hrdinové a vaším cílem je zničit protivníky Starověký. Mnoho fanoušků Dota se může dopustit urážky až do poslední věty, protože tolik, kolik jsem Dota, pak jsem shrnul.





Hra je velmi komplex s velmi strmou křivkou učení. Před nějakou dobou jsem se pustil do mise, abych se naučil Dota, a trvalo mi týden, než jsem absolvoval základní Jak video, kde vysvětlují strategii hry, jaké zbraně, kouzla, hrdinové dělají a jak doléhat. A to dělá celek AI vs Dendi bitva důležitá, protože ukazuje, jak pokročilé AI a ML se staly. Podívejme se tedy, co to dělá botu a musíme se bát povstání AI.





Vzestup planety AI

AI stát se Skynetem je diskutabilní problém. Elon Musk věří že pokud nebudou udržovány pod kontrolou, Skynet jako scénář se pravděpodobně stane. Na druhou stranu, Mark Zuckerbergříká že AI je neškodná a nezpůsobí Doomsday Scenario. Elon Musk začal OpenAI s tímto cílem.

Zabránit zneužití AI a výzkumu AI, které se proti nám neobrátí. A já jsem na jeho straně.

Ale to není to, o čem jsme zde. Hlavním tématem je vědět, co pohánějí robota vyráběné OpenAI. Abych to pochopil, četl jsem několik výzkumných článků a blogů na toto téma a také jsem kontaktoval svého příteleAnmol Sharma kdo je výzkumník AI a ML.

Posílení učení

Toto je název technologie za botou OpenAI Dota. Než se do toho ponoříme, musíme pochopit, jak obecná AI, nebo konkrétně AI Videohry práce. AI je velmi správní období a obsahuje mnoho témat, jako je například strojové učení, hluboké učení a neuronové sítě. Pro hrubou definici umělé inteligence můžeme říci, že je to schopnost počítače poučit se z informací a rozhodovat se na základě toho. Čím více se učí, tím více se zvyšuje správnost rozhodnutí.



Jak se liší od běžných bot?

Bots obecně videohry mohou vypadat, že jsou inteligentní, ale nejedná se o skutečnou formu umělé inteligence. Téměř všechny tyto roboty ve hrách jsou programovány na základě sady Pokud ..Toto..Tak..To prohlášení. Prostě se řídí prohlášeními a přijímají opatření na základě podmínek uvedených v prohlášení.

Příklad Pokud..Else .. prohlášení pro AI bot

Výše jsem ukázal velmi jednoduchý příklad. Prohlášení v reálných hrách jsou mnohem složitější s podmínkami v podmínkách. Čím přesně jsou tato tvrzení definována a podrobnější, tím více se bude zdát inteligentní.





Odměny a tresty

V AI lingo se to, čemu říkáme bot, říká agent. Cílem je přimět agenta, aby se naučil, co chceme, aby se naučil. Agent se učí stejnou metodou, jakou se váš pes učí, prostřednictvím odměn a trestů. Kdykoli agent udělá chybu, bude potrestán a kdykoli udělá správný odhad nebo poskytne správnou odpověď, je odměněn. Prostřednictvím tohoto systému se agent učí spojovat akce, které by neměl dělat, aby se vyhnul trestu a provedl akci (nebo podobné akce), která poskytuje odměny.

Algoritmus je páteří AI

Pokud o tom pečlivě přemýšlíte, je to jako dělat rozhodnutí na základě určitých podmínek, podobně jako algoritmy. Jak jsem ukázal výše, herní bot, přicházející na výbušnou hlaveň, bude jednat podle algoritmu. Algoritmy v AI jsou zjevně nesmírně složité, což činí celý systém inteligentní.



Přicházíme k našemu OpenAI botu, podle vývojáři, naučila celou hru v čase 2 týdnů. Po celou dobu 2 týdnů to bylo online 24 × 7 a hrálo se proti jeho kopii. To je pozoruhodný milník vzhledem ke složitosti hry a skutečnosti, že by mohla porazit Dendi.





Proč zde ještě nejsou auta bez řidiče?

To byla jedna z prvních otázek, která mi přišla na mysl, když jsem slyšel o celé této události. Pokud se bota může naučit takovou hru a trénovat se až do bodu, kdy porazí špičkové hráče, proč stále ovládáme kolo. A to byla stejná otázka, jakou jsem zastřelil svému příteli, Pan Anmol Sharma, který také zkoumal auta bez řidiče. To je to, co řekl.

Ve hře, kterou vyvinul člověk, je počet proměnných menší. Navíc, pokud agent (bot) udělá chybu, nejhorším trestem je ztráta kola. Ve skutečném světě je jednou chybou smrt.

I když je Dota složitá hra, možné kombinace pohybů, kouzel a taktik, i když jsou stále nesmyslně velké, jsou stále omezené. A chyby jsou povoleny bez skutečného trestu. V případě agenta bez řidiče však mohou chyby vést k nebezpečným nehodám nebo dokonce ke smrti.

Waymo je nové autonomní auto pro rok 2017

Ve skutečném světě je počet proměnných, které agent musí sledovat, nekonečný a situace vznikající v důsledku těchto proměnných, jako je další auto, které se náhle mění pruh, skákání pro chodce před autem, jsou také nekonečné. Plus, as Jeremy Clarksonřekneme to, budou muset učinit morální a etická rozhodnutí, když budou na pokraji okamžité nehody (ačkoli jeho teorie není platná).





Budoucnost

Už víme, že robot řízený člověkem provádí vlastní operace. Dalším krokem jsou roboti ovládaní umělou inteligencí, kteří ji provádějí. A to je jen v lékařské oblasti. AI bude jistě dominantní novou technologií v příštích deseti letech v mnoha oborech. AI však lze také zneužít k nekalým účelům, jako je DDoS útoky, Ransomware Boti a hackování jiných PC nebo systémů korporací.

Poslední veřejná interakce robota nebyla tak plynulá

Co se týče hry Dota a dalších her, můžeme očekávat, že se takové inteligentní roboti budou vyrábět i pro jiné hry, proti nimž mohou hráči trénovat, aby hráli ještě lépe. A zmínil jsem se, že OpenAI bude dělat příští rok na 5v5? Takže jsem pryč, abych si vyčistil své dovednosti Dota, abych alespoň porazil vestavěné roboty. Divine Rapier přicházím!