3.2 ŠPÁS a SUP - počítače z krabiček od zápalek

  • Obsah
  • Metodika
Načítám ...

Metody

Provádění pokusů, pozorování, diskuze.

Metody a formy

Forma a popis realizace

Jednotlivci hrají piškvorky 3×3 proti počítači vytvořenému z krabiček od zápalek, čím více zápasů odehrají, tím lépe dokáže počítač reagovat.

Obsah

Nyní máte možnost zahrát si hru šesti pěšců, což jsou hodně zjednodušené šachy, (případně piškvorky, ale ty jsou daleko složitější) proti počítači z krabiček od zápalek, jednotlivé krabičky představují herní situace, které mohou nastat, v každé krabičce jsou korálky různých barev, každá barva představuje možný tah (umístění kolečka/tah pěšcem). Počítač je obsluhován organizátory, my však pouze mechanicky vykonáme akce, o nichž počítač „rozhodne“, na proces hry a učení nemáme žádný vliv. Hrát se bude stejně s oběma počítači a to následovně:

  1. (pokud začíná počítač, v opačném případě začínáme bodem 2.) Organizátor náhodně vylosuje korálek z krabičky, která označuje počáteční situaci (prázdná mřížka 3×3, popř. 3 pěšci proti 3 pěšcům na šachovnici 3×3) a vykoná tah. Krabičku nechá vytaženou a před ní nechá ležet vylosovaný korálek.
  2. Hráč zahraje svůj tah a tím změní situaci na mřížce/šachovnici.
  3. Organizátor najde krabičku, která odpovídá herní situaci, vylosuje korálek a vykoná tah. Opět nechá vytaženou krabičku a před ní ležet vylosovaný korálek.
  4. Předchozí dva body se opakují, dokud hra neskončí vítězstvím hráče, počítače nebo remízou (zaplnění celé mřížky, pouze v případě piškvorek), nyní přichází ta nejdůležitější část týkající se vytažených korálků (= zahraných tahů):
    1. v případě prohry se krabičky vrátí zpět bez vytažených korálků, ty se dají bokem (tím pádem se sníží pravděpodobnost, že počítač v příští hře zahraje tyto stejné tahy, které vedly k prohře),
    2. v případě remízy (ta nemůže nastat při hře šesti pěšců) se zahrané korálky vrátí zpět do vytažených krabiček a přidá se k nim ještě jeden korálek stejné barvy (remízu bereme jako dobrý výsledek, přidáním dalších korálků zvýšíme pravděpodobnost, že remíza nastane znovu),
    3. v případě výhry se zahrané korálky vrátí zpět do vytažených krabiček a přidají se k nim ještě tři korálky stejné barvy (přidáním dalších korálků zvýšíme pravděpodobnost, že příště počítač vybere stejné tahy, které vedou k vítězství)

Můžete si tedy zahrát buď šachy s pěšci, nebo piškvorky. Pravidla jsou následující.

Pravidla piškvorek 3×3:

  • standardní piškvorky, vítězí ten, kdo vytvoří řadu/sloupec/diagonálu ze svých třech symbolů,
  • pokud se zaplní celé pole a nikdo nemá vítěznou trojici, je to remíza.

Pravidla hry šesti pěšců:

  • začíná bílý hráč,
  • pěšci se pohybují rovně dopředu o jedno pole, případně mohou brát jiného pěšce šikmo vpředu o jedno pole, stejně jako v šachách,
  • na rozdíl od klasických šachů se pěšec nemůže posunout najednou o dvě pole ani na začátku,
  • pokud hráč dojde se svým pěšcem na opačný konec šachovnice, vyhrává,
  • pokud je hráč na tahu a nemůže zahrát žádný tah, prohrává.

Zkuste si zahrát několik her (případně si vsaďte žeton, pokud používáte žetony), pak si vyzkoušejte jinou aktivitu a po 20-30 minutách si zkuste zahrát znovu, abyste zjistili, jestli se počítač zlepšil.

Uzavření

Jaké můžou být způsoby jak vytvořit umělou inteligenci, která zvládne hrát nějakou složitější hru? Jak se může taková umělá inteligence chovat? Existují v zásadě tři způsoby:

  1. Čistě náhodný: (ŠPÁS a SUP úplně na začátku) program ví, jaké tahy může v dané situaci udělat a vybírá je zcela náhodně, k výhře nad takovým programem stačí danou hru aspoň trochu umět.
  2. Znající herní zásady: (takový jsme tu dnes neměli) ideálním příkladem je šachový program, který ví, jakou hodnotu mají jednotlivé figury, jaké jsou herní zásady (vývin lehkých figur, uvést krále do bezpečí, věže na volné sloupce,…) a jak může dát mat. Program se pak při výběru tahu dívá na to, aby se po jeho zahrání dostal do co nejlepší pozice, podle zadaných kritérií. Nevýhoda tohoto přístupu je v tom, že daná pozice může vypadat dobře „na první pohled“, ale po několika tazích získá hráč svou výhodu zpět i s úroky (v šachách např. obětování figury, abych mohl dát v třetím tahu mat). Čím více tahů dopředu dokáže program promyslet, tím lépe, náročnost však roste exponenciálně.
    • Příklad: Pokud můžeme v dané šachové situaci zahrát 30 tahů, snadno vyhodnotíme 30 pozic, pokud se chceme dívat dva tahy dopředu, musíme se u každého podívat, co všechno nám může soupeř odpovědět. Tedy u každé ze třiceti situací zhodnotit 30 možných odpovědí soupeře, což je najednou 30*30 = 900 situací. Pro vyhodnocení všech možností pro pět následujících tahů už máme 24 300 000 kombinací, přičemž pro zkušené šachisty není promyšlení pěti tahů zas tak náročné. Není proto divu, že první počítač tohoto typu porazil nejlepšího lidského hráče své doby teprve v roce 1997 (necelých třicet let poté co dokázaly počítače zvládnout cestu na Měsíc).
  3. Učící se: (ŠPÁS a SUP) program hraje zpočátku zcela náhodně, ale z každé hry se „poučí“ a upraví tak svůj další styl hry (odebereme/přidáme korálek), pro naše zápalkové počítače stačilo pár desítek her, ale šachové programy musejí takto odehrát miliony her, aby si „zažily“ co nejvíce situací. Když už jsou naučené, tak u konkrétní situace pak nemusí procházet všechny možnosti, ale jen ty, u kterých dříve zjistily, že pravděpodobně vedou k výhře, díky tomu můžou zkoumat více do hloubky. Dalo by se říct, že jde o jakousi strojovou intuici, schopnost poznat, nad čím má vůbec smysl „přemýšlet“, lidský hráč taky nezkoumá všechny tahy pěšcem, když ví, že mu soupeř hrozí matem.
    • I pro šachy bychom teoreticky mohli sestrojit počítač z krabiček od zápalek, potřebovali bychom však pro každou jednotlivou pozici jednu krabičku, všechny dohromady by pak zaplnili kouli, jejíž poloměr by odpovídal vzdálenosti mezi Sluncem a Uranem. Pokud bychom chtěli pokrýt všechny situace ve hře GO, nevešly by se nám krabičky do známého vesmíru.

Pomůcky a materiál

Položka Počet Popis
ŠPÁS 1
SUP 1
výpis možných situací 2 jeden pro ŠPÁS, druhý pro SUP
šachovnice 3×3 1
šachový pěšec 6
mřížka s barvami 2 jeden pro ŠPÁS, druhý pro SUP, určuje, která barva odpovídá kterému tahu
korálky jednotlivých barev hodně
žetony dost pouze, pokud si budou účastníci sázet
průhledná mřížka 3×3 1 piškvorkové situace je potřeba otáčet a překlápět, proto průhledná mřížka, v praxi se taky osvědčila možnost nekreslit kolečka a křížky přímo na mřížku, ale jen tam pokládat jejich obrázky a případně je přeskládat, pokud je potřeba situaci překlopit
fix a hadřík 1 případně obrázky křížku a koleček, pokud je chceme pokládat místo kreslení

Obsahové přílohy

#SouborPopis
010.07.01 spas.pdfVýpis všech situací a barevná tabulka pro ŠPÁS
010.07.04 spas.xlsxVýpis všech situací a barevná tabulka pro ŠPÁS
010.07.02 sup-pocatecni-nastaveni.pdfRozepsání, kolik korálků se dává do které krabičky při počátečn
010.07.05 sup-pocatecni-nastaveni.xlsxRozepsání, kolik korálků se dává do které krabičky při počátečním nastavení SUPu
010.07.03 sup-situace-a-barvy.pdfVýpis všech situací a barevná tabulka pro SUP
010.07.06 sup-situace-a-barvy.xlsxVýpis všech situací a barevná tabulka pro SUP

Zdroje

# PřílohyZdrojPopisAutorPůvodLicenceDatum
010.07.04 0101_resource.png pěšec bílý Autor neznámý https://icons8.ru CC BY-SA 2020-11-27
010.07.04 0202_resource.png pěšec černý Autor neznámý https://icons8.ru CC BY-SA 2020-11-27

Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0