Zapoznaj się z naszymimateriałami na stronie

🚩 Odkrycie: Wyścig autonomicznych robotów

Potrzebne materiały:

  • Co najmniej 2 roboty
  • 1 komputer/robot
  • Tor wyścigowy

Zalety tej aktywności:

  • Zabawne
  • Ceniona przez osoby w każdym wieku
  • Idealna do wprowadzenia zasady uczenia nadzorowanego

Czas trwania:

od 15 do 60 minut

Wiek:

od 8 lat

Konfiguracja oprogramowania:

Tryb „wyścig robotów”

Zabawowa aktywność na arenie z wieloma robotami: uczniowie uczą roboty poruszania się po torze, a następnie organizują wyścig. Poprzez praktyczne działania uczniowie poznają zasadę uczenia nadzorowanego oraz znaczenie wysokiej jakości danych szkoleniowych.

Wyścig robotów to aktywność zalecana na początek korzystania z rozwiązania AlphAI.

Wprowadzenie

Zbudujcie tor wyścigowy w formie pętli. Zalecamy skorzystanie z toru wyścigowego zaprojektowanego przez Learning Robots, ale możecie również zbudować własny tor: w takim przypadku należy zadbać o wyraźny kontrast wizualny między podłożem a krawędziami toru, równomierne oświetlenie oraz czystość podłoża.

Ustawienia

Podłącz każdego robota do komputera, a następnie wybierz przykładową konfigurację „wyścig robotów” lub stwórz własne ustawienia.

Proszę upewnić się, że wszystkie roboty mają takie same ustawienia, a przede wszystkim taką samą prędkość.

Trening

Sprawdź, czy przycisk „tryb autonomiczny” jest wyłączony, a przycisk „uczenie się” włączony.

Teraz Twoja kolej! Każdy steruje swoim robotem, klikając na polecenia po prawej stronie ekranu lub używając klawiszy strzałek lub AZEQSD na klawiaturze.
Zalecamy poruszanie się po arenie zgodnie z ruchem wskazówek zegara.

W tej fazie nauki nie ma sensu spieszyć się: chodzi przede wszystkim o to, by nauczyć robota poruszania się we właściwym kierunku bez uderzania w ściany. Poświęć trochę czasu na właściwy wybór odpowiedniej czynności za każdym razem (jeśli się pomylisz, kliknij „Zapomnij o czynności” obok przycisku nauki). Uważaj, aby nie pomylić lewej i prawej strony, gdy robot jedzie w odwrotnym kierunku!

Naucz robota omijać centralną przeszkodę, aby nie utknął w niej podczas pracy w trybie autonomicznym.

Można również ręcznie przesuwać robota, aby celowo ustawić go przed przeszkodami i nauczyć go, jak postępować w takich sytuacjach.

W panelu sterowania u dołu ekranu można ustawić maksymalną prędkość robota. Zalecamy prędkość maksymalną 30 dla małej areny wyścigowej, 35 dla dużej areny wyścigowej oraz 40 dla bardzo dużej areny wyścigowej.

Im bardziej zwiększysz prędkość, tym szybciej będzie poruszał się robot, ale tym trudniej będzie go kontrolować. Wybranie bardzo wysokiej prędkości nie zawsze jest korzystne!

Sprawdzenie wiedzy i ulepszenia

Po wykonaniu kilku okrążeń po arenie możesz włączyć tryb autonomiczny. Jeśli Twój robot jest dobrze wyszkolony, zacznie samodzielnie wykonywać okrążenia!

Ale nauka jeszcze się nie skończyła; nawet gdy robot porusza się samodzielnie, nadal możesz nim sterować, naciskając strzałki podczas jego ruchu. Na przykład, jeśli robot utknie przy ścianie i nie wie, co robić, możesz go uwolnić, nakazując mu cofnięcie się (pod warunkiem, że akcja „cofanie” została włączona w zakładce „akcje” po lewej stronie interfejsu oprogramowania).

Wyścig robotów

Po wyszkoleniu robotów zorganizuj zawody: ustaw rywalizujące roboty na linii startu. Daj sygnał do startu, a zespoły powinny jednocześnie kliknąć przycisk „Autonomiczny” (lub nacisnąć spację na klawiaturze), aby rozpocząć wyścig.

Podczas wyścigu dozwolony jest wyłącznie tryb autonomiczny: uczestnicy nie mogą wydawać robotom żadnych poleceń. Sędzia może przesunąć roboty, które utknęły na dłużej niż 5 sekund, aby umożliwić im kontynuowanie wyścigu.

Wygrał pierwszy robot, który wykonał 3 pełne okrążenia!

Wnioski i podsumowanie

W tym przypadku zastosowaliśmy algorytm uczenia nadzorowanego. Algorytm ten opiera się na sztucznej sieci neuronowej , która jest wyświetlana na ekranie (istnieją jednak inne rodzaje algorytmów, które nie opierają się na sieciach neuronowych, na przykład algorytm K najbliższych sąsiadów). Wszystkie algorytmy uczenia nadzorowanego działają w następujący sposób:

W pierwszej fazie, zwanej uczeniem, dostarczyliśmy algorytmowi przykłady decyzji, czyli zarówno obrazy z kamery robota, jak i działania, które należy podjąć, gdy kamera je wykryje. Podczas uczenia się sieć neuronów sztucznych została zmodyfikowana przez algorytm uczenia się (a dokładniej, niektóre połączenia zostały wzmocnione, a inne osłabione, tak aby sieć neuronów stała się zdolna do naśladowania tych samych decyzji).

W kolejnym etapie, zwanym fazą zastosowania, algorytm jest w stanie podejmować trafne decyzje w odniesieniu do nowych obrazów.

Zauważyliśmy, że nie wszystkie roboty nauczyły się tego samego – niektóre radziły sobie lepiej podczas wyścigu, inne gorzej. Ponieważ wszyscy uczestnicy korzystali z tego samego algorytmu, wyraźnie widać, że jakość samodzielnego podejmowania decyzji zależy od jakości danych szkoleniowych.

Możemy wspólnie omówić, co decyduje o jakości danych treningowych:

• Jakość danych treningowych = brak błędów w podejmowaniu decyzji

• Ilość danych nie zawsze jest gwarancją jakości autonomii

• Kompleksowość sytuacji: robot ma większe szanse na podjęcie złej decyzji, gdy staje przed nieznaną sytuacją

Więcej informacji

Skoro uczniowie zrozumieli już, że aby wygrać wyścig, najważniejsza jest jakość danych treningowych, zacznijmy ćwiczenie od początku!

Możesz również rozpocząć wyścig od nowa, wprowadzając nowe zasady:

  • Ograniczyć ilość danych treningowych (na przykład: maksymalnie 25 punktów danych), pozostawiając jednak uczestnikom możliwość ręcznego przemieszczania robota podczas fazy treningowej
  • Zwiększyć złożoność areny
  • Posiadać oddzielną halę do treningów i do zawodów