Atari upokarza ChatGPT i Copilot przegrywają w szachach z konsolą sprzed prawie 50 lat

Atari 2600 , konsola wprowadzona na rynek prawie pół wieku temu, właśnie pokonała dwa z najnowocześniejszych systemów sztucznej inteligencji na świecie : ChatGPT firmy OpenAI i Copilot firmy Microsoft. Seria partii szachowych, przeprowadzona przez architekta infrastruktury Roberta Caruso , ujawniła nie tylko techniczne ograniczenia współczesnych SI, ale także ich kruchość w obliczu zadań wymagających pamięci przestrzennej, spójnej logiki i konsekwentnej strategii .
Wszystko zaczęło się, gdy Caruso rozmawiał z ChatGPT o silnikach szachowych, takich jak Stockfish czy AlphaZero . Podczas rozmowy chatbot twierdził, że jest on również znakomitym graczem i z łatwością pokona Atari 2600 w szachach . Zmotywowany wyzwaniem, Caruso postanowił sprawdzić te zapewnienia.
Korzystając z emulatora Stella i klasycznej gry Video Chess (wydanej w 1979 roku), porównał model językowy OpenAI z konsolą o szybkości procesora zaledwie 1,19 MHz i 128 bajtach pamięci RAM . Rezultat okazał się katastrofalny dla sztucznej inteligencji. Pomyłki w ustawieniu figur , nieprawidłowe ruchy i błędy śledzenia szachownicy występowały regularnie przez całą 90-minutową grę na najniższym poziomie trudności .
Pomimo ludzkiej pomocy w interpretacji środowiska, ChatGPT nie był w stanie grać konsekwentnie. Caruso posunął się nawet do stwierdzenia, że „popełnił wystarczająco dużo błędów, by wyśmiać go w klubie szachowym trzeciej klasy”, a sztuczna inteligencja ostatecznie usprawiedliwiła swoją porażkę, twierdząc, że ikony gry były zbyt abstrakcyjne , by je poprawnie rozpoznać, choć problemy utrzymywały się nawet po zmianie układu planszy.
Po porażce ChatGPT, Caruso powtórzył eksperyment z Copilotem , asystentem programistycznym Microsoftu opartym na podobnej technologii. Copilot twierdził, że potrafi myśleć 10-15 ruchów naprzód i obiecał zapamiętywać poprzednie ruchy, aby poprawić swoją wydajność. Jednak rzeczywistość ponownie okazała się rozczarowująca.
W zaledwie siedmiu ruchach sztuczna inteligencja straciła kilka kluczowych figur i opracowała niemożliwe strategie , takie jak ustawienie swojej królowej tuż przed figurą przeciwnika, aby „zbić ją w następnej turze”, nie biorąc pod uwagę, że oznaczałoby to natychmiastową eliminację . W końcu Caruso poprosił Drugiego Pilota o narysowanie szachownicy z pamięci, a zauważając rozbieżności z rzeczywistością, asystent uprzejmie przyjął porażkę .
Choć może się to wydawać anegdotyczne, eksperyment ujawnia ważną prawdę: generatywne sztuczne inteligencje, takie jak ChatGPT i Copilot , nie posiadają ludzkiego rozumienia , trwałej pamięci ani abstrakcyjnego myślenia . Jak wyjaśnia The Register , technologie te przewidują słowa na podstawie wzorców statystycznych w tekście, ale nie „widzą” planszy ani nie „uczą się” z gry. To sprawia, że słabo nadają się do zadań wymagających spójności przestrzennej , rozumowania strukturalnego lub złożonego rozpoznawania obrazu .
Z kolei Windows Central ostrzega, że systemy te mogą sprawiać wrażenie inteligentnych, ale w rzeczywistości jedynie symulują inteligencję za pomocą języka, bez prawdziwego zrozumienia środowiska fizycznego lub logicznego. W grze takiej jak szachy, gdzie każdy ruch zależy od kontekstu szachownicy i precyzyjnych reguł, ten brak staje się oczywisty.
Ironią jest to, że Atari 2600 w ogóle nie „myśli” . Jego program szachowy opiera się na prostych algorytmach, ze sztywno zakodowanymi regułami i bez możliwości uczenia się. Mimo to, ta logiczna sztywność wystarczyła, by pokonać dwie z najbardziej rozchwytywanych obecnie sztucznej inteligencji , pokazując jasno, że złożoność nie zawsze równa się wydajności.
Robert Caruso zapowiedział, że kolejnym celem będzie pojedynek niepokonanego systemu Atari ze sztuczną inteligencją Gemini opracowaną przez Google . Pojedynek ten może poszerzyć wnioski z jego eksperymentu.
Porażka ChatGPT i Copilota z konsolą z lat 70. XX wieku to upokarzająca, ale pouczająca lekcja o obecnych ograniczeniach sztucznej inteligencji. Chociaż systemy te potrafią pisać wiersze, rozwiązywać równania i prowadzić złożone konwersacje, ich wydajność w zadaniach wymagających interakcji wizualnej, kontekstu przestrzennego i logiki strukturalnej wciąż pozostawia wiele do życzenia.
Ten odcinek, daleki od ostatecznej porażki, służy rekalibracji oczekiwań co do tego, co te sztuczne inteligencje potrafią – a czego nie potrafią – zrobić. W świecie, który coraz bardziej polega na technologii, zrozumienie jej prawdziwych możliwości jest równie ważne, jak ciągłe dążenie do jej rozwoju. Tymczasem Atari 2600 wciąż udowadnia, że czasami styl retro wciąż może wygrać .
La Verdad Yucatán