Atari, ChatGPT'yi küçük düşürdü ve Copilot, yaklaşık 50 yıllık bir konsola satrançta yenildi

Yaklaşık yarım asır önce piyasaya sürülen bir konsol olan Atari 2600 , dünyanın en gelişmiş iki yapay zeka sistemini, OpenAI'nin ChatGPT'sini ve Microsoft'un Copilot'unu alt etti. Altyapı mimarı Robert Caruso tarafından yönetilen bir dizi satranç oyunu aracılığıyla, bu ilginç karşılaşma yalnızca modern yapay zekaların teknik sınırlarını değil, aynı zamanda mekansal bellek, tutarlı mantık ve tutarlı strateji gerektiren görevlerle karşı karşıya kaldıklarında ne kadar kırılgan olduklarını da ortaya koydu.
Her şey, Caruso'nun ChatGPT ile Stockfish veya AlphaZero gibi satranç motorlarını tartışmasıyla başladı. Chatbot, Caruso'nun aynı zamanda müthiş bir oyuncu olduğunu ve Atari 2600 satrancını kolayca yenebileceğini iddia etti. Bu meydan okumadan ilham alan Caruso, bu ifadeleri test etmeye karar verdi.
Stella emülatörünü ve klasik oyun Video Chess'i (1979'da piyasaya sürüldü) kullanarak, OpenAI'nin dil modelini yalnızca 1,19 MHz işlem hızına ve 128 bayt RAM'e sahip bir konsolla karşılaştırdı. Sonuç, yapay zeka için felaket oldu. En düşük zorluk ayarında 90 dakikalık bir oyun boyunca taş karışıklığı , geçersiz hamleler ve tahta izleme hataları sürekli olarak yaşandı.
ChatGPT, ortamı yorumlamak için insan yardımı almasına rağmen tutarlı bir şekilde oynayamadı. Caruso, "üçüncü sınıf bir satranç kulübünde alay konusu olacak kadar hata yaptığını" iddia edecek kadar ileri gitti ve yapay zeka, oyun simgelerinin düzgün bir şekilde tanınamayacak kadar soyut olduğunu iddia ederek yenilgisini haklı çıkardı; ancak sorunlar, tahta düzeni değiştirildikten sonra bile devam etti.
ChatGPT'nin yenilgisinin ardından Caruso, deneyi Microsoft'un benzer teknolojiye dayanan programlama asistanı Copilot ile tekrarladı. Copilot, 10 veya 15 hamle sonrasını düşünebildiğini iddia etti ve performansını artırmak için önceki hamleleri hatırlayacağına söz verdi. Ancak gerçekler bir kez daha hayal kırıklığı yarattı.
Yapay zeka, sadece yedi hamlede birkaç önemli taşını kaybetmiş ve "bir sonraki turda ele geçirmek" için vezirini rakibinin tam önüne yerleştirmek gibi imkansız stratejiler geliştirmişti; bunun kendi anında elenmesi anlamına geleceğini düşünmemişti. Sonunda Caruso, Yardımcı Pilot'tan tahtayı hafızasından çizmesini istedi ve gerçeklikle tutarsızlıkları fark eden yardımcı pilot, yenilgiyi kibarca kabul etti .
Anekdot gibi görünse de, deney önemli bir gerçeği ortaya koyuyor: ChatGPT ve Copilot gibi üretken yapay zekalar, insan anlayışından , kalıcı hafızadan ve soyut düşünceden yoksundur. The Register'ın açıkladığı gibi, bu teknolojiler metindeki istatistiksel kalıplara dayanarak kelimeleri tahmin eder, ancak tahtayı "görmez" veya oyundan "öğrenmez". Bu da onları, uzamsal tutarlılık , yapılandırılmış akıl yürütme veya karmaşık görsel tanıma gerektiren görevler için pek uygun kılmaz.
Windows Central ise, bu sistemlerin zeki görünebileceği, ancak gerçekte fiziksel veya mantıksal ortamı tam olarak anlamadan, yalnızca dil aracılığıyla zekayı simüle ettiği konusunda uyarıyor. Her hamlenin tahtanın bağlamına ve kesin kurallara bağlı olduğu satranç gibi bir oyunda, bu eksiklik açıkça ortaya çıkıyor.
İronik olan şu ki , Atari 2600 hiç "düşünmüyor" . Satranç programı, katı kurallarla kodlanmış ve hiçbir öğrenme kabiliyeti olmayan basit algoritmalara dayanıyor. Yine de, bu mantıksal katılık , günümüzün en çok abartılan iki yapay zekasını alt etmeye yetti ve karmaşıklığın her zaman verimlilik anlamına gelmediğini açıkça ortaya koydu.
Robert Caruso, bir sonraki hedefinin, Atari'nin yenilmez sistemini Google tarafından geliştirilen yapay zeka Gemini'ye karşı, deneyinin sonuçlarını genişletebilecek yeni bir düelloda karşı karşıya getirmek olacağını duyurdu.
ChatGPT ve Copilot'un 1970'lerden kalma bir konsol tarafından yenilgiye uğratılması, yapay zekanın mevcut sınırları hakkında küçük düşürücü ama aynı zamanda açıklayıcı bir ders niteliğinde. Bu sistemler şiir yazabiliyor, denklemleri çözebiliyor ve karmaşık konuşmalar yapabiliyor olsa da, görsel etkileşim, mekansal bağlam ve yapılandırılmış mantık gerektiren görevlerdeki performansları hâlâ beklentilerin çok altında.
Kesin bir başarısızlık olmaktan çok uzak olan bu bölüm, yapay zekâların neler yapabileceği ve yapamayacağı konusundaki beklentileri yeniden değerlendirmeye hizmet ediyor. Teknolojiye giderek daha fazla bel bağlayan bir dünyada, gerçek yeteneklerini anlamak, gelişimini sürdürmek kadar önemli. Bu arada, bir Atari 2600, bazen retronun hâlâ kazanabileceğini kanıtlamaya devam ediyor.
La Verdad Yucatán