Ludzie pokonali sztuczną inteligencję na corocznej olimpiadzie matematycznej, ale maszyny nadrabiają zaległości

/ CBS/AFP
Sydney — Ludzie pokonali generatywne modele sztucznej inteligencji stworzone przez Google i OpenAI w najważniejszym międzynarodowym konkursie matematycznym, ale programy te po raz pierwszy osiągnęły złote wyniki, a tempo, w jakim się rozwijają, może być przyczyną pewnej ludzkiej introspekcji.
Żaden z modeli sztucznej inteligencji nie zdobył maksymalnej liczby punktów — w przeciwieństwie do piątki młodych ludzi na Międzynarodowej Olimpiadzie Matematycznej (IMO), prestiżowym corocznym konkursie, w którym uczestnicy mogą mieć mniej niż 20 lat.
Google poinformowało w poniedziałek, że zaawansowana wersja chatbota Gemini rozwiązała pięć z sześciu zadań matematycznych przedstawionych na konferencji IMO, która odbyła się w tym miesiącu w australijskim stanie Queensland.
„Możemy potwierdzić, że Google DeepMind osiągnął upragniony kamień milowy, zdobywając 35 na 42 możliwe punkty – złoty medal” – powiedział amerykański gigant technologiczny, cytując prezesa IMO, Gregora Dolinara. „Ich rozwiązania były pod wieloma względami zdumiewające. Oceniający IMO uznali je za jasne, precyzyjne i w większości łatwe do zrozumienia”.
Około 10% uczestników zdobyło złote medale, a pięciu uzyskało maksymalną liczbę punktów – 42.
Amerykański twórca oprogramowania ChatGPT, OpenAI, poinformował, że jego eksperymentalny model rozumowania uzyskał w teście złoty poziom 35 punktów.
Jak powiedział Alexander Wei, badacz OpenAI, w poście zamieszczonym w mediach społecznościowych, wynik ten „stanowił wielkie wyzwanie w dziedzinie sztucznej inteligencji” w „najbardziej prestiżowym konkursie matematycznym na świecie”.
„Ocenialiśmy nasze modele w zadaniach IMO z 2025 roku według tych samych zasad, co uczestnicy konkursu” – powiedział. „W przypadku każdego zadania trzech byłych medalistów IMO niezależnie oceniało przesłany dowód modelu”.
W zeszłym roku na konkursie IMO w Bath, w południowo-zachodniej Anglii, firma Google zdobyła srebrny medal, rozwiązując cztery z sześciu zadań.
Jak podano, zajęło to od dwóch do trzech dni obliczeń — znacznie dłużej niż w tym roku, kiedy model Gemini rozwiązał problemy w ciągu 4,5 godziny.
IMO stwierdziła, że firmy technologiczne „prywatnie testowały zamknięte modele sztucznej inteligencji w rozwiązywaniu tegorocznych problemów”, tych samych, z którymi zetknęło się 641 studentów ze 112 krajów.
„Bardzo ekscytujące jest obserwowanie postępów w zakresie możliwości matematycznych modeli sztucznej inteligencji” – powiedział prezes IMO Dolinar.
Organizatorzy konkursu nie byli w stanie zweryfikować, ile mocy obliczeniowej wykorzystały modele sztucznej inteligencji ani czy w projekcie brał udział człowiek – zauważył.
W wywiadzie dla programu 60 Minutes stacji CBS , udzielonym na początku tego roku, jeden z czołowych badaczy sztucznej inteligencji w Google przewidział, że w ciągu zaledwie pięciu do dziesięciu lat powstaną komputery posiadające zdolności poznawcze na poziomie ludzkim — będzie to przełom znany jako „sztuczna inteligencja ogólna”.
Dyrektor generalny Google DeepMind, Demis Hassabis, przewidział , że w ciągu dekady technologia sztucznej inteligencji będzie w stanie zrozumieć świat w niuansach i nie tylko rozwiązywać ważne problemy, ale nawet rozwijać wyobraźnię, dzięki zwiększonym inwestycjom.
„To rozwija się niesamowicie szybko” – powiedział Hassabis. „Myślę, że jesteśmy na swego rodzaju wykładniczej krzywej rozwoju. Oczywiście, sukces tej dziedziny w ciągu ostatnich kilku lat przyciągnął jeszcze więcej uwagi, więcej zasobów, więcej talentów. To przyczynia się do tego wykładniczego postępu”.
Cbs News