Zjednoczone Emiraty Arabskie wypuszczają niewielki, ale potężny model sztucznej inteligencji

Zjednoczone Emiraty Arabskie (ZEA) udostępniły model open source, który umożliwia zaawansowane rozumowanie, podobnie jak najlepsze oferty Stanów Zjednoczonych i Chin. To jak dotąd jeden z najsilniejszych sygnałów, że duże inwestycje tego kraju w sztuczną inteligencję zaczynają przynosić efekty.
Nowy model, K2 Think, został opracowany przez naukowców z Uniwersytetu Sztucznej Inteligencji im. Mohameda bin Zayeda (MBZUAI) w stolicy Zjednoczonych Emiratów Arabskich, Abu Zabi. Model ten – jeden z pierwszych tzw. „suwerennych” modeli sztucznej inteligencji, który uwzględnia postęp techniczny niezbędny do rozumowania – jest udostępniany bezpłatnie przez G42, emiracki konglomerat technologiczny wspierany przez państwowe fundusze majątkowe Abu Zabi. G42 wykorzystuje ten model na klastrze układów Cerberas, alternatywie dla sprzętu firmy Nvidia.
K2 Thinking to jeden z wkładów Zjednoczonych Emiratów Arabskich w globalny wyścig o zademonstrowanie swojej biegłości w technologii, która – jak się powszechnie uważa – będzie miała ogromne implikacje ekonomiczne i geopolityczne. Stany Zjednoczone i Chiny są uważane za dominujących graczy w tym wyścigu. Jednak wiele mniejszych krajów, zwłaszcza tych dysponujących znacznym majątkiem do zainwestowania, również ściga się w opracowywaniu własnych „suwerennych” modeli sztucznej inteligencji.
K2 Think ma stosunkowo niewielkie rozmiary, licząc 32 miliardy parametrów. Nie jest to kompletny, duży model językowy, lecz model wyspecjalizowany w rozumowaniu, zdolny do odpowiadania na złożone pytania poprzez symulowaną deliberację, a nie szybką syntezę informacji w celu wygenerowania wyniku. W przypadku takich zadań, jak twierdzą naukowcy, system ten działa porównywalnie z modelami rozumowania OpenAI i DeepSeek, które mają ponad 200 miliardów parametrów.
„To innowacja techniczna lub, moim zdaniem, przełom” – powiedział Eric Xing, prezes MBZUAI i główny badacz zajmujący się sztuczną inteligencją, w wywiadzie dla WIRED przed dzisiejszym ogłoszeniem.
Xing twierdzi, że model ten stanowi wyjątkowo skuteczne połączenie szeregu niedawnych innowacji technicznych. Należą do nich precyzyjne dostrajanie długich ciągów symulowanego rozumowania; proces planowania agentowego, który rozbija problemy na różne sposoby; oraz uczenie przez wzmacnianie, które trenuje model w celu uzyskania weryfikowalnych, poprawnych odpowiedzi. Inne innowacje pozwalają na bardzo wydajne działanie modelu na układach Cerebras.
„Jak sprawić, by mniejszy model funkcjonował równie dobrze, jak ten o większej mocy – to jest lekcja, której warto się nauczyć, jeśli inni chcą się od nas uczyć” – powiedział Xing.
Xing dodaje, że K2 Think został opracowany z wykorzystaniem kilku tysięcy procesorów graficznych (nie chciał podać dokładnej liczby), a ostateczny przebieg treningowy obejmował 200-300 układów. Planowane jest włączenie K2 Think do pełnego LLM w nadchodzących miesiącach. MBZUAI udostępniło kod źródłowy modelu i opublikowało raport techniczny , który szczegółowo opisuje, jak połączono różne innowacje, aby go stworzyć.
Inne kraje Bliskiego Wschodu, w tym Arabia Saudyjska, również intensywnie inwestują w infrastrukturę i badania nad sztuczną inteligencją. Prezydent Donald Trump udał się do tego regionu w maju, aby ogłosić liczne umowy dotyczące sztucznej inteligencji z udziałem amerykańskich firm technologicznych .
Władze Zjednoczonych Emiratów Arabskich zainwestowały miliardy , aby stać się strategicznie ważnym ośrodkiem badawczym. Kraj ujawnił już kilka nowatorskich badań nad sztuczną inteligencją i utworzył placówkę w Dolinie Krzemowej. ZEA osłabiło swoje powiązania z Chinami w zamian za dostęp do amerykańskiego krzemu potrzebnego do trenowania pionierskich modeli.
Peng Xiao, dyrektor generalny G42 i członek zarządu MBZUAI, powiedział w oświadczeniu: „To osiągnięcie pokazuje, że mniejsze, bardziej pomysłowe modele mogą rywalizować z największymi systemami. Pokazuje ono, w jaki sposób Abu Zabi kształtuje kolejną falę globalnej innowacji”.
wired