OpenAI startet den KI-Browser-Krieg

ChatGPT hat den Chatbot-Bereich verlassen. Am Dienstag kündigte OpenAI die Einführung eines Webbrowsers namens ChatGPT Atlas an, der das Surferlebnis von Grund auf neu definieren soll und nun auf einem Chat-basierten Erlebnis für das basiert, was das Unternehmen als „nächste Ära des Webs“ bezeichnet.
Während einer Demonstration erklärte Ben Goodger, Engineering Lead für Atlas bei OpenAI, dass Atlas die Antwort des Unternehmens auf die Frage sei: „Was wäre, wenn Sie mit Ihrem Browser chatten könnten?“ Atlas bietet zwar viele bekannte Webbrowser-Elemente wie Tabs, Lesezeichen und die automatische Vervollständigung von Passwörtern, doch ChatGPT ist nun zentraler Bestandteil des Erlebnisses und nicht mehr nur ein „alter Browser mit einem aufgesetzten Chatbot“. Das beginnt schon beim Startbildschirm, wo die Standardsuchleiste nun als Eingabeleiste für die Kommunikation mit ChatGPT dient.
Nutzer können ChatGPT mithilfe von Konversationsansagen bestimmte Webseiten finden lassen, eine Standard-Websuche durchführen oder direkt zu einer Website oder einem Lesezeichen gelangen. In der Demo erklärte Atlas Lead Designer Ryan O'Rouke, dass Nutzer mithilfe der „menschlichen Sprache“ sowohl das Web als auch ihren Browserverlauf (OpenAI nennt dies „Erinnerungen“) durchsuchen können, um Webseiten, Dokumente und Informationen anhand von Kontextinformationen zu finden. Beispielsweise zeigte das Unternehmen, wie es ein Google-Dokument finden kann, ohne die URL oder den genauen Dokumentnamen zu kennen.
Suchergebnisse in Atlas werden auf einer Startseite angezeigt, die basierend auf den Eingaben des Benutzers eine Vielzahl von Informationen aus dem Internet kuratiert. Benutzer können auch zwischen traditionelleren Suchergebnissen wechseln, darunter eine Google-Suche-ähnliche Liste mit Links, Bildern, Videos oder Nachrichten.
Der Hauptvorteil von Atlas besteht darin, dass Nutzer ChatGPT jederzeit beim Surfen im Internet aufrufen und den Chatbot zur Interaktion mit der aktuellen Seite nutzen können. OpenAI-CEO Sam Altman beschrieb es während der Demo als Chat mit einer Webseite. Der Chatbot lässt sich über eine Schaltfläche in der oberen rechten Bildschirmecke auf dem Desktop aufrufen und erscheint als Seitenleiste. Nach dem Öffnen kann der Nutzer ihn bitten, Informationen auf der Seite zusammenzufassen, seitenspezifische Fragen zu stellen und den Chatbot die Antwort direkt von der aktuellen Website abrufen zu lassen. Er kann sogar für ihn mit der Seite interagieren.
Bei dieser letzten Funktion kommt der Agent von ChatGPT ins Spiel. OpenAI wirbt seit Monaten für seine neue Agent-Funktion und stellte auf seinem jüngsten DevDay-Event unter anderem ein Agent-Toolkit vor, mit dem Entwickler eigene KI-Agenten erstellen können. Dieser Agent wird in den Browser integriert, im unteren Bereich der ChatGPT-Seitenleiste aktiviert und kann Aufgaben im Auftrag des Benutzers ausführen. In einer Demo der Funktion forderte Will Ellsworth, Forschungsleiter des Atlas-Agents bei OpenAI, den Agenten auf, die für ein Rezept benötigten Zutaten zu kaufen. Nach der Aufforderung navigierte der Agent zu Instacart und kaufte die entsprechenden Zutaten.
Laut Angaben des Unternehmens erhält der Agent Zugriff auf die Benutzerdaten und kann Aufgaben im Namen des Benutzers ausführen. Es wird jedoch Eingabeaufforderungen geben, die den Benutzer zur Genehmigung bestimmter Aktionen auffordern. Benutzer können die Ausführung der Aufgabe durch den Agenten in Echtzeit verfolgen, indem der Cursor sichtbar auf der Seite bewegt wird, oder ihn im Hintergrund laufen lassen. Bei Bedarf kann der Benutzer jederzeit die Kontrolle zurückerlangen. Ellsworth beschrieb den Agenten als ein Tool für „Vibe Life“ und schlug vor, dass Benutzer „alle möglichen Aufgaben, sowohl im Privat- als auch im Berufsleben, an den Agenten in Atlas delegieren“ könnten.
Atlas wird ab sofort für macOS verfügbar sein. Es ist geplant, den Browser „bald“ auch für Windows, iOS und Android bereitzustellen. Während der Browser offenbar für alle ChatGPT-Nutzer verfügbar sein wird, wird Agent kostenpflichtig sein und nur für Plus-Abonnenten (20 US-Dollar pro Monat) oder Pro-Nutzer (200 US-Dollar pro Monat) verfügbar sein.
Anfang des Jahres tat Google sein Bestes, um dieser Unvermeidlichkeit zuvorzukommen. Das Unternehmen kündigte eine KI-Überarbeitung seines Chrome-Browsers an , der derzeit über 70 % des gesamten Browser-Marktanteils hält. Dazu gehört die Integration des Gemini-Chatbots in den gesamten Browser, der beispielsweise Webseiten zusammenfasst und kontextbezogene Suchen innerhalb einer Seite durchführt. Das Unternehmen gab außerdem bekannt, dass es irgendwann einen KI-Agenten integrieren wird, der im Namen des Benutzers im Internet navigieren und Aufgaben erledigen kann. Diese Funktion ist derzeit jedoch nicht verfügbar. Perplexity hat auch einen KI-basierten Browser namens Comet, während Unternehmen wie Opera, Microsoft und The Browser Company allesamt KI-Funktionen in ihre jeweiligen Browser integriert haben.
gizmodo