Sie können ChatGPT jetzt bitten, Flüge zu buchen, Präsentationen zu erstellen oder Ihre E-Mails zu beantworten: So funktioniert der neue Agent von OpenAI.

Jahrelang war das Versprechen künstlicher Intelligenz mit einer Mischung aus Science-Fiction und passiver Automatisierung verbunden. Wir haben zwar über Assistenten gesprochen, aber sie reagierten in Wirklichkeit nur. Bis jetzt. Der neue Agent von ChatGPT markiert einen radikalen Wandel: Er kommuniziert nicht mehr nur oder interpretiert Anweisungen; er agiert nun.
Es kann in Ihrem Namen navigieren, sich bei Websites anmelden, Informationen filtern, Präsentationen erstellen und fertige Ergebnisse liefern – alles in einer einzigen Sitzung.
OpenAI hat diese Entwicklung „ChatGPT-Agent“ genannt, und ihre Einführung läutet eine neue Ära in der Beziehung zwischen Mensch und Maschine ein. Eine Ära, in der wir nicht nur mit KI sprechen, sondern ihr auch reale Aktionen delegieren. Doch wie genau funktioniert diese Technologie? Wo liegen ihre Grenzen? Und wie kann sie den Alltag von Fachleuten, Unternehmen oder einzelnen Nutzern verändern?
Was ist der ChatGPT-Agent und wie funktioniert er?ChatGPT kann jetzt mithilfe seines eigenen Computers Arbeiten für Sie erledigen.
Einführung des ChatGPT-Agenten – ein einheitliches Agentensystem, das den aktionsorientierten Remote-Browser des Operators, die Websynthese von Deep Research und die Konversationsstärken von ChatGPT kombiniert. pic.twitter.com/7uN2Nc6nBQ
Der ChatGPT-Agent ist ein einheitliches System, das die besten Funktionen seiner Vorgänger vereint: die webbasierte Aktion des Operators und die tiefgreifende Argumentation des erweiterten Untersuchungstools. Was einst zwei unterschiedliche Ansätze waren, sind nun in einem einzigen Modell integriert, das zwischen Lesen, Analysieren, Navigieren, Filtern und Handeln wechselt.
Diese Fähigkeit wird durch drei technologische Säulen unterstützt:
- Ein visueller Browser, der mit grafischen Schnittstellen interagiert, als wäre er ein menschlicher Benutzer.
- Ein textbasierter Browser zum Extrahieren, Vergleichen und Synthetisieren von Informationen.
- Zugriff auf APIs zum Abrufen strukturierter Daten wie Finanzkennzahlen, Sportergebnisse oder Wetterdaten.
Der Agent läuft auf einem virtuellen Computer, der von ChatGPT verwaltet wird. Dort kann er Konversations- und Aufgabenkontexte verwalten, Code ausführen und mit verschiedenen Quellen interagieren, ohne dass zwischen den Schritten Informationen verloren gehen. Und das alles, ohne dass der Benutzer etwas installieren muss: Die Aktivierung erfolgt über das Tools-Menü der ChatGPT-Anwendung.
Wer kann es nutzen und warum ist es in der Europäischen Union noch nicht verfügbar?Derzeit ist die Bereitstellung des Agenten auf zahlende Benutzer beschränkt:
- Pro- Benutzer haben unbegrenzten Zugriff.
- Plus- und Team -Benutzer haben Anspruch auf 50 Aufgaben pro Monat.
- Es wird ab Juli für Unternehmen und Bildungseinrichtungen verfügbar sein.
In der Europäischen Union liegt der Start jedoch auf Eis . Der Grund: Die europäische Gesetzgebung zu künstlicher Intelligenz und digitalem Datenschutz sieht zusätzliche Beschränkungen für autonom arbeitende Dienste vor, die auf personenbezogene Daten zugreifen, im Internet surfen und mit externen Systemen interagieren.
Der Einsatz des Agenten unterliegt daher der Einhaltung spezifischer Anforderungen der EU-KI-Verordnung und weiterer Vorschriften wie der DSGVO. OpenAI hat angekündigt, an der Einhaltung dieser Standards zu arbeiten, hat jedoch noch kein konkretes Datum für die Einführung in Europa genannt.
Fünf reale Anwendungsfälle für den neuen ChatGPT-AgentenWir verraten Ihnen jetzt 5 praktische Anwendungsmöglichkeiten dieser neuen Funktion.
Erstellen Sie einen Geschäftsbericht, der Ihnen in PowerPoint bereitgestellt wirdStellen Sie sich vor, Sie planen eine Produkteinführungsstrategie und benötigen einen Bericht über Ihre wichtigsten Wettbewerber. Bisher mussten Sie Informationen suchen, zusammenfassen und eine Präsentation erstellen. Jetzt können Sie ChatGPT fragen:
„Analysieren Sie drei direkte Konkurrenten von [Firmenname] und erstellen Sie eine Vergleichspräsentation.“
Der Agent navigiert zu relevanten Websites, extrahiert Daten, greift auf verfügbare Berichte zu, erstellt eine visuelle Zusammenfassung und wandelt diese in eine editierbare Präsentation inklusive Diagrammen um. Sie können Ihren Ansatz in Echtzeit überprüfen, pausieren oder optimieren.
Vorbereitung von Meetings mit dem von Ihnen bereitgestellten Kontext und Zugriff auf Ihren KalenderEines der wirkungsvollsten Szenarien ist die Kalenderverwaltung und die Vorbereitung von Briefings vor Meetings. Beispiel: „Ich überprüfe meinen Kalender und bereite ein Briefing für das morgige Meeting mit Kunde X vor, einschließlich der neuesten Nachrichten über sein Unternehmen.“
ChatGPT analysiert Ihre bevorstehenden Meetings, greift auf Nachrichtenquellen zu, fasst den Geschäftskontext zusammen und kann sogar wichtige Themen oder Fragen für das Meeting vorschlagen.
Automatisierung wöchentlicher FinanzberichteIn Unternehmensumgebungen ist die Berichtsautomatisierung eine der am häufigsten wiederkehrenden Aufgaben und anfällig für menschliche Fehler.
Der Agent kann die Anweisung erhalten:
„Erstellen Sie jeden Montagmorgen einen Bericht mit den finanziellen KPIs aus dieser Tabelle und senden Sie ihn mir als PDF.“
Der Agent greift auf das Blatt zu, führt die Analyse aus, behält das Format bei und liefert den Bericht im gewünschten Format. Außerdem können Sie die Kriterien jederzeit anpassen, ohne von vorne beginnen zu müssen.
Ein komplettes Abendessen planen: Reservierungen, Zutaten und RezeptDer ChatGPT-Agent ist nicht nur für die Arbeit nützlich. Angenommen, Sie möchten ein besonderes Abendessen für fünf Personen zu Hause organisieren und wissen nicht, wo Sie anfangen sollen. Sie können ihn fragen:
„Planen Sie ein italienisches Abendessen für fünf Personen. Schlagen Sie eine Vorspeise, ein Hauptgericht und ein Dessert vor, erstellen Sie eine Einkaufsliste für [Name des Supermarkts] und reservieren Sie einen Tisch in einer nahegelegenen Weinbar für nach dem Abendessen.“
Der Mitarbeiter sucht Rezepte, berechnet Portionen, prüft die Verfügbarkeit im gewünschten Supermarkt, stellt Ihnen die Liste zur Verfügung und erstellt einen Schritt-für-Schritt-Kochplan. Außerdem reserviert er direkt den Weinkeller und bittet bei Bedarf um Bestätigung.
Planen einer kompletten Reise mit einem festen BudgetDie Planung einer Reise mit vielen Variablen – Flüge, Unterkunft, Aktivitäten, Nahverkehr – erfordert oft stundenlanges Suchen, Vergleichen von Suchergebnissen und das Anfertigen verstreuter Notizen. Mit dem neuen Agenten können Sie einfach sagen:
„Planen Sie eine dreitägige Reise nach Lissabon für zwei Personen mit einem Gesamtbudget von 500 Euro, inklusive Flügen ab Barcelona, zentral gelegenen Unterkünften und kulturellen Aktivitäten.“
Der Agent vergleicht Flüge, sucht Hotels basierend auf den Präferenzen des Reisenden, wählt Freizeitoptionen basierend auf dem Profil des Reisenden aus und erstellt einen detaillierten Reiseplan mit geschätzten Kosten. Findet er Optionen, die unter dem Budget liegen, weist er darauf hin und schlägt Verbesserungen vor. Steigen die Kosten, schlägt er Alternativen zur Kostenanpassung vor.
Wichtig: Bevor Sie einen wichtigen Schritt ausführen – wie z. B. die Bezahlung eines Fluges, die Buchung eines Hotels oder die Eingabe persönlicher Daten –, fragt der Mitarbeiter immer nach einer ausdrücklichen Bestätigung. Sie können jede Auswahl überprüfen, ändern, ablehnen oder autorisieren. Sie können die Aufgabe sogar pausieren und später fortsetzen, ohne Ihren Fortschritt zu verlieren.
Das Endergebnis ist ein organisierter Reiseplan, bei dem alle Elemente zur Ausführung bereit sind, ohne dass Sie jedoch jemals die Kontrolle verlieren.
Ein Schritt in die Zukunft des autonomen und kollaborativen Arbeitens?Die Vorstellung, dass künstliche Intelligenz nicht nur denkt, sondern auch für uns handelt, hat schon immer Begeisterung und Besorgnis ausgelöst. Der ChatGPT-Agent stellt einen konkreten ersten Schritt in diese Richtung dar : eine KI, die nicht nur reagiert, sondern auch ausführt. Und das mit Benutzerkontrolle, ohne Kontextverlust, mit visueller Navigation und ständiger Iteration.
eleconomista