Chatbot lacht, scherzt und singt: Open AI präsentiert GPT-4o
News & Trends

Chatbot lacht, scherzt und singt: Open AI präsentiert GPT-4o

Debora Pape
14-5-2024

Das neue KI-Modell von Open AI soll ein persönlicher KI-Begleiter sein. Mithilfe der Smartphone-Kamera interpretiert die Software die Umgebung und kann darauf reagieren.

Open AI hat am Montagabend sein neues Sprachmodell GPT-4o vorgestellt. Im Livestream demonstrierten drei Mitarbeitende mehrere Features des Modells.

GPT-4o basiert auf den Fähigkeiten des aktuellen KI-Modells GPT-4. Es versucht jedoch jetzt auch, Emotionen zu erkennen und auszudrücken. Mithilfe von Video- und Audio-Input reagiert es auf die Umgebung. Die KI soll dadurch in der Lage sein, tiefgehende Unterhaltungen zu führen. Außerdem sollen sich ihre Reaktionszeiten verbessert haben. So fühlen sich Gespräche laut Open AI natürlicher an.

Lernhilfe, Echtzeit-Übersetzung und persönliche Assistenz

Auf der Website von Open AI gibt es einige Demo-Videos, die die Fähigkeiten von GPT-4o demonstrieren sollen. In den Videos ist zu sehen, wie die KI als Echtzeit-Übersetzerin in multilingualen Gesprächen agiert, einem Schüler hilfreiche Hinweise für die Mathehausaufgaben gibt, auf Ereignisse im Kamerasichtfeld reagiert und mit anderen GPT-4o-Klienten interagiert. Beeindruckend ist etwa, wie eine KI ohne Kamerazugriff mit einer anderen KI mit Kamera spricht und sie zur Umgebung befragt. Die KI kann auch Gespräche oder Spiele wie Schere, Stein, Papier moderieren.

In diesem Video siehst du, wie zwei KIs auf Grundlage menschlicher Anweisungen interagieren:

Open AI will GPT-4 so als vollwertigen Gesprächspartner positionieren, der auf die Umwelt und den Verlauf eines Dialogs reagiert. Man merkt dem Modell an, dass es für Konversationen trainiert wurde: Die KI antwortet lebhaft, lacht und reagiert ungefragt mit kleinen Scherzen. Auf gute Nachrichten antwortet sie aufgeregt und freudig, auf niedergeschlagene Stimmungen reagiert sie einfühlsam. Es ist auch möglich, GPT-4o dazu zu bringen, nur noch sarkastisch zu antworten, schneller oder langsamer oder mit dramatischer Betonung zu sprechen oder gar zu singen.

Hier präsentiert Open AI, wie GPT-4o einem Schüler beim Mathelernen helfen kann:

Ein KI-Modell für alle Prozesse

Es war schon bisher möglich, mit ChatGPT zu sprechen. Dazu waren drei verschiedene KI-Modelle nötig. Open AI beschreibt den Vorgang auf der Unternehmenswebsite so: Ein Sprachmodell wandelte die gesprochenen Sprache in Text um und stellte sie GPT, dem eigentlichen Gehirn der KI, zur Verfügung. Die Antwort von GPT in Textform wurde von einem weiteren Sprachmodell als Sprache wiedergegeben.

Da GPT nur der reine Text zur Verfügung stand, gingen viele Informationen bei der Verarbeitung verloren: Die KI konnte weder Tonlage noch Hintergrundgeräusche der Sprecherin erkennen und auch nicht, ob verschiedene Sprecher beteiligt sind. Umgekehrt konnte GPT durch das Sprachrohr eines Text-to-Speech-Modells keine Emotionen ausdrücken, lachen oder gar singen.

Die große Neuerung an GPT-4o ist, dass ein einziges KI-Modell alle Aufgaben übernimmt. Es kann multimodalen Input, also Sprache, Text, Bilder und Audio, verarbeiten, interpretieren und darauf reagieren.

Im Moment nur für wenige verfügbar

Im Moment ist GPT-4o noch nicht für die breite Öffentlichkeit. Zunächst soll laut Open-AI-Website eine «kleine Gruppe zuverlässiger Partner» Zugriff auf die neuen Audio- und Video-Fähigkeiten der KI erhalten. Mittelfristig sollen auch User mit kostenlosem GPT-Account GPT-4o nutzen können, jedoch mit begrenzter Leistung im Vergleich zum Plus-Account.

Für Entwicklerinnen und Entwickler soll es Anpassungen bei den Preisen geben: Open AI gibt an, dass GPT-4o doppelt so schnell und halb so teuer sei wie das bisherige Flaggschiff-Modell «GPT-4 Turbo».

38 Personen gefällt dieser Artikel


User Avatar
User Avatar

Fühlt sich vor dem Gaming-PC genauso zu Hause wie in der Hängematte im Garten. Mag unter anderem das römische Kaiserreich, Containerschiffe und Science-Fiction-Bücher. Spürt vor allem News aus dem IT-Bereich und Smart Things auf.


Diese Beiträge könnten dich auch interessieren

Kommentare

Avatar