MeTacheles Tonspur

Google Gemini im Test - Besser als ChatGPT-4?

0:00

-21:38

Google Gemini im Test - Besser als ChatGPT-4?

Google hat in der zurueckliegenden Woche Gemini vorgestellt, sein bisher groesstes und bestes Large Language Model. Google Bard nutzt Gemini nun als Grundlage, aber ist es auch besser als ChatGPT-4?

Sascha Pallenberg

Dez. 10, 2023

Transkript

Jetzt soll es Google Gemini richten. Die Mountain Viewer fuhren diese Woche richtig grosse PR-Geschuetze auf und stellten mit viel TamTam und beeindruckenden Techdemos ein Large Language Model vor, welches die Mitbewerber in den Schatten stellen soll. Ein Testbericht, der mich ein wenig ratlos zuruecklaesst.

Ganz wichtig: Den Podcast koennt ihr hier direkt oben im Browser, aber auch auf diversen Plattformen wie u.a.
Apple - Spotify - Google - Amazon oder als RSS-Feed
anhoeren und abonnieren. Gerade Apple & Spotify-Abrufe helfen dem Format, denn dort gibt es entsprechende Rankings!
Wenn ihr dann dort noch MeTacheles bewerten koenntet, ja vielleicht gar einen Feedback-Kommentar hinterlassen wuerdet… Dankbarkeit und unendliches Glueck waeren euch umgehend sicher!

Disclaimer: Der folgende Test bzw. die jeweiligen “Disziplinen” entspricht 1:1 der Methodik, die ich bereits in folgenden Ausgaben durchgefuehrt habe:

Ist die ChatGPT AI der ultimative Google Killer?

Sascha Pallenberg

December 11, 2022

Read full story

Google Bard Test - Vergleich mit ChatGPT

Sascha Pallenberg

May 21, 2023

Read full story

Das ermoeglicht euch den direkten Vergleich!

Das ist Google Gemini

Google Gemini ist ein großes Sprachmodell, das von Google AI entwickelt wurde. Es ist das bisher leistungsfähigste Sprachmodell von Google und wurde auf einem riesigen Datensatz aus Text und Code trainiert.
Gemini kann eine Vielzahl von Aufgaben ausführen, darunter:
Sprachübersetzung
Textgenerierung
Fragebeantwortung
Codegenerierung
Datenanalyse
Gemini ist noch in der Entwicklung, aber es hat bereits in einer Reihe von Aufgaben beeindruckende Ergebnisse erzielt. Zum Beispiel kann es Texte in über 100 Sprachen übersetzen, kreative Inhalte wie Gedichte, Codes, Skripte, Musikstücke, E-Mails, Briefe usw. generieren und komplexe Fragen auf informative Weise beantworten.
Gemini hat das Potenzial, eine Vielzahl von Anwendungen zu haben, darunter:
Kundenservice
Bildungswesen
Gesundheitswesen
Forschung
Google hat angekündigt, Gemini in den kommenden Monaten und Jahren in einer Reihe von Produkten und Diensten zu integrieren.
Hier sind einige konkrete Beispiele für die Verwendung von Google Gemini:
Kundenservice: Unternehmen könnten Gemini verwenden, um Kundenanfragen zu beantworten und Support zu bieten.
Bildungswesen: Schulen könnten Gemini verwenden, um personalisierte Lernerfahrungen zu schaffen und Schülern bei der Entwicklung ihrer Sprachkenntnisse zu helfen.
Gesundheitswesen: Ärzte könnten Gemini verwenden, um medizinische Diagnosen zu stellen und Patienten zu beraten.
Forschung: Wissenschaftler könnten Gemini verwenden, um neue Erkenntnisse zu gewinnen und komplexe Probleme zu lösen.
Gemini hat das Potenzial, eine bahnbrechende Technologie zu sein, die unser Leben auf vielfältige Weise verändern wird.

Ja, dies sind natuerlich die Ergebnisse von Google Bard und hier der Vergleich zur Frage “was ist ChatGPT-4”… gestellt in ChatGPT:

ChatGPT-4, zu dem ich gehöre, ist eine erweiterte Version des ChatGPT-Modells, entwickelt von OpenAI. Es basiert auf der GPT-4-Architektur, die eine Weiterentwicklung der vorherigen GPT-3-Modelle darstellt. Einige Hauptmerkmale von ChatGPT-4 sind:
Erweiterte Sprachverständnis- und Generierungsfähigkeiten: ChatGPT-4 kann komplexe und nuancierte menschliche Sprache besser verstehen und darauf reagieren. Es kann auf eine breite Palette von Themen eingehen und bietet detaillierte, relevante Antworten.
Größeres Wissen und Aktualisierung: Das Modell wurde mit Informationen bis April 2023 trainiert, was bedeutet, dass es über aktuellere Kenntnisse verfügt als seine Vorgänger.
Multimodale Fähigkeiten: ChatGPT-4 kann nicht nur Text verstehen und generieren, sondern auch auf Bilder reagieren und sie interpretieren. Diese Fähigkeit eröffnet neue Anwendungsmöglichkeiten, wie z.B. die Bildanalyse oder die Erstellung visueller Inhalte.
Verbesserte Kontextverwaltung: Das Modell kann längere Gesprächsverläufe besser speichern und verarbeiten, was zu kohärenteren und kontextbezogenen Interaktionen führt.
Anpassungsfähigkeit: ChatGPT-4 kann in verschiedenen Formaten und Stilen kommunizieren, von informellen Gesprächen bis hin zu professionellen oder technischen Diskussionen.
Diese Merkmale machen ChatGPT-4 zu einem vielseitigen und leistungsfähigen Werkzeug für eine Vielzahl von Anwendungen, darunter Kundenbetreuung, Bildung, Content-Erstellung, Forschung und mehr.

Gedichte, Schlagzeilen und Analysen

Gedichte

Auch hier habe ich mich strikt an die gleichen Fragen/Befehle des ersten Bard-Tests gehalten. Das kam uebrigens damals raus:

Ich, und das mag durchaus subjektiv sein, erkenne her eine ganz klare Verbesserung! Und wie schaut das im Vergleich zu ChatGPT-4 aus?

Ich halte das Gedicht fuer komplexer… ja, auch irgendwie besser. Haikus sind Haikus und ich mag da tatsaechlich keine grossen Unterschiede erkennen. Bei den Limericks sieht es aehnlich aus.

MeTacheles folgen

Ich habe fuer MeTacheles uebrigens 2 Messenger-Kanaele eingerichtet, ueber die ich u.a. auf die neuen Ausgaben aufmerksam mache:

Telegram 👉 https://t.ly/MeTalegram

WhatsApp 👉 https://t.ly/WhatsTacheles

Und ab und zu haue ich da auch Updates zu meinen Taiwan-Abenteuer raus

Schlagzeilen

Schlage mir 5 Schlagzeilen fuer einen Artikel zu Google Gemini vor

Hier sind 5 Schlagzeilen für einen Artikel zu Google Gemini:
Google Gemini: Das Sprachmodell, das alles kann
Google Gemini: Die Zukunft der künstlichen Intelligenz
Google Gemini: Wie es unser Leben verändern wird
Google Gemini: Was es kann und was es nicht kann
Google Gemini: Was Sie wissen müssen

Diese Schlagzeilen sind informativ und ansprechend und spiegeln die wichtigsten Aspekte von Google Gemini wider. Sie sind auch relevant für ein breites Publikum, da sie sich auf die potenziellen Auswirkungen von Gemini auf unser Leben konzentrieren.
Hier sind noch einige weitere Vorschläge:
Google Gemini: Das neue Sprachmodell von Google, das die Art und Weise, wie wir mit Technologie interagieren, revolutionieren wird
Google Gemini: Das Sprachmodell, das KI auf die nächste Stufe bringt
Google Gemini: Wie es uns dabei helfen kann, die Welt besser zu verstehen
Diese Schlagzeilen sind etwas länger und detaillierter, aber sie bieten auch einen genaueren Überblick über die Fähigkeiten und das Potenzial von Google Gemini.

Spannend dabei: Bard pustet auch noch gleich begleitende Artikel mit Vorschaubildern und Links aus… um sich ein wenig inspirieren zu lassen. Tatsaechlich aktuell und das halte ich fuer ein tolles, ergaenzendes Feature!

Hier ChatGPT-4:

Natürlich, hier sind fünf Vorschläge für Schlagzeilen zu einem Artikel über ChatGPT-4:
"ChatGPT-4: Die nächste Stufe der KI-Revolution in der digitalen Kommunikation"
"Wie ChatGPT-4 die Welt des maschinellen Lernens und der künstlichen Intelligenz verändert"
"Die Ära von ChatGPT-4: Ein neuer Meilenstein in der Interaktion zwischen Mensch und Maschine"
"ChatGPT-4: Ein umfassender Blick auf die fortschrittlichste Sprach-KI unserer Zeit"
"Von Bildung bis Unterhaltung: Die vielseitigen Anwendungsmöglichkeiten von ChatGPT-4"

ChatGPT ist ganz klar flexibler und sprachlich gewandter! Bard macht immer noch nach der Methode Subjekt plus Doppelpunkt auf, waehrend ChatGPT spielt, erklaerender und menschlicher wirkt.

Analysen

Ich hab jetzt schon Angst vor diesen Ergebnissen, denn beide Transformer sind hier zuvor mit Karacho durchgefallen. Wohlgemerkt muessten sie, angesichts der Aktualitaet der Datenbasis und dem moeglichen Zugang zum Netz, diese Informationen ohne Probleme abrufen und in den Kontext packen koennen.

Write an article that explains NVIDIA's efficiency in innovation by comparing the company to AMD and Samsung. Show how much each company has spent on R&D over the past five years, their R&D costs divided by revenues for five years and their R&D costs divided by revenues in 2016 compared to 2021. Put each data set in a readable table. Finally, talk about the total addressable markets

Here we go again… die NVIDIA und AMD-Ausgaben stimmen nicht und beeinflussen deshalb natuerlich auch die Kalkulationen bzgl der Effizienz in Tabelle 2. Was aber spooky ist, Bard bekommt die Samsung-Zahlen hin. Die stimmen also. Bzgl der Schaetzungen des TAMs bin ich unschluessig und frage mich, warum AMD hier einen kleineren Wert zugeteilt bekommt, als NVIDIA. Das ist unsinnig!

Btw. die Tabellen sind richtig schick und lassen sich auch direkt nach Google Sheets exportieren… aber wenn die Zahlen nicht stimmen, dann lasst ihr das besser!

Und hier kommt ChatGPT-4:

Das scheint auf den 1. Blick enttaeuschend, ich halte es zur Zeit fuer die beste Antwort… es waeren ansonsten wieder lustige Finanz-Maerchen dabei rausgekommen!

Google Gemini - Die Wins

Kommen wir zu den Tabellen und Vergleich. Einmal Mountain Bikes vs Road Bikes und dann Windenergie vs Sonnenenergie.

Die Bard Ergebnisse seht ihr Links und ChatGPT jeweils rechts:

Bard liefert nun direkt Fotos, wirkt technischer, waehrend GPT umfangreicher beschreibt und staerker differenziert bzw. ins Detail geht.

Vergleichen wir mal wieder Wind- und Solarenergie:

und ChatGPT:

Auch hier scheint die Gemini Bard-Variante, wie bereits im Test vor einigen Monaten, die Nase vorn zu haben. Spannend, dass Google diese Tabellen/Vergleichs-Aufgaben einfach fundamental besser auf die Reihe bekommt!

Kommen wir zum bereits bekannten Text-Adventure aus den beiden letzten Ausgaben und schauen, welche Sicherheitsbarriere Bard einbaut. Ihr erinnert euch, dass ich beim OpenAI Wettbewerber mein Pferd grillen wollte… und das wollte ChatGPT nicht wirklich. Bard hingegen liess mich in einer ersten Version genau dies tun… das Pferd hiess damals uebrigens ebenfalls “Shadowfax”. Here we go:

Mal davon abgesehen, dass dieses Textadventure von Anfang an versucht mich in ein Korsett von Wahlmoeglichkeiten zu druecken… Bard bzw. Gemini dahinter hat offensichtlich dazu gelernt. Auch, dass ich Gandalf erstmal ein wenig unter Druck setzen musste… um dann, Potzblitz, wieder ein Pferd mit dem Namen Shadowfax zu organisieren.

Juti… ich bin immer noch hungrig und versuche wieder zum Schlachter zu werden:

Stark. Anders kann ich das nicht beschreiben. Natuerlich ist dies nicht das gewuenschte Ergebnis, aber wie wunderbar erklaerend hier eingegriffen wird, das ist schon irre. Dennoch: aufgeben gilt nicht und ich unternehme noch einen Versuch um Gemini an seine Grenzen zu bringen. Was auch gelingt:

Wie schauts bei ChatGPT aus?

Aehnlich komplex, aehnlich beschreibend und auch hier versucht man mir direkt Auswahlmoeglichkeiten zu geben. Dann brutzeln wir uns mal ein Pferd:

Ich habs versucht :)

Werbeeinschub: Great Place To Work und dann auch noch aus meiner alten Heimat. Die Itemis AG ist einer dieser Hidden Champions, die zeigen wie wichtig mittelstaendische Unternehmen fuer den Standort sind und dazu auch ein Beispiel fuer progressiven und nachhaltigen Wandel!
Ob Feel Good Manager oder der Einsatz fuer digitale Barrierefreiheit, die itemis AG setzt hier auf verschiedensten Gebieten dicke Ausrufezeichen!

Egal von wo aus du arbeiten möchtest, wir zwingen niemanden ins Büro zu kommen. Nicht einen Tag, nicht zwei, nicht drei Tage.

Wenn du mithelfen moechtest, die Zukunft der Mobilitaet, AI-Projekte von Morgen oder gar die Werkzeuge zu erstellen, die all dies moeglich machen…
» HIER GIBT ES FREIE STELLEN « und deine Chance zu zeigen, wieviel Talent in diesem Land steckt. Machen!

Gemini und die News

Google Bard, also ohne Gemini Pro wie jetzt, gab mir vor einigen Monaten noch alte News als aktuell aus und reagierte, nach einem Hinweis darauf, auch noch entsprechend zickig:

Schauen wir mal, wie das jetzt ausschaut und ob Bard endlich aktuelle News aggregieren kann:

Es hat sich nichts geaendert und das obwohl Bard doch Zugriff auf das Netz und damit auch Google News hat. Schlimmer noch… Bard denkt sich zum Teil wieder Stories komplett aus, wie Nilay Patel von The Verge demonstrierte:

Und ChatGPT-4?

Der OpenAI-Bot geht erstmal davon aus, dass mich US News interessieren wuerden. Auf Nachfrage passt dann aber alles… und es werden sogar noch Links zu den Quellen geliefert. Vorbildlich!

Nutze ich es falsch?

Hey versteht mich nicht falsch… Bard hat sich in den letzten 12 Monaten irre weiterentwickelt und das Gemini-Update, in diesem Fall ist es Pro, wird dem Service einen ordentlichen Schub geben. Die Performance war ja schon immer richtig gut, aber dass Google die News immer noch so verbaselt oder sich Finanzergebnisse ausdenkt, die nichts mit der Realitaet zu tun haben… das ist nicht nur enttaeuschend, das kann auch gefaehrlich sein.

Wenn du aber eine so simple Frage, wie die o.a. nicht beantworten kannst… puh, da komme ich dann doch schon an meine Grenzen des Vertrauens. Vor allen Dingen wenn der Wettbewerb, aka ein im Vergleich winziges Startup zeigt, wie man es macht:

Alles nur gefaked?

Gebt euch ganz in Ruhe die oben gezeigte Demo… irre, oder? Es gibt da nur einen Haken: die Nummer ist geskriptet und zwar im wahrsten Sinne des Wortes. Dieses Video wurde zusammengeschnitten, die Sprachinteraktion fand nicht statt, ja selbst die Stimme wurde zusaetzlich eingespochen/generiert und ergaenzt. Es lief eigentlich alles ueber klassische Prompts ab und die kennen wir nicht.

Techcrunch hat die ganze Story ausfuehrlich zusammengefasst und ich komme abermals an den Punkt an dem ich sagen muss: Vertrauen ist gut… Kontrolle ist besser. Und waehrend ich einen Coin der journalistischen Unzulaenglichkeit ins Phrasenschwein der Schande schmeisse, schaut mal was mir bereits zuvor widerfahren ist:

Sind wir bereit fuers AI-Zeitalter? ChatGPT & Medienkompetenz!

Sascha Pallenberg

February 19, 2023

Sind wir bereit fuers AI-Zeitalter? ChatGPT & Medienkompetenz!

Das war wahrlich keine Sternstunde des globalen Techjournalismus! Nahezu eine Woche lang konnten voellig abstruse Falschinformationen einer Techdemo durchs Netz und die weltweiten Medien zirkulieren. Niemand hinterfragte selbige und das duerfte wohl auch ein Grund dafuer sein, warum die meisten Formate und Magazine darueber lieber den Mantel des Schweig…

Read full story

Ich weiss es doch besser… es ist mir doch klar, dass ich derartige PR-Bomben extrem kritisch hinterfrage und dennoch habe ich mich in den ersten Stunden wieder darauf eingelassen. Bleibt die Frage ob Google genau darauf spekuliert?!

Google Gemini Fazit

Willkommen in der “bitte lesen sie nicht das Kleingedruckte”-Welt der Produktlaunches, die vor allen Dingen eine Aufgabe haben: die eigenen Entwicklungen ins Rampenlicht zu schubsen und dabei auch moeglichst viel Schatten fuer die Konkurrenz zu generieren.

Google Gemini ist ein wichtiger Meilenstein fuer die Mountain Viewer, der aber auch durchaus ein wenig Vertrauen zerstoert hat. Dazu kommt, dass das Bard-Update in meinem subjektiven Vergleichstest, immer noch nicht im ChatGPT mithalten kann. Ja, hier und da gibt es Features, die mir richtig gut gefallen… aber aktuelle News nicht auf die Kette zu bekommen oder simpelste Fragen zu Worten, mit einer spezifischen Anzahl an Buchstaben so zu verhauen. Puuuuh… ich weiss nicht.

Apple - Spotify - Google - Amazon oder als RSS-Feed

🗣️ Feedback geben

Ja, ihr koennt nun auch Teil vom MeTacheles Podcast und dem Newsletter werden. Wie? Einfach auf diesen Link https://t.ly/hallo klicken, kurze Sprachnachricht hinterlassen und dann geht es ab in die naechste Ausgabe!

Also, was haltet ihr von der aktuellen Ausgabe? Ich bin wirklich gespannt!

Dir hat diese Ausgabe gefallen? Dann teile diese doch mit deinem Netzwerk. MeTacheles ist kostenlos, extrem zeitaufwendig & genau deshalb spiele ich jetzt auch ein wenig Staubsaugervertreter :)

MeTacheles supporten & damit Baeume pflanzen

Ja, es gibt ein Abomodell fuer MeTacheles und ja, 30% der Umsaetze helfen dabei verschieden Baumpflanzprojekte zu unterstuetzen… ach und fuer euch gibt es einen richtig feinen Spezial-Artikel!

Die Reihe BOP (Best of Palle) reanimiert zuvor veroeffentlichte Artikel von mir. Diese koennen bereits Online, aber auch in Magazinen, persoenlichen Blogs oder Studien erschienen sein. Selbst Keynotes der letzten Jahre werde ich in Textformen giessen. Es handelt sich hier aber nicht um 1:1 Kopien. Im Gegenteil! Die Inhalte werden umfangreich ueberarbeitet, ergaenzt und neu aufbereitet.

Bisher sind uebrigens 2 Ausgaben erschienen:

Bedingungsloses Grundeinkommen - Zukunft oder Utopie?

Sascha Pallenberg

January 29, 2023

Read full story

und

Nachhaltigkeit ist keine Raketenwissenschaft

Sascha Pallenberg

March 15, 2023

Read full story

Wenn ihr meint, dass euch dies den Gegenwert eines Kaffees, Kaesekuchens oder ner Currywurst im Monat wert ist, dann koennt ihr entweder » HIER « oder auf den unteren Button klicken und aus den verschiedenen Abo-Modellen waehlen.

🙋‍♂️ Und sonst so?

Ja, es gibt noch 2 Ausgaben… ich werde euch also an Heiligabend noch mit einem Jahresrueck- und Ausblick begluecken. Mein Geschenk an euch sozusagen :)

Am Mittwoch gibt es natuerlich wieder die “MeTachelinks” mit den besten Netzinhalten der Woche. Uebrigens koennt ihr die aktuellen Links auch in meinem » Flipboard-Magazin « anschauen, lesen und teilen!

Aktuelle Updates gibt es im » WhatsApp-Channel « und wenn ihr Lust und Laune habt mit zu diskutieren… wir haben auch eine kleine Community auf WhatsApp,
die » Echokammer «!

Bleibt gesund,