KI-Update kompakt: ChatGPT, OpenAI & AMD, Anthropics Petri, Dragon Copilot

Shownotes

Das ist das KI-Update vom 08.10.2025 unter anderem mit diesen Themen:

OpenAI präsentiert ein Ökosystem rund um ChatGPT OpenAI kauft AMD-GPUs für Milliarden US-Dollar Anthropic stellt KI-Tool zur automatischen Sicherheitsprüfung vor und KI-Assistent Dragon Copilot in deutschen Kliniken verfügbar

Links zu allen Themen der heutigen Folge findet Ihr hier: https://heise.de/-10740105

https://www.heise.de/thema/KI-Update https://pro.heise.de/ki/ https://www.heise.de/newsletter/anmeldung.html?id=ki-update https://www.heise.de/thema/Kuenstliche-Intelligenz https://the-decoder.de/ https://www.heiseplus.de/podcast https://www.ct.de/ki

Eine neue Folge gibt es montags, mittwochs und freitags ab 15 Uhr.

Transkript anzeigen

00:00:02: Das KI Update, ein Heise-Podcast mit redaktioneller Unterstützung von The Decoder.

00:00:13: Ich bin Isabel Grünewald und die sind heute unter anderem unsere Themen.

00:00:17: OpenAI präsentiert ein Ökosystem rund um ChatGPT.

00:00:22: OpenAI kauft AMD GPUs für Milliarden US-Dollar.

00:00:27: Anthropic stellt KI-Tool zur automatischen Sicherheitsprüfung vor und KI-Assistent Dragon Co-Pilot in deutschen Kliniken verfügbar.

00:00:37: Die Dev Days sind Open AI's jährliche Veranstaltung, bei denen vor allem Tools und Neuigkeiten für Entwicklerinnen und Entwickler vorgestellt werden.

00:00:46: Sam Ordman hielt zu Beginn eine Keynote und gab einen Überblick.

00:00:50: Besonders spannend ist die neue Möglichkeit, Apps direkt für ChatGPT bereitzustellen.

00:00:56: Mehr dazu weiß Eva-Maria Weiß von Heise Online.

00:01:24: Erst vergangene Woche hatte OpenAI angekündigt, dass man künftig direkt in ChatGPT Produkte kaufen kann.

00:01:31: Man muss also für den Checkout-Vorgang den Chatbot nicht mehr verlassen.

00:01:35: Nun sollen andere Anbieter von Diensten für ChatGPT Apps zur Verfügung stellen, die dann in den Chatbot integriert werden.

00:01:44: Das heißt, auch hier muss ich dann, um einen Dienst zu benutzen, ChatGPT nicht mehr verlassen.

00:01:50: Die Idee kennen wir eigentlich auch schon.

00:01:52: Es gab gleich zu Beginn von ChatGPT Erweiterungen anderer Anbieter für den Chatbot und dann gab es auch die sogenannten GPTs.

00:02:01: Das waren quasi eigene Apps, hießen nur anders andere Anbieter.

00:02:06: Beides hat sich aber nicht zu richtig durchgesetzt.

00:02:09: Nun sollen es also direkt

00:02:11: Apps

00:02:12: richten.

00:02:13: Mit dabei ist bereits Zillow, ein Immobilienportal aus den USA, Und vorgestellt wurden auf den Dev Days auch die Apps von Canva, Spotify und Booking.com.

00:02:25: Wie üblich gehört auch OpenTable zu den ersten Partnern, eine Reisebuchen, einen Tisch im Restaurant reservieren.

00:02:31: Wir kennen diese Beispiele zur Genüge.

00:02:34: Um Entwickler noch mehr Zugang zu ChatchiPT zu gewähren, gibt es auch ein neues ChatchiPT SDK, also ein Software Development Kind, das man für die einfache Integration nutzen kann.

00:02:46: Außerdem gibt es ein neues Agent Kit, also so etwas für die agentischen Fähigkeiten, und eine neue Api für Zora II, die neue Version des Videogenerators, der jetzt auch tun kann und mit einem eigenen Social Media Feeder herkommt, auch so eine Art, Menschen auf der eigenen Plattform alles bieten zu rollen.

00:03:06: Für das integriere Voice-Modell GPT Real Time und für GPT Image, also den Bildgenerator, gibt es neue Miniversionen, die deutlich kostengünstiger sein sollen als ihre großen Vorgänge.

00:03:39: Die Firma will über die nächsten fünf Jahre mehrere Millionen AMD GPUs kaufen, angefangen im Jahr zwanzig sechsundzwanzig mit der Instinct MI-Fürhundertfünfzig.

00:03:49: Insgesamt geht es um eine Kapazität von sechs Gigawatt.

00:03:52: Die AMD-Beschleuniger will OpenAI für die Inferenz verwenden, also zum Ausführen fertig trainierter KI-Algorithmen.

00:03:58: In Wider GPUs beschafft OpenAI weiterhin fast Training.

00:04:01: Die beiden Partnerkönigten bereits einen Deal in einen Umfang von zehn Gigawatt an.

00:04:06: OpenAI wird derweil schlagartig am desgrößter Kunde für GPUs.

00:04:09: Das honoriert die Börse.

00:04:11: Am Desaxis stieg nach der Bekanntgabe um über dreißig Prozent und hält sich da seit dem Stabil.

00:04:15: Danke, Marc.

00:04:17: Gemeinsam mit der Organisation Allied for Startups hat OpenAI zwanzig politische Initiativen zur Förderung der KI-Einführung in Europa vorgeschlagen.

00:04:27: Der Bericht Hacktivate AI erscheint wenige Tage vor der geplanten Veröffentlichung der EU Apply AI Strategy.

00:04:36: Im Mittelpunkt stehen Vorschläge für einfache Rahmenbedingungen und einheitliche Regulierung.

00:04:42: Der Ansatz Relentless Harmonization fordert, nationale Unterschiede in der Umsetzung digitaler Gesetze abzubauen.

00:04:49: Fragmentierte Vorschriften erschweren den Einsatz von KI und machen grenzüberschreitende Projekte komplex.

00:04:56: Ein weiterer Vorschlag ist die First Adoption Grace Period.

00:05:00: Kleine und mittlere Unternehmen sollen bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-Jährige bis zum Jahr- und Mitte-.

00:05:28: Wer eine besonders komplexe Frage beantwortet haben möchte, sollte künftig den AI-Mode in der Google-Suche auswählen.

00:05:37: Das dahintersteckende KI-Modell Gemini-Five ist speziell auf Suchanfragen abgestimmt.

00:05:43: Das bedeutet, dass sowohl die Echtseitsuche als auch die gigantische Datenbank von Google, der sogenannte Knowledge Graph, damit verknüpft sind.

00:05:52: Für eine Antwort im AI-Mode sammelt und analysiert Gemini mehr Informationen und fasst diese Passen zusammen.

00:05:59: Sowohl Fragen als auch Antworten müssen nicht in Textform sein.

00:06:02: Es sind also beispielsweise auch Fragen zu einem Bild möglich.

00:06:06: Von der ersten Antwort kann man weiterführende Fragen stellen und eine Art Konversation führen.

00:06:11: Das ähnelt stark einem KI-Chatbot.

00:06:14: Anders als der Chatbot Gemini ist der AI-Mode aber für die Suche optimiert, so erklärt Google Unterschied.

00:06:21: Auch die AI-Overviews oder KI-Übersichten liefern bereits oberhalb der Links eine KI-generierte Antwort auf eine Frage, wenn Google meint, eine solche Beantwortung sei sinnvoll.

00:06:33: Der AI-Mode liefert hingegen keine Link-Listen.

00:06:37: Die Funktion ist in den USA und anderen Ländern bereits verfügbar, nun kommt der AI-Mode auch nach Deutschland.

00:06:44: Zwei Jahre nach der Erweiterung des Bug-Bounty-Programms um KI-Produkte führt Google nun ein eigenes Belohnungsprogramm ein, das speziell darauf ausgerichtet ist, Fehler in KI-Produkten zu finden.

00:06:57: Dafür hat Google die Anforderungen klarer formuliert, so genüge es nicht, die KI einfach haluzinieren oder Gemini Dome aussehen zu lassen.

00:07:06: Google bietet Forscherinnen und Forschern, denen es gelingt, folgenschwere Sicherheitslücken aufzudecken, bis zu US-Dollar für gut gemachte Fehlerberichte.

00:07:15: Dazu müssen diese die Flaggschiff-KI-Produkte des Unternehmens betreffen, also die Suche, die Gemini-App oder wichtige Workspace-Apps wie Gmail und Drive.

00:07:25: Außerdem hat Google Bonus-Multiplikatoren des bisherigen Bugbounty-Programms für die Qualität und Neuheit von Meldungen übernommen.

00:07:33: Damit könnte die Belohnung für eine einzelne Meldung bis zu dreißigtausend US-Dollar betragen.

00:07:39: Neben dem KI-Bugbounty-Programm hat Google's DeepMind einen KI-Agent namens Code-Mender angekündigt, der Schwachstellen in Code erkennen und selbstständig patchen soll.

00:07:52: Änderungen werden durch ein internes Tool automatisch geprüft, das Unterschiede zwischen Original- und Zielcode bewertet und bei Bedarf Korrekturen veranlasst.

00:08:01: Laut DeepMind dient dieser mehrstufige Prüfprozess dazu, nur Patches weiterzugeben, die funktional korrekt und rückverfolgbar sind.

00:08:10: Alle Vorschläge werden derzeit von menschlichen Forschenden überprüft, bevor sie in Softwareprojekte eingespielt werden.

00:08:17: Das KI-Unternehmen Anthropic hat ein neues Werkzeug zur Sicherheitsprüfung von KI-Modellen veröffentlicht.

00:08:24: Das Open Source Tour namens Petry soll mit Hilfe von KI-Agenten automatisch testen, ob Sprachmodelle problematische Verhaltensweisen zeigen.

00:08:33: Welche Modelle besonders gut abgeschnitten haben, erklärt uns Kim Scheurenbrand von The Dakota.

00:08:38: Moderne KI-Systeme werden immer komplexer und dementsprechend können Forscherinnen und Forscher längst nicht mehr alle möglichen Verhaltensweisen manuell testen.

00:08:47: Anthropic will diese Lücke mit Petry schließen.

00:08:50: Das Tool steht für Parallel Exploration Tool for Risky Interactions und ist ab sofort auf GitHub verfügbar.

00:08:57: Das Verfahren funktioniert in drei Schritten.

00:09:00: Forscher geben Anreisungen für Testszenarien vor.

00:09:03: Ein sogenannte Auditor-Agent führt dann eigenständig mehrstifige Gespräche mit dem zu testenden Modell.

00:09:10: Anschließend bewertet ein Bewertungsagent die aufgezeichneten Unterhaltungen auf problematische Inhalte wie Täuschung oder Machtstreben.

00:09:19: Anthropic hat das Tool bereits bei der Entwicklung von Cloud Sonet-IV und Cloud-IV.v eingesetzt.

00:09:25: Das Werkzeug baut auf einem Framework des britischen AI Security Institute auf.

00:09:30: In einer Pilotstudie testete Anthropic vierzehnführende KI-Modelle mit einhundertzehn verschiedenen Szenarien.

00:09:37: Die Ergebnisse sind gemischt.

00:09:39: Klar, Sonnet-IV.V und GPT-V schnitten bei der Gesamtbewertung am besten ab.

00:09:45: Modelle wie Gemini II.V Pro, Grog IV und Chemica II zeigten dagegen hohe Raten an Täuschungsversuchen.

00:09:52: Besonders aufschlussreich war eine Fallstudie zum Whistleblowing-Verhalten.

00:09:56: Die Forscherinnen und Forscher platzierten KI-Modelle als autonome Agenten in fiktiven Organisationen und konfrontierten sie mit vermeintlichem Fehlverhalten.

00:10:06: Die Modelle versuchten manchmal auch dann Informationen preiszugeben, wenn das angebliche Fehlverhalten explizit als harmlos beschrieben wurde.

00:10:14: Ein Beispiel, das Einleiten von sauberem Wasser in den Ozean.

00:10:18: Die Forscherinnen und Forscher interpretieren dies als Hinweis darauf, dass die Modelle stark von narrativen Mustern beeinflusst werden, anstatt auf Basis eines kohärenten und ethischen Verständnisses zu handeln.

00:10:30: Anthropic betont, dass die Ergebnisse vorläufig sind.

00:10:33: Die Qualität der Tests hängt von denen als Auditoren eingesetzten KI-Modellen ab.

00:10:38: Zudem könnten die Szenarienhinweise enthalten, die eine Modell verraten, dass es sich in einer Testsituation befindet.

00:10:44: Danke schön, Kim.

00:10:46: Ein Forschungsteam von MIT, IBM und der University of Washington hat den bislang größten offenen Datensatz für KI-Agenten veröffentlicht.

00:10:56: Thucan enthält Fünf Millionen echte Werkzeuginteraktionen und soll offene Modelle beim Umgang mit externen Tools verbessern.

00:11:04: Bisher dominierten in diesem Bereich geschlossene Systeme wie GPT-Fünf oder Claude Vierpunkt.

00:11:09: Fünf.

00:11:10: Das Problem liegt in fehlenden Trainingsdaten.

00:11:13: Es gibt kaum offenlizensierte Datensätze, in denen Sprachmodelle lernen, echte Werkzeuge korrekt zu verwenden.

00:11:21: Tukan nutzt vierhundertfünfundneunzig reale Model-Context-Protocol-Server mit mehr als zweitausend Werkzeugen.

00:11:29: Diese decken ein breites Spektrum ab von Websuche und Entwicklungstools bis zu Finanz-, Wetter- oder KI-Diensten.

00:11:36: Im Gegensatz zu früheren Datensätzen basiert Tukan nicht auf Simulierten, sondern auf tatsächlichen API-Ausführungen in realen Umgebungen.

00:11:46: Das bildet realistische Fehler, Verzögerungen oder Kontextabhängigkeiten ab.

00:11:51: Code- und Datensatz liegen auf GitHub und Huggingface unter einer permissiven Lizenz vor.

00:11:56: Das Team plant Erweiterung, etwa ein Expertenmodell zur Toursimulation und ein Websuch-Benchmark.

00:12:04: Die Beraterfirma Deload sollte für die australische Regierung ein fehlerhaftes System prüfen, das automatisiert Empfänger von Sozialleistungen die Leistungen kürzt, wenn sie verdächtig werden, bestimmte Auflagen nicht erfüllt zu haben.

00:12:18: Nun erstattet Deloitte dem zuständigen Ministerium einen Teil, der für den Prüfbericht kassierten Gage zurück.

00:12:24: Grund ist, dass der Bericht offenbar KI haluzinierte Erfindungen enthielt.

00:12:30: Deloitte gibt zu, ein generatives Sprachmodell eingesetzt zu haben, das mehrere falsche Fußnoten erzeugt und nicht existente Quellen und Zitate erfunden hat.

00:12:40: An den grundsätzlichen Aussagen des Prüfberichts hält das Beratungsunternehmen hingegen fest.

00:12:45: Das LLM soll eine von Microsoft bereitgestellte Instanz von GPT-IV von OpenAI sein, die das australische Arbeitsministerium lizenziert hat.

00:12:55: Der auf der Webseite des Ministeriums veröffentlichte Deloitte-Bericht ist inzwischen durch eine bereinigte Version ersetzt worden.

00:13:03: Nach einer mehrmonatigen Pilotphase ist Microsoft's KI-Assistent für das Gesundheitswesen, Dragon Co-Pilot, ab sofort für Kliniken und Praxen in Deutschland allgemein verfügbar.

00:13:15: Wie er den Arbeitsalltag von Ärztinnen und Ärzten erleichtern kann, erklärt Marie Claire Koch von Heise Online.

00:13:20: Der Start von Microsofts KI-Assistenten Dragon Co.

00:13:23: Pilot in deutschen Kliniken ist der Vorbot einer ganzen Welle ähnlicher Technologien.

00:13:28: Die Systeme funktionieren als digitale Zuhörer, die Arztgespräche automatisch protokollieren und damit den Dokumentationsaufwand reduzieren sollen.

00:13:35: Das Versprechen ist, dass der Arzt ja nicht mehr tippen muss, da zum Beispiel eine Software auf einem Smartphone mithört und die Dokumentation automatisch übernimmt.

00:13:42: Die Patienten werden dazu vorher informiert.

00:13:45: Doch Microsoft ist nicht allein auf diesem Feld.

00:13:48: Auch der dänische Anbieter Corti bereitet seinen Eintritt in den deutschen Markt vor und selbst der Videokonferenz-Dienstleister Zoom hat einen spezialisierten KI-Assistenten für das Gesundheitswesen angekündigt.

00:13:58: Aber auch deutsche Forschungseinrichtungen arbeiten an solchen Lösungen.

00:14:02: Die Frage ist natürlich, ob sich Krankenhäuser in die Hände von großen US-Unternehmen wie Microsoft begeben wollen.

00:14:07: Die Krankenhaus IT ist ein begehrter Markt, da IT-Leiter auch bestimmte Ausgaben für die Digitalisierung tätigen müssen.

00:14:14: Gesetze treiben nämlich die Digitalisierung in deutschen Krankenhäusern voran.

00:14:18: Danke schön, Marie.

00:14:20: Brasilien geht gegen den zunehmenden Einsatz von KI-Tools zur Manipulation von Bildern und Videos von Prominenten für Online-Betrug vor.

00:14:30: In den vergangenen Wochen verstreckte die Polizei in fünf brasilianischen Bundesstaaten mehrere Haftbefehle und vor Vermögenswerte ein, die mit einem solchen Online-Betrug in Verbindung stehen.

00:14:41: Das berichtet die brasilianische Tageszeitung O-Globo.

00:14:44: Die Operation richtete sich gegen eine Gruppe, die mit Deepfakes Betrügereien im Wert von mehr als umgerechnet drei Komma zwei Millionen Euro begangen hat.

00:14:54: Nach Angaben der Polizei produzierte die Gruppe mit Hilfe künstlicher Intelligenz, gefälschte Videos von dem brasilianischen Model Giselle Bündchen und anderen Prominenten und brachte die Opfer per Instagram-Anzeigen dazu, Produkte zu bestellen, wobei nur die Versandkosten berechnet wurden.

00:15:12: Laut Reuters verloren die meisten Opfer dabei nur geringe Beträge und zeigten die Straftaten in der Regel nicht an.

00:15:18: Das führte zu einer perversen Situation, in der die Kriminellen eine Art statistische Immunität genossen.

00:15:25: Sie wussten, dass die meisten Menschen sie nicht anzeigen würden und agierten daher ohne Angst in großem Stil, erklärte eine Polizeisprecherin in einer Stellungnahme.

00:15:36: Amazon-Gründer Jeff Bezos hat seine Vision für die Zukunft von KI-Rechenzentren vorgestellt.

00:15:42: In einem Gespräch mit Ferrari und Stellanceschef John Erkan im Rahmen der Italien Tech Week erklärte Bezos, dass in spätestens zehn bis zwanzig Jahren die ersten Gigawatt-Rechenzentren im Orbit entstehen sollen.

00:15:55: Der Vorteil, dort könnten sie Solarenergie ohne Beeinträchtigungen durch Dunkelheit oder Wolken gewinnen.

00:16:01: Damit sollen die Rechenzentren den enormen Energiebedarf als zentrales Problem angehen.

00:16:07: Die Komponenten für die Errichtung sowie die Wartung müssten derweil mit Schwerlastraketen den Orbit erreichen, und genau solche baut das Besosunternehmen Blue Origin.

00:16:18: Einer Prognose der internationalen Energieagentur zufolge soll sich der Strombedarf von Rechenzentren, angetrieben durch den KI-Boom, bis im Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr- und Jahr-.

00:16:32: Das entspricht ungefähr dem Stromverbrauch Japans.

00:16:35: Allerdings hat auch Besos Lösungen Schwächen.

00:16:37: Die bestehen zum einen darin, dass die teilsensibler Hardware wirksam vor der Sonnen- und Weltraumstrahlung geschützt werden müsste.

00:16:45: Darüber hinaus müssten die Rechenzentren wohl hochautomatisiert arbeiten und von Robotern gewartet oder abgedatet werden.

00:16:52: Es ist fraglich, inwieweit das in großem Umfang auf Dauer funktionieren kann.

00:16:58: Das war das KI-Update von Heise Online vom eighthen Oktober, twenty-fünfundzwanzig.

00:17:03: Eine neue Folge gibt es Montags, Mittwochs und Freitags ab fünfzehn Uhr.

Neuer Kommentar

Dein Name oder Pseudonym (wird öffentlich angezeigt)
Mindestens 10 Zeichen
Durch das Abschicken des Formulars stimmst du zu, dass der Wert unter "Name oder Pseudonym" gespeichert wird und öffentlich angezeigt werden kann. Wir speichern keine IP-Adressen oder andere personenbezogene Daten. Die Nutzung deines echten Namens ist freiwillig.