Alle Episoden

KI-Update Deep-Dive: Wie zuverlässig sind Benchmarks für LLMs?

KI-Update Deep-Dive: Wie zuverlässig sind Benchmarks für LLMs?

38m 17s

ChatGPT schneidet im Jura-Examen besser ab als Menschen – ChatGPT ist dümmer als ein Grundschüler. Solche Meldungen findet man schon mal am gleichen Tag. Wie kann das sein? Der Grund für dieses sehr unterschiedliche Abschneiden der großen Sprachmodelle in standardisierten Tests liegt in der Art und Weise, wie das vermeintliche Wissen der KI gemessen wird.
Andrea Trinkwalder und Hartmut Gieselmann von der c‘t haben sich angeschaut, wie Benchmarks diese Leistung messen und vergleichen - und wie aussagegkräftig die Ergebnisse solcher Benchmarks sind.

heise.de/ki-update
https://www.heise.de/ct
https://heise.de/-9288453
https://www.heise.de/thema/Kuenstliche-Intelligenz
https://the-decoder.de/
https://www.heiseplus.de/podcast

KI-Update Deep-Dive: Wem gehört das Werk?

KI-Update Deep-Dive: Wem gehört das Werk?

38m 54s

Seitdem generative KI über uns hereingebrochen ist, sind auch die Gerichte damit beschäftigt zu klären, wem Texte und Bilder, die Midjourney, ChatGPT, DALL-E, Bard und Co generieren gehören und wann sie vom Urheberrecht geschützt sind. Auf der anderen Seite sehen sich Urheber, also Autorinnen, Künstler oder auch Verlage in Ihrem Recht verletzt, weil ihre Werke ungefragt in das Training eingeflossen sind. Justiziar und Anwalt Joerg Heidrich erklärt, wie es sich mit dem Urheberrecht bei generativer KI verhält.

heise.de/ki-update
https://www.heise.de/thema/auslegungssache
https://www.heise.de/thema/Kuenstliche-Intelligenz
https://the-decoder.de/
https://www.heiseplus.de/podcast