Digitales & Technologie

Statements

8. August 2025

GPT-5 veröffentlicht: Wie gut messen Benchmarks Leistung von KI-Modellen?

  • OpenAI hat lange angekündigtes, neues Sprachmodell GPT-5 veröffentlicht und demonstriert verbesserte Leistung auf diversen Benchmarks

  • auf den ersten Blick beeindruckend, bleibt die reale Aussagekraft solcher Angaben zur Leistung bei Benchmarks aber oft unklar

  • Forschende: Etablierte Benchmarks können Sprachmodellfähigkeiten in bestimmten Bereichen vergleichbar machen, liefern aber höchstens Indiz für Leistung außerhalb der Testszenarien