Kuck mal wer da haemmert

Dragonfly ⌂, Dienstag, 17.06.2025, 02:06 (vor 23 Tagen) @ day-trader1422 Views

Also, ein Buch schreiben lasse dürfte kein Problem mehr sein. Bilder. Videos. Du wirst bald einen James Bond Film mit einem jungen Schwarzenegger in der Hauptrolle sehen können. Programmierung. Design. Kunst? Selbst Porno.

Und, ach ja:

Große Sprachmodelle (Large Language Models, LLMs) haben aufgrund ihrer Fähigkeit, menschliche Sprache zu verarbeiten und Aufgaben auszuführen, für die sie nicht explizit trainiert wurden, großes Interesse gefunden. Wir verfügen jedoch nur über ein begrenztes systematisches Verständnis der chemischen Fähigkeiten von LLMs, das erforderlich wäre, um Modelle zu verbessern und potenzielle Schäden zu mindern. Hier stellen wir ChemBench vor, ein automatisiertes System zur Bewertung des chemischen Wissens und der Argumentationsfähigkeiten moderner LLMs im Vergleich zur Expertise von Chemikern. Wir haben mehr als 2.700 Frage-Antwort-Paare kuratiert, führende Open- und Closed-Source-LLMs bewertet und festgestellt, dass die besten Modelle im Durchschnitt die besten menschlichen Chemiker in unserer Studie übertrafen. Allerdings haben die Modelle bei einigen grundlegenden Aufgaben Schwierigkeiten und geben überzogene Vorhersagen ab. Diese Ergebnisse zeigen die beeindruckenden chemischen Fähigkeiten von LLMs und unterstreichen gleichzeitig die Notwendigkeit weiterer Forschung, um ihre Sicherheit und Nützlichkeit zu verbessern. Sie schlagen auch eine Anpassung der Chemieausbildung vor und zeigen den Wert von Benchmarking-Rahmenwerken zur Bewertung von LLMs in bestimmten Bereichen.

Übersetzt mit DeepL.com (kostenlose Version)

https://www.nature.com/articles/s41557-025-01815-x


gesamter Thread:

RSS-Feed dieser Diskussion

Werbung