CAIDAS trainiert erstes rein deutsches großes Sprachmodell
Die Julius-Maximilians-Universität Würzburg (JMU) setzt einen neuen Meilenstein für deutschsprachige Large Language Models (LLMs). Gleich zwei neue Modelle wurden erfolgreich trainiert: das LLäMmlein 120M und das leistungsstärkere LLäMmlein 1B mit über einer Milliarde Parametern. Ein Novum stellt dar, dass dies ausschließlich auf Deutsch geschah.
Am 15. November 2024 werden die Modelle der Öffentlichkeit zugänglich gemacht.
Deutsches Training der Sprachmodelle
