Navigation und Service

Wir modernisieren für Sie
in Frankfurt am Main!

Die Deutsche Nationalbibliothek in Frankfurt bleibt vom 10.03. bis 22.03.2025 geschlossen. Die Ausstellungen des Deutschen Exilarchivs sind montags bis freitags von 9 bis 21.30 Uhr sowie samstags von 10 bis 17.30 Uhr geöffnet.

Informieren Sie sich

Inhaltliche Erschließung von wissenschaftlichen Publikationen durch Machine Learning

Aufgeschlagenes Buch mit neuronalem Netz im Hintergrund, im Vordergrund eine farbige Fläche mit dem Titel des Projektes.

Projektbeschreibung

Ziel des Projektes ist, Machine-Learning-Modelle zu entwickeln. Grundlage dafür ist der umfangreiche Bestand an Metadaten der Deutschen Nationalbibliothek. Die Modelle sollen dazu dienen, Inhalte von wissenschaftlichen Veröffentlichungen mathematisch zu erschließen, um sie auf abstrakter Ebene zu verstehen und untereinander in Beziehung zu setzen. Dadurch wird unter anderem eine inhaltliche Suche ermöglicht. Als Grundlage werden vortrainierte freie Sprachmodelle verwendet – das Projekt unterscheidet sich allerdings von Large Language Models der Tech-Konzerne. Im Projekt wird anhand eines speziell für diesen Zweck hergestellten Trainings-Datensatzes aus DNB-Beständen an einem möglichst schlanken, aber auf die Anwendung optimierten Modell gearbeitet. Darüber hinaus soll eine Webanwendung entwickelt werden, die es Nutzenden ermöglicht, die inhaltliche Nähe und Distanz zwischen Veröffentlichungen zu visualisieren und nach inhaltlich ähnlichen Einträgen zu suchen.

Das Projekt wurde von Linus Herterich und Max Schaible beantragt und wird von ihnen bearbeitet.

Laufzeit

Oktober 2024 - März 2025

Kontakt

DH-Stipendien@dnb.de

Letzte Änderung: 22.10.2024
Kontakt: DH-Stipendien@dnb.de

nach oben