Navigation und Service

Wissenschaft braucht Daten, Wissenschaft braucht Content

Die Deutsche Nationalbibliothek als eine der großen Gedächtnisinstitutionen Deutschlands bietet ihre Datenbestände und digitalen Sammlungen für Wissenschaft und Forschung sowie für experimentelles und kreatives Arbeiten so weitgehend wie möglich an. Damit möchte sie ihren Beitrag dazu leisten, dem archivierten Kulturerbe Deutschlands einen lebendigen Platz in der Gesellschaft zu sichern.

Zugriff auf digitale Sammlungen

Die Zugriffsmöglichkeiten unterscheiden sich zwischen Publikationen ohne Zugriffsbeschränkung, Publikationen mit Zugriffsbeschränkungen sowie Metadaten und Normdaten. Weitere Informationen über die Unterschiede und deren Bedeutung für die Praxis erhalten Sie auf unserer Webseite:

Open Access: Zugriff auf digitale Sammlungen

Unser DNBLab

Unser Angebot umfasst den gesamten Bestand der Titel- und Normdaten der Deutschen Nationalbibliothek, Metadaten zu einzelnen, frei nutzbaren Content-Kollektionen und die Nutzung der Sammlung digitaler Objekte unter speziellen Bedingungen. Informationen zum Zugang zu unseren freien Daten, Objektdateien und Volltexten über verschiedene Schnittstellen und Downloads erhalten Sie im DNBLab.

DNBLab: Zugang zu Datensets und digitalen Objekten

Wenn Sie mit anderen Datenbeständen der Deutschen Nationalbibliothek wissenschaftlich arbeiten wollen, kommen Sie bitte auf uns zu: metadatendienste@dnb.de.

DH-Call und DH-Stipendien

Die Deutsche Nationalbibliothek unterstützt Wissenschaft und Forschung und stellt dafür verschiedene Angebote für Text- und Data-Mining bereit. So schreiben wir seit 2020 jährlich einen Digital-Humanities-Call (DH-Call) aus, bei dem sich Forschende mit eigenen Projekten bewerben können, um mit unseren Daten und Objekten zu arbeiten.

2022 haben wir unser Angebot zur Unterstützung der DH-Forschung um Stipendien erweitert. Damit wollen wir junge Forscher*innen mit einem ersten wissenschaftlichen Abschluss und Erfahrungen im DH-Kontext ermutigen, Fragen der Deutschen Nationalbibliothek an ihre Daten und Bestände zu erforschen.

DH-Call

Sie planen oder arbeiten bereits an einem DH-Forschungsprojekt und benötigen dafür Zugriff auf Metadaten oder digitalen Content der Deutschen Nationalbibliothek? Im Rahmen unseres DH-Calls unterstützen wir Sie gern und stellen Ihnen erforderliche Daten und Infrastrukturen zur Verfügung.

Aktuelle Ausschreibung DH-Call

DH-Stipendien

Sie interessieren sich für die Arbeit mit unseren Daten und besitzen bereits erste Erfahrungen mit den Methoden der Digital Humanities? Unsere DH-Stipendien bieten die Möglichkeit, sich forschend mit unseren Metadaten und unserem freien digitalen Content zu beschäftigen. Hierfür gewähren wir Stipendien für die Dauer von 3 bis 6 Monaten mit einem monatlichen Zuschuss zum Lebensunterhalt.

Aktuelle Ausschreibung DH-Stipendien

Text und Data Mining

Die Deutsche Nationalbibliothek hat neben einer Sammlung physischer Medienwerke mit knapp 34 Millionen Objekten auch eine umfangreiche digitale Sammlung mit über 12 Millionen E-Books, E-Journals, E-Paper und anderen digitalen Objekten aufgebaut. Diese sind nach den Vorgaben des § 60d UrhG auch für eine automatisierte Analyse (Text und Data Mining) für wissenschaftliche Zwecke nutzbar.

Die automatisierte Analyse ist jedoch ausschließlich auf der Infrastruktur und in den Räumen der Deutschen Nationalbibliothek erlaubt.

Wenn Sie daran Interesse haben, senden Sie uns eine kurze Beschreibung Ihres Vorhabens oder kontaktieren Sie uns im Vorfeld Ihrer Überlegungen DH-Call@dnb.de.

Dienste

Die Deutsche Nationalbibliothek unterstützt Sie bei Ihren Forschungsarbeiten durch das Angebot kostenfreier standardisierter Datenabzüge. Außerdem können Sie den Service der Metadatendienste nutzen, wenn Sie Datenselektionen nach eigenen Kriterien zusammenstellen lassen wollen. Dieser Dienst ist kostenpflichtig.

Für Ihre wissenschaftliche Forschung können Sie nach dem Gesetz für Urheberrecht und verwandte Schutzrechte (Urheberrechtsgesetz) § 60d gedruckte Medien digitalisieren lassen. Auch dieser Dienst ist kostenpflichtig.

Sofern Ihr Forschungsinteresse auf noch nicht frei verfügbare Datenbestände der Deutschen Nationalbibliothek zielt, wenden Sie sich bitte an lab@dnb.de.

Aktivitäten und Ergebnisse

Die Deutsche Nationalbibliothek verstärkt die Zusammenarbeit mit den Digital Humanities in Form von Workshops und Forschungskooperationen mit dem Ziel, Erfahrungen mit Expert*innen im Themenfeld auszutauschen, neue Wege der Zusammenarbeit einzuschlagen und das Potenzial der eigenen digitalen Datenbestände auszuloten. Erste Publikationen und Anwendungen zeigen die Möglichkeiten einer Nutzung der digitalen Sammlung der Deutschen Nationalbibliothek.

Projekte

2022

DisKo: Aufbau eines Diversitäts-Korpus (DisKo) als Grundlage für die algorithmische Textanalyse: Mareike Schumacher (TU Darmstadt) und Marie Flüh (Universität Hamburg) erstellen ein diverses Referenzkorpus, um daraus ein Traningskorpus extrahieren und annotieren zu können, das zum Machine-Learning ihres Gender-Classifiers genutzt werden kann. Die Deutsche Nationalbibliothek unterstützt das Projekt durch die Digitalisierung benötigter Literatur, OCR-Erkennung sowie die Korpuserstellung.
Mehr Informationen zum Projekt: https://msternchenw.de/diversitaets-korpus/

Der DNB-Katalog als Datengrundlage und Forschungsobjekt digitaler historischer Presseforschung: Erik Koenen (Universität Bremen – ZeMKI) erforscht in diesem Projekt die Potentiale des digitalen DNB-Katalogs in Bezug auf Zeitungen für die Forschung. Die Deutsche Nationalbibliothek berät zur Geschichte des Zeitungssammelns sowie ihrer Sammlungen in diesem Bereich und unterstützt das Projekt technisch.

FOREXSCIFI – Foresight Extraction from Science Fiction Literature: Jan Oliver Schwarz (TH Ingolstadt), Christoph Bläsi (Universität Mainz ) und Markus May (LMU München) analysieren Science-Fiction-Literatur, um Aussagen zu möglichen zukünftigen Entwicklungen in den Bereichen Technik, Ökologie, Ökonomie, Nahrungsmittelproduktion, Gesellschaft und Kommunikation sowie deren Interdependenzen zu generieren. Die Deutsche Nationalbibliothek erstellt hierfür einen Korpus, digitalisiert eine Auswahl an Literatur und stellt ihre Infrastruktur bereit.

2021

Heimliche Bestseller: Christine Haug (LMU München) erforscht die Geschichte des deutschen Heftromans von seinen Anfängen bis Mitte des 20. Jahrhunderts. Die Deutsche Nationalbibliothek unterstützt das Vorhaben durch die Digitalisierung von Heftromanen und deren Bereitstellung auf ihrer eigenen Infrastruktur.

Leipzig als Zentrum des globalen Rauchwaren- und Pelzhandels zwischen den zwei Weltkriegen: Werner Scheltjens (Universität Bamberg) analysiert die Rolle Leipzigs als Zentrum des internationalen Rauchwaren- und Pelzhandels in der Zeit zwischen den beiden Weltkriegen auf der Basis von Fachzeitschriften. Die Deutsche Nationalbibliothek unterstützt das Vorhaben durch die Digitalisierung von Zeitschriftenheften und deren Bereitstellung auf ihrer eigenen Infrastruktur.

Mapping Translated German Fiction with the German National Library Catalogue: Lisa Maria Teichmann (McGill University, Montreal, Kanada) unterzieht Übersetzungen deutscher Erzählliteratur einer quantitativen Analyse. Die Deutsche Nationalbibliothek unterstützt das Vorhaben durch die Bereitstellung von bibliografischen Metadaten sowie Beratung bei deren Auswertung.

2020

Faschismus im Auge der (inter)nationalen Öffentlichkeit: Lutz Klinkhammer, Jörg Hörnschemeyer (beide Deutsches Historisches Institut in Rom) und Jan Rohden (Max-Weber Stiftung) untersuchen Wahrnehmung und Darstellung von Faschismus und Nationalsozialismus in der Presse- und Publikationslandschaft von 1933-1945. Die Deutsche Nationalbibliothek stellt hierfür Gesamtabzüge der GND und Titeldaten sowie Metadaten und Volltexte der Exilpresse zur Verfügung.

Freie Meinungsäußerung und Hate Speech am Beispiel des Netzwerkdurchsetzungsgesetzes (NetzDG): Jens Pohlmann (Universität Bremen) untersucht vergleichend Aussagen auf IT-Blogs und -Webseiten zu Fragen der Netzpolitik. Wir stellen ein Vergleichskorpus E-Paper von 10 Tageszeitungen zur Analyse auf unserer Infrastruktur zur Verfügung.

Fremdes in Kochbüchern: Christoph Bläsi (Johannes Gutenberg-Universität Mainz) und Edith Blaschitz (Donau-Universität Krems) erforschen in ihrem Projekt Aneignungsprozesse von „fremdem“ Essen in deutschsprachigen Kochbüchern. Hierfür stellt die DNB einen Korpus von ca. 6.000 genuin digitalen Kochbüchern zur automatisierten Analyse auf ihrer eigenen Infrastruktur zur Verfügung. zum Video

Pseudonyme in der Literatur: Jörg Lehmann (Eberhard Karls Universität Tübingen) untersucht die Motive und Ziele von Autor*innen bei der Nutzung von Pseudonymen in der Literatur anhand von 23.000 GND-Datensätzen, welche wir hierfür bereitstellen.

2018

Makroanalytische Untersuchung von Heftromanen: Fotis Jannidis, Leonard Konle (beide Julius-Maximilians-Universität Würzburg) und Peter Leinen (Deutsche Nationalbibliothek) beschäftigen sich in diesem Projekt mit der quantitativen Untersuchung von sogenannten Heftromanen im Vergleich zur Hochliteratur. Für die automatisierte Analyse stellen wir unsere Infrastruktur und ein Korpus von ca. 40.000 Objekten zur Verfügung.

Projekte aus der Stipendienforschung

Leon Munz: Dissertationen in der Informationswissenschaft – Analyse einer Heterogenen Disziplin

Die Informationswissenschaft zeichnet sich als eine besonders heterogene und multidisziplinäre wissenschaftliche Disziplin aus, deren thematische Grenzen und Schwerpunkte sich dynamisch durch gesellschaftliche Bedürfnisse und unter dem Einfluss eines technologischen Imperativs stetig weiterentwickeln. Diese Umstände erschweren es deutlich, durch bestehende Klassifikationssysteme wie beispielsweise die Dewey-Dezimalklassifikation, relevante Dissertationen automatisiert für die Disziplin zu identifizieren.

Um dieses Problem zu lösen soll ein Ansatz erarbeitet werden, der über die bestehenden Metadaten hinaus weitere Attribute wie beispielsweise Institute oder beteiligte Personen aus entsprechenden Volltexten oder Online-Quellen zur Identifikation miteinbezieht. Ziel des Projektes ist die automatisierte Erstellung eines Korpus aus Dissertationen mit Relevanz für die Informationswissenschaft und eine darauf aufbauende deskriptive Analyse hinsichtlich thematischer Trends der Disziplin.

Suellen Dutra Pererira: Publish or Perish? Publikationen von Frauen in den Naturwissenschaften im Katalog der Deutschen Nationalbibliothek, 1900 – 1970

Obwohl der Karriereweg von Frauen in den Naturwissenschaften ein beliebtes Thema der Wissenschaftssoziologie ist, sind Veröffentlichungen mit quantitativen Daten zu ihren Publikationen noch selten. Um diese Lücke zu schließen, werden im Projekt „Publish or Perish?“ Metadaten der Deutschen Nationalbibliothek von Beständen in den Fächern Mathematik, Physik, Chemie, Pharmazie und Biologie zwischen 1900 und 1970 ausgewertet. Mithilfe der quantitativen Analyse von bibliografischen Metadaten sollen Fragen beantworten wie: Welchen Anteil hatten Frauen zwischen 1900 - 1970 an naturwissenschaftlichen Publikationen? Publizierten erfolgreiche Naturwissenschaftlerinnen durchschnittlich genauso viel wie ihre männlichen Kollegen? Publizierten Frauen mehr in bestimmen Phasen dieses Zeitraums? Um mögliche wissenschaftliche Netzwerkbeziehungen der Autorinnen auszuwerten, werden GND-Daten der Autorinnen und ihrer Publikationen herangezogen. Durch die Analyse von bibliografischen und GND-Daten wird schließlich die These überprüft, ob der Erfolg von Frauen in den Naturwissenschaften von der Anzahl ihrer Publikationen und ihrer frühen Beteiligung an institutionalisierten wissenschaftlichen Netzwerken abhing.

Hendrikje Schauer: Literarische Öffentlichkeit 1945 - 1962: DH-basierte Analyse von DNB-Daten

Zu den wiederkehrenden Topoi öffentlichkeitskritischer Diskurse in der deutschen Nachkriegszeit gehört die Behauptung literarischer Autor*innen nicht (mehr) frei publizieren zu können, zensiert und/oder marginalisiert zu werden. Diese problematischen Behauptungen, die in der Forschung teilweise übernommen werden, sollen auf Basis der DNB-Daten präzise geprüft werden.

Das Projekt steht im Kontext der intensiven Beschäftigung mit der Literatur der Nachkriegszeit unter der Perspektive von Öffentlichkeitskonzepten und Öffentlichkeitspraktiken. Das Vorhaben kombiniert DH-basierte Zugänge mit klassisch literaturwissenschaftlichen Ansätzen einer ideengeschichtlich und rechtswissenschaftlich informierten Textinterpretation.

Nicole Schwitter: Alters-, Perioden- und Kohorteneffekte in Stimmung und Schwerpunkt literarischer Werke

Literatur nimmt in Deutschland einen hohen Stellenwert ein und diverse Studien haben die positiven Effekte von Lesen und Schreiben auf die persönliche Psyche aufgezeigt. Worüber gelesen und geschrieben wird ändert sich über die (Lebens-)Zeit: Es gibt nicht nur spezielle Kinder- und Jugendbücher, sondern auch Unterschiede in den Genre-Präferenzen von Erwachsenen verschiedener Generationen. Generell ist die Literaturgeschichte von Epochen geprägt, in denen bestimmte Themen und Stile besonders präsent sind. Dieses Forschungsvorhaben wird die zeitliche Komponente von thematischen Trends und Stimmungen in der deutschen Literatur genauer untersuchen. Zeitliche Unterschiede können Effekte unterschiedlicher Zeitperioden oder auch altersspezifische Veränderungen oder Generationenunterschiede widerspiegeln, wie sie in der demografischen Forschung typischerweise unterschieden werden. Die Epochendefinition der Literaturwissenschaft stellt dabei auf Periodeneffekte ab. Dieses Forschungsvorhaben wird die zeitlichen Trends in der Literatur einerseits auf Basis des Erscheinungsjahrs eines Werkes analysieren, sich andererseits aber auch auf mögliche Alters- und Generationeneffekte der Autor*innen konzentrieren, die in der Literaturwissenschaft generell sehr wenig Beachtung finden. Um Kernkonzepte und Stimmungen abzuleiten werden die Buchtitel aller seit 1913 in Deutschland veröffentlichten Bücher ausgewertet. Daten der Bücher werden durch die Gemeinsame Normdatei (GND) und die freie Plattform Wikidata mit Daten über die Autor*innen erweitert. Die Katalogdaten werden dabei als Paneldatensatz verstanden. Mit diesem Ansatz wird angestrebt, die spezifischen Einflüsse von Alter, Kohortenzugehörigkeit und zeitgeschichtlichen Faktoren zu trennen, um Stimmungen und thematische Schwerpunkte in der deutschen Literatur zu erklären und einen vollständigen quantitativen Überblick zu schaffen.

Publikationen

Döhl, Frédéric: Digital Turn – Gedächtnisinstitutionen und Digital Humanities. Zwischenbericht aus einer Workshop-Reihe der Deutschen Nationalbibliothek, in: ZfBB – Zeitschrift für Bibliothekswesen und Bibliographie 67/3-4 (2020), S. 213-230. http://dx.doi.org/10.3196/1864295020673496

Döhl, Frédéric; Zechmann, Dorothea: Digital Humanities und Recht: Zu den neuen Regeln für das Text und Data Mining (TDM) und ihrem strategischen Potential für die Bibliotheken, in b.i.t. online 23 (2020) Nr. 4, S. 397-404. https://www.b-i-t-online.de/heft/2020-04-fachbeitrag-doehl.pdf

Döhl, Frédéric: Digital Humanities und Bibliotheken. Über technisch-organisatorische Infrastruktur hinausgedacht, in: ZfBB – Zeitschrift für Bibliothekswesen und Bibliographie 66/1 (2019), S. 4-18. http://dx.doi.org/10.3196/186429501966114

Döhl, Frédéric: Deutsche Nationalbibliothek verstärkt Engagement in den Digital Humanities, in: Dialog mit Bibliotheken 2, 2019, S. 9-11. urn:nbn:de:101-2019081635

Fischer, Frank; Jäschke, Robert: Liebe und Tod in der Deutschen Nationalbibliothek: Der DNB-Katalog als Forschungsobjekt der digitalen Literaturwissenschaft. In: DHd2018: ”Kritik der digitalenVernunft”, Digital Humanities im deutschsprachigen Raum, Cologne, Germany. 261-266. https://hal.archives-ouvertes.fr/hal-01787558/document

Herrmann, J. Berenike; Grisot, Giulia; Gubser, Susanne; Kreyenbühl, Elias (2021): Ein großer Berg Daten? Zur bibliothekswissenschaftlichen Dimension des korpusliteraturwissenschaftlichen Digital Humanities-Projekts „High Mountains – Deutschschweizer Erzählliteratur 1880–1930“. In: 027.7 Zeitschrift Für Bibliothekskultur / Journal for Library Culture, 8(1). https://doi.org/10.21428/1bfadeb6.6e2feff6

Herseni, Johannes et al.: Die bibliografischen Daten der Deutschen Nationalbibliothek entfalten. In: Dialog mit Bibliotheken 1, 2018, S. 11-16. https://d-nb.info/115432141X/34

Jannidis, Fotis; Konle, Leonard; Leinen, Peter: Makroanalytische Untersuchung von Heftromanen. In: DHd 2019. Digital Humanities: multimedial & multimodal. Konferenz-abstracts. 2019, p. 167-172. https://zenodo.org/record/2596095#.Xde4jm5Fzct

Jannidis, Fotis; Konle, Leonard; Leinen, Peter: „Thematic Complexity”. DH Conference Abstracts 2019. Utrecht. https://dev.clariah.nl/files/dh2019/boa/0504.html

Schöch, Christof; Döhl, Frédéric; Rettinger, Achim; Gius, Evelyn; Trilcke, Peer; Leinen, Peter; Jannidis, Fotis; Hinzmann, Maria; Röpke, Jörg: Abgeleitete Textformate: Prinzip und Beispiele, in: Recht und Zugang 1.2, 2020, 160–175. DOI: https://doi.org/10.5771/2699-1284-2020-2-160

Teichmann, Lisa: Mapping German fiction in translation in the German National Library catalogue (1980-2020), 2023. https://escholarship.mcgill.ca/concern/theses/0p096d03z?locale=en

Vorndran, Angela; Grund, Stefan (2019): Using Graph Visualization to enhance representation and evaluation of work clusters. Paper presented at: IFLA WLIC 2019 - Athens, Greece - Libraries: dialogue for change. Session S15 - Big Data. In: Data intelligence in libraries: the actual and artificial perspectives, 22-23 August 2019, Frankfurt, Germany. http://library.ifla.org/id/eprint/2723

Vorndran, Angela (2018): Hervorholen, was in unseren Daten steckt! Mehrwerte durch Analysen großer Bibliotheksdatenbestände. In: o-bib. Das offene Bibliotheksjournal, Bd. 5 Nr. 4 (2018), S. 166–180. https://www.o-bib.de/article/view/5414/7411

Anwendungen

DNBVIS: Projektbeschreibung, Prototyp (funktioniert mit Chrome und Firefox); Github-Repository Skripte und Prototyp

Kontakt

Stephanie Palek: s.palek@dnb.de

Letzte Änderung: 28.02.2024
Kurz-URL: https://www.dnb.de/dhd

nach oben