Navigation und Service

Personalversammlung am 11.12.2024 in Leipzig

Die Lesesäle der Deutschen Nationalbibliothek Leipzig öffnen am Mittwoch, den 11.12. wegen einer Personalversammlung erst ab 13 Uhr. Die Ausstellungen des Deutschen Buch- und Schriftmuseums sind von 10 bis 18 Uhr geöffnet.

Überblick

Die hier angebotenen Metadatensets der Titeldaten der Deutschen Nationalbibliothek, der Gemeinsamen Normdatei (GND), der Titel- und Bestandsdaten der Zeitschriftendatenbank (ZDB) sowie der Adressdaten des ISIL- und Sigelverzeichnisses werden regelmäßig aktualisiert. Sie werden kostenfrei und zur freien Nachnutzung zur Verfügung gestellt.

Neben diesen Gesamtabzügen bieten wir noch weitere (thematische) Datensets bibliografischer Metadaten sowie frei zugänglicher digitaler Objektsammlungen im DNBLab an. Eine Übersicht aller verfügbaren Metadaten und der verschiedenen Bezugsmöglichkeiten finden Sie hier.

Gesamtabzüge

Den aktuellen Stand der Daten erfahren Sie nach Aufruf des Download-Links in der jeweiligen Dateibeschreibung.

Gesamtabzüge Normdaten
GesamtabzugBereitstellung (Aktualisierung)Format, Codierung
UTF-8 decomposed („zerlegt“)
Anzahl der Datensätze/ Datengröße (gezippt)
Gemeinsame Normdatei (GND)März/April
September/Oktober
MARC 21
MARC21-xml
ca. 9,9 Mio./ca. 2 GB
Gemeinsame Normdatei (GND)März/April
September/Oktober
RDF (RDF/XML)
RDF (Turtle)
RDF (JSON-LD)
HDT-Datei
N-Triples
ca. 9,9 Mio./ca. 1,7 GB
Entity FactsMonatlichRDF (JSON-LD)ca. 9,1 Mio./ca. 1,2 GB
CrosskonkordanzenSeptember/OktoberRDF (RDF/XML)
RDF (Turtle)
RDF (JSON-LD)
N-Triples
*

*Enthält nur terminologiespezifische Datensets von Crosskonkordanzen.

Seit Ende Januar 2014 enthalten einige geografische Normdaten unveränderte Koordinaten aus der Datenbank GeoNames.

Als zusätzlicher Service wird die Datei authorities-gnd_umlenk_loesch_JJJJMMTT mit verkürzten Datensätzen bereitgestellt, um alle Umlenkungen („x“ an Position 5 der Satzkennung in MARC 21) und Löschungen („d“ an Position 5 der Satzkennung in MARC 21) seit dem vorherigen Gesamtabzug der Gemeinsamen Normdatei nachzuvollziehen. Diese Datei ist hilfreich für Nutzende, die bei der Übernahme der GND-Daten die Kontrollnummer im MARC-Feld 001 genutzt haben, um bei Umlenkungen die gültige GND-Nummer zu ermitteln.
Die Datei ist nicht relevant für Nutzende, die ihren GND-Bestand synchron zu der GND halten, also Umlenkungen und Löschungen über die OAI-Schnittstelle bzw. im wöchentlichen GND-Änderungsdienst fortlaufend nachvollziehen.
Weitere Informationen zu dem Verfahren der Umlenkungen und Löschungen


Gesamtabzüge Titeldaten
GesamtabzugBereitstellung (Aktualisierung)Format, Codierung
UTF-8 decomposed („zerlegt“)
Anzahl der Datensätze/ Datengröße (gezippt)
Titeldaten der DNB*/** März/April
September/Oktober
MARC 21
MARC21-xml
ca. 33 Mio./ca. 10,6 GB
Titeldaten der DNB*/***März/April
September/Oktober
RDF (RDF/XML)
RDF (Turtle)
RDF (JSON-LD)
HDT-Datei
N-Triples
ca. 31,9 Mio./ca. 5,4 GB

* Enthält auch Datensätze, die nicht Bestandteil der Deutschen Nationalbibliografie sind.
** Ein Gesamtabzug aller Titeldaten mit Hyperlinks zu digitalisierten Inhaltsverzeichnissen wird in MARC 21 (auch in XML-Struktur) jährlich im Februar kostenfrei bereitgestellt.
*** Alle Titeldaten, für die eine Konversion in das Format RDF vorliegt.

Einige Titeldaten enthalten seit Oktober 2015 Klassenangaben der Thema-Buchklassifikation.


Gesamtabzüge der Zeitschriftdatenbank (ZDB)
GesamtabzugBereitstellung (Aktualisierung)Format, Codierung
UTF-8 decomposed („zerlegt“)
Anzahl der Datensätze/ Datengröße (gezippt)
Titeldaten der ZDBMärz/April
September/Oktober
MARC 21
MARC21-xml
ca. 2,1 Mio./ca. 700 MB
Titeldaten der ZDBMärz/April
September/Oktober
RDF (RDF/XML)
RDF (Turtle)
RDF (JSON-LD)
HDT-Datei
N-Triples
ca. 2,1 Mio./ca. 400 MB
Bestandsdaten der ZDBMärz/April
September/Oktober
MARC 21
MARC21-xml
ca. 22,7 Mio./ca. 1,7 GB
Adressdaten (ISIL- u. Sigelverzeichnis)März/April
September/Oktober
RDF (RDF/XML)
RDF (Turtle)
RDF (JSON-LD)
HDT-Datei
N-Triples
ca. 21.300/ca. 4 MB

Neben diesen Gesamtabzügen bieten wir noch weitere (thematische) Datensets bibliografischer Daten sowie frei zugänglicher digitaler Objektsammlungen an. Mehr Informationen dazu finden Sie im DNBLab .

Laufende Aktualisierung

Die Gesamtabzüge können kostenfrei über die OAI-Schnittstelle und über WWW- bzw. SFTP-Server laufend aktualisiert werden.

Archivierte Gesamtabzüge

Sie sind an archivierten Gesamtabzügen zu Forschungszwecken interessiert?

Die Deutsche Nationalbibliothek archiviert seit 2021 einmal jährlich Gesamtabzüge ihrer Titeldaten, der Normdaten der Gemeinsamen Normdatei (GND), der Adressdaten (ISIL- und Sigelverzeichnis) und der Titel- und Bestandsdaten der Zeitschriftendatenbank (ZDB) sowie die zugehörige Formatbeschreibung.
Bei Interesse wenden Sie sich bitte per E-Mail an metadatendienste@dnb.de.

Nutzungs- und Bezugsbedingungen

Detaillierte Informationen zu den Nutzungs- und Bezugsbedingungen finden Sie hier.

Häufig gestellte Fragen (FAQ)

Wo finde ich Testdaten?

Aktuell gültige Testdaten in dem Format MARC 21 (auch in XML-Struktur) sind jederzeit abrufbar über den jeweiligen Zugang zu den aktuellen Lieferungen der gewünschten Metadaten.
Ergänzend bieten sich der Katalog und der Datenshop zum Bezug von Metadaten an. Zum Abbilden der turnusmäßigen Formatänderungen werden Testdaten im Format MARC 21 (auch in XML-Struktur) und RDF (verschiedene Serialisierungen) angeboten. Alle Formate werden in der Codierung UTF-8 decomposed („zerlegt“) angeboten.

Mit welcher Software kann ich die Metadaten weiterverarbeiten?

Für den ersten Einstieg geeignet ist zum Beispiel die Software-Suite Catmandu, OpenRefine oder Metafacture, zur Datenanalyse der „Konstanz Information Miner“ (KNIME) oder das Metadata Quality Assurance Framework. Eine weiterführende Übersicht bieten die Vortragsfolien „Open Source Software zur Verarbeitung und Analyse von Metadaten“ und der Artikel Survey of Tools for Linked Data Consumption.

Kontakt

metadatendienste@dnb.de

Aktuelles

Letzte Änderung: 28.11.2024
Kurz-URL: https://www.dnb.de/gesamtabzuege
Kontakt: metadatendienste@dnb.de

nach oben