OAI-Schnittstelle
Aktualisierung großer Datenbestände
Die OAI (Open Archives Initiative)-Schnittstelle eignet sich für die regelmäßige Aktualisierung großer Datenbestände. Voraussetzung für eine ständige Synchronisation ist der initiale Datenimport eines aktuellen Grundbestandes in die eigene Datenbank. Der Zugriff auf die OAI-Schnittstelle ist ebenso kostenfrei wie der Grundbestand. Weitere Informationen finden Sie auch im Dialog mit Bibliotheken Ausgabe 2013,1
Eine Übersicht aller verfügbaren Metadaten und der verschiedenen Bezugsmöglichkeiten finden Sie hier.
Hintergrund
OAI (Open Archives Initiative) ist eine Initiative, die die Definition einer offenen Schnittstelle zum Austausch von Metadaten zur Aufgabe hat. Die Kommunikation einer solchen Schnittstelle erfolgt zwischen der Deutschen Nationalbibliothek als Datenlieferant (data provider) und einem Dienstanbieter (service provider), der die Daten bezieht. Der Bezug erfolgt automatisiert durch einen sogenannten „OAI-Harvester“. Das Protokoll, das für die Kommunikation verwendet wird, hat die Bezeichnung OAI-PMH (OAI-Protocol for Metadata Harvesting).
Standard der OAI-Schnittstelle
Protokoll: OAI-PMH Version 2.0
OAI-PMH-Protokoll
Das Protokoll OAI-PMH ist webbasiert. Der OAI-Harvester arbeitet mit einfachen Anfragen per HTTP-GET oder -POST und erhält eine HTTP-Antwort vom Datenlieferanten zurück. Diese Antwort enthält, eingebettet in eine XML-Struktur, die angeforderten Metadaten.
OAI-Harvester
Um OAI zum Abgleich der Daten zwischen der Deutschen Nationalbibliothek und einem Dienstanbieter nutzen zu können, muss auf Seiten des Dienstanbieters ein OAI-Harvester implementiert werden. Der OAI-Harvester ruft sich in einer Endlosschleife immer wieder selbst auf. Er führt dabei einen „ListRecords-Befehl“ aus (siehe OAI-Funktionen), der sich auf das für den Dienstanbieter definierte Datenset (Katalog) beschränkt. Dem „ListRecords-Befehl“ wird über einen Zeitstempel der Zeitpunkt des letztmaligen Aufrufs mitgegeben. Auf diese Weise ist gewährleistet, dass
- keine Änderung verpasst wird.
- sich Änderungen zeitnah in der Dienstanbieter-Datenbank widerspiegeln.
- keine für den Service Provider irrelevanten Daten transportiert werden.
OAI-Funktionen
Das Protokoll OAI-PMH enthält sechs Basisfunktionen, die an die baseURL (zum Beispiel „https://services.dnb.de/oai/repository“) mit „?verb=“ angefügt werden:
Identify: Anzeige von allgemeinen Informationen zum OAI-Repository, zum Beispiel
- repositoryName
- baseURL
- protocolVersion
- ListSets: Informationen zu allen im OAI-Repository zur Verfügung stehenden Datensets (Kataloge)
- ListMetadataFormats: Auflistung der Datenformate (Informationen zu den für den Export angebotenen Formaten)
- ListRecords: Harvesten von Datensätzen mittels Angabe eines Datensets und optional Angabe des Zeitraums (from/until)
oder ListIdentifiers: Harvesten von Identifikationsnummern von Datensätzen (PPN/IDN) mittels Angabe eines Datensets und optional Angabe des Zeitraums (from/until). Die Zeitangabe erfolgt in koordinierter Weltzeit UTC. Dies ist die Kernfunktion von OAI. Es ermöglicht selektives Harvesting, das heißt der Harvester kann seine Anfrage auf Datensätze beschränken, die
- aus einem bestimmten Katalog stammen und
- in einem bestimmten Zeitraum erzeugt oder geändert wurden.
Parameter:
- set: Katalog, aus dem die Datensätze stammen
- from/until (optionale Angabe): Zeitpunkte, die den Zeitraum für das selektive Harvesting definieren. Diese können (je nach OAI-Repository) entweder Tagesgenauigkeit (YYYY-MM-DD) oder Sekundengenauigkeit haben (yyyy-mm-ddThh:mm:ssZ).
- metadataPrefix: Die zur Auswahl stehenden Werte können über den Befehl ListMetadataFormats (siehe oben) abgefragt werden.
- resumptionToken: ermöglichen die Rückgabe von Teilantworten. Der OAI-Harvester bekommt einen resumptionToken, den er für eine neue Anfrage beim OAI-Repository nutzen kann, um die nächsten Antworten zu erhalten.
GetRecord: Abruf einzelner Datensätze mittels ID-Angabe. Voraussetzung ist die Kenntnis der Identifikationsnummer des gewünschten Datensatzes (MARC 21: 035 $a mit Präfix DE-101 bzw. DE-599).
Parameter:- identifier: Identifikationsnummer des gewünschten Datensatzes
- metadataPrefix: Bezeichnung des Datenformats, in dem der Datensatz geliefert werden soll. Die zur Auswahl stehenden Werte können über den Befehl ListMetadataFormats (siehe oben) abgefragt werden.
Hinweis: Zum gezielten Bezug einzelner Datensätze empfehlen wir unsere SRU-Schnittstelle.
Zugangsvoraussetzungen
Der Zugang zur OAI-Schnittstelle ist kostenfrei und ohne Registrierung möglich.
Über OAI verfügbare Kataloge (sets)
Auswahl | Wert für Parameter "set" |
---|---|
Deutsche Nationalbibliografie ohne Gemeinsame Normdatei | dnb dnb:wv (nur Datensätze nach abgeschlossener Bearbeitung) |
Deutsche Nationalbibliografie, Reihe A (Publikationen des Verlagsbuchhandels) | dnb:reiheA (inkl. Datensätze in Bearbeitung und abgeschlossene Bearbeitung) dnb:wv:reiheA (nur Datensätze nach abgeschlossener Bearbeitung) |
Deutsche Nationalbibliografie, Reihe B (Publikationen außerhalb des Verlagsbuchhandels) | dnb:reiheB (inkl. Datensätze in Bearbeitung und abgeschlossene Bearbeitung) dnb:wv:reiheB (nur Datensätze nach abgeschlossener Bearbeitung) |
Deutsche Nationalbibliografie, Reihe C (Karten) | dnb:reiheC (inkl. Datensätze in Bearbeitung und abgeschlossene Bearbeitung) dnb:wv:reiheC (nur Datensätze nach abgeschlossener Bearbeitung) |
Deutsche Nationalbibliografie, Reihe H (Hochschulschriften) | dnb:reiheH (inkl. Datensätze in Bearbeitung und abgeschlossene Bearbeitung) dnb:wv:reiheH (nur Datensätze nach abgeschlossener Bearbeitung) |
Deutsche Nationalbibliografie, Reihe M (Musikalien) | dnb:reiheM (inkl. Datensätze in Bearbeitung und abgeschlossene Bearbeitung) dnb:wv:reiheM (nur Datensätze nach abgeschlossener Bearbeitung) |
Deutsche Nationalbibliografie, Reihe T (Musiktonträger) | dnb:reiheT (inkl. Datensätze in Bearbeitung und abgeschlossene Bearbeitung) dnb:wv:reiheT (nur Datensätze nach abgeschlossener Bearbeitung) |
Deutsche Nationalbibliografie, Reihe O (Online-Publikationen) | dnb:reiheO (inkl. Datensätze in Bearbeitung und abgeschlossene Bearbeitung) dnb:wv:reiheO (nur Datensätze nach abgeschlossener Bearbeitung) |
Deutsche Nationalbibliografie Einschränkung auf eine Sachgruppe | dnb:sg020 (Beispiel für Bibliotheks- und Informationswissenschaften) |
Deutsche Nationalbibliografie, Reihe A Einschränkung auf eine Sachgruppe | dnb:wv:reiheA:sg720 (Beispiel für Architektur) |
Deutsche Nationalbibliografie: Digitalisierte Inhaltsverzeichnisse | dnb:toc |
Katalog der Deutsche Nationalbibliothek mit Neuerscheinungsdienst und Online-Publikationen (ohne GND) | dnb-all |
Neuerscheinungsdienst (Verlegermeldungen zu Vorankündigungen und Neuerscheinungen) | dnb-all:reiheN |
Online-Publikationen ohne Einschränkungen | dnb-all:online |
Einschränkung auf eine Sachgruppe | dnb-all:online:sg020 (Beispiel für Bibliotheks- und Informationswissenschaften) |
Online-Hochschulschriften (auch ohne Autopsie) | dnb-all:online:dissertations |
Einschränkung auf eine Sachgruppe | dnb-all:online:dissertations:sg720 (Beispiel für Architektur) |
Deutsches Musikarchiv (DMA, inkl. Sammlung Historische Tonträger) | dnb-all:dma |
Deutsches Exilarchiv 1933–1945 (DEA) | dea |
Deutsches Buch- und Schriftmuseum (DBSM) | dbsm |
Auswahl | Wert für Parameter "set" |
---|---|
Gemeinsame Normdatei (GND) | authorities |
Gemeinsame Normdatei, GND-Entität Geografikum* | authorities:geografikum |
Gemeinsame Normdatei, GND-Entität Kongress* | authorities:kongress |
Gemeinsame Normdatei, GND-Entität Körperschaft* | authorities:koerperschaft |
Gemeinsame Normdatei, GND-Entität Person* | authorities:person |
Gemeinsame Normdatei, GND-Entität Sachbegriff* | authorities:sachbegriff |
Gemeinsame Normdatei, GND-Entität Werk* | authorities:werk |
Auswahl | Wert für Parameter "set" |
---|---|
Zeitschriftendatenbank (ZDB)** | zdb |
ZDB, Bestandssätze | zdb:holdings |
ZDB, Einschränkung auf eine Sachgruppe | zdb:sg010 (Beispiel für Informatik) |
ZDB, Online-Publikationen | zdb:online |
ZDB, Online Publikationen, Bestandssätze | zdb:online:holdings |
ZDB, Online-Publikationen, Einschränkung auf eine Sachgruppe | zdb:online:sg010 (Beispiel für Informatik) |
ZDB, Freie Online Publikationen | zdb:online:free |
ZDB, Freie Online Publikationen, Bestandssätze | zdb:online:free:holdings |
ZDB, Freie Online Publikationen, Einschränkung auf eine Sachgruppe | zdb:online:free:sg010 (Beispiel für Informatik) |
ISIL- und Sigelverzeichnis*** | bib |
* Beim OAI-Bezug (Harvesten) einzelner OAI-Untersets der Gemeinsamen Normdatei (GND) können die Relationen zwischen verknüpften GND-Datensätzen nicht nachvollzogen werden, wenn die entsprechenden GND-Datensätze zu einem anderen OAI-Unterset (bzw. einer anderen GND-Entität) gehören. Die Verknüpfungen sind im Unterset zwar wie üblich mit dem Identifier (MARC 21: Felder 5XX $0) und als Text beziehungsweise Zeichenkette (MARC 21: Felder 5XX $a) vorhanden, aber nicht der verknüpfte Datensatz selbst, wenn es sich um eine andere Entität handelt.
** Die Zeitschriftendatenbank ist ein gemeinsames Angebot der Staatsbibliothek zu Berlin – Preußischer Kulturbesitz und der Deutschen Nationalbibliothek.
*** Das ISIL- und Sigelverzeichnis ist die Adressdatei der Deutschen ISIL-Agentur / Sigelstelle der Staatsbibliothek zu Berlin.
Freie Sammlungen digitalisierter Objekte können Sie als Datensets über die OAI2 Schnittstelle abfragen. Weitere Informationen finden Sie im DNBLab.
Formate
Detaillierte Informationen zu den angebotenen Formaten finden Sie hier.
Nutzungs- und Bezugsbedingungen
Detaillierte Informationen zu den Nutzungs- und Bezugsbedingungen finden Sie hier.
Praktische Beispiele
Syntax einer OAI-Anfrage
Anfrage an OAI-Server der Deutschen Nationalbibliothek
https://services.dnb.de/oai/repository
Befehl an den Server
?verb=ListIdentifiers
Parameter „from“ gibt den Beginn des Abfragezeitraums an
&from=2021-04-21
Parameter „until“ gibt das Ende des Abfragezeitraumes an
&until=2021-04-22
gewünschtes Format der OAI-Antwort
&metadataPrefix=MARC21-xml
Festlegung des Katalogs bzw. Sets
&set=authorities
Syntax einer OAI-Anfrage auf eine bestimmte ID-Nummer
https://services.dnb.de/oai/repository?verb=GetRecord&metadataPrefix=MARC21-xml&identifier=oai:dnb.de/authorities/118540238
Syntax einer OAI-Anfrage nach Online-Dissertationen aus der Sachgruppe „Sozialwissenschaften, Soziologie, Anthropologie“ aus einem bestimmten Zeitraum
https://services.dnb.de/oai/repository?verb=ListRecords&from=2020-04-01T14:55:00Z&until=2020-07-08T09:54:59Z&metadataPrefix=oai_dc&set=dnb-all:online:dissertations:sg300
Häufig gestellte Fragen (FAQ)
Kontakt
Aktuelles
Letzte Änderung:
11.12.2024
Kurz-URL:
https://www.dnb.de/oai
Kontakt:
schnittstellen-service@dnb.de