Was ist bei der Zeichenkodierung zu beachten?
Die RDF-Daten werden in der Codierung UTF-8 decomposed („zerlegt“) angeboten, auch bezeichnet als Normalization Form Decomposed (NFD). Dabei werden zum Beispiel diakritische Zeichen als eigenständige Zeichen (Unicode Segment „Combining Diacritics“) geführt, was für die Verarbeitung der Daten (zum Beispiel Indexierung) gegebenenfalls berücksichtigt werden sollte. Je nach Anwendungskontext empfiehlt sich unter Umständen eine Konversion in die Normalform NFC vor der Weiterverarbeitung der Daten.
Kurz-URL:
https://www.dnb.de/metadatendienste
Kontakt:
metadatendienste@dnb.de