...
Wie bei der Transformation der Daten für den Suchindex sind die RiC-RDF Metadaten die Grundage für die Datenpipeline. Target Format ist das von Europeana definierte EDM Format. Obwohl sowohl Ausgangs- als auch Zielmodell in RDF abgebildet werden, unterscheiden sie sich stark voneinader. Kommt hinzu, dass wir Ric-RDF in Json-ld serialisieren, das EDM RDF Format jedoch zwingend in RDF-XML serialisiert werden muss.
Die durch die pipeline erstellten EDM RDF-XML Dokumente werden in unserem Elasticsearch Index indexiert (dafür wird der Microservice “Metadaten Ingest” genutzt). Der ES Index (Indexname oai-v*) ist dann die Grundlage für die OAI Schnittstelle. Beispielabfrage mit verb ListRecords und einem set, welches für Europeana erstellt wurde.
Das Mapping der Daten zwischen RiC-RDF und EDM ist recht aufwendig. Ausserdem benötigt man neben den rico Daten noch Informationen aus den institution und record-set Suchindices. Gewichtige Gründe dafür, dieses mapping nicht als ad-hoc Transformation in die oai Schittstelle zu verlegen. (wie das früher zum Teil in http://sru.swissbib.ch gemacht worden ist. Bei anderen Formaten mag das wieder anders sein oder Transformationen können komplett obsolet werden, wenn wir über oai zum Beispiel direkt RicRDF ausliefern wollen. Allerdings wäre wohl, um den dem OAI Standard gerecht zu werden, eine RDF XML Serialisierung notwendig.
Abschlussbemerkung: Die Basis des service ist ein Scala “functional Extractor” Mechanismus, wie er von Sebastian Schüpbach für den IIIF Manifest Creator zuerst implementiert wurde. Dieser eignet sich sehr gut auch für Metadatenspezialist*innen, sei es im Umfeld memoriav oder Bibliothek. Diese dann auch interaktiven Möglichkeiten, mit denen Datenpipelines- oder Datenanalyseservices auch von einem breiteren Personenkreis erstellt werden können, werden wir in Zukunft ausbauen. Dabei wird der breitere Personenkreis wohl eher Python als Scala verwenden. (es sein denn Scala 3 wird plötzlich doch zu Python für jedermann - man wird sehen….)
...