Status | ||||
---|---|---|---|---|
|
Inc drawio | ||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Import Process Bridge
Die Import Process Bridge überführt die Daten in eine JSON-LD-Struktur, welche von den nachfolgenden Services für die verschiedenen Endpoints aufbereitet wird. Sie ist damit das Bindeglied zwischen dem ersten Teil des Import-Workflows, welcher ursprünglich als einzigen Endpoint das Fedora-Repository hatte, und dem zweiten Teil - dem “Post-Processing”, der als Quelle die in Fedora gespeicherten Daten hatte. Die Import Process Bridge existiert für alle drei Importworkflows - Dokumente, Bestände und Institutionen.
...
Die durch die Datenpipeline erstellten EDM RDF-XML Dokumente werden im Elasticsearch-Index indexiert (siehe unten Metadaten Ingest). Der Elasticsearch-Index (Indexname oai-v*) ist dann die Grundlage für die /wiki/spaces/MD/pages/366313714 (siehe die Beispielabfrage mit verb ListRecords und einem Set, welches für Europeana erstellt wurde).
Das Mapping der Daten zwischen Memobase RDF und EDM ist aufwendig und benötigt neben den RiCO-Daten weitere Informationen aus den Suchindizes für Institutionen und Bestände. Aus diesen Gründen wurde das Mapping nicht als ad-hoc-Transformation in die OAI-Schittstelle verlegt (wie dies früher bspw. in swissbib SRU gemacht wurde). In anderen, nicht-EDM-bezogenen Fällen kann diese Methode angepasst werden - bspw. indem direkt Memobase RDF in einer XML-Serialisierung ausgeliefert wird.
...
Metadaten Ingest (in Elasticsearch)
[…]
Siehe: Post-Processing Steps (derzeit noch in Erarbeitung)Dieser Service akzeptiert Metadaten im JSON format und indexiert diese in Elasticsearch. Der Service ist optimiert, damit möglichst viele Dokumente gleichzeitig indexiert werden können.