Page Comparison

Status

colour	Purple
title	UNDER construction

Inc drawio

zoom	1
simple	0
pageId	374276107
custContentId	618594627
lbox	1
diagramDisplayName	postprocessing-steps.drawio
hiResPreview	0
baseUrl	https://memobase.atlassian.net/wiki
diagramName	postprocessing-steps.drawio
imgPageId	618627505
pCenter	0
aspect	FxrIFq4vqtaKI8HJX3_7 1
width	781
includedDiagram	1
aspectHash	ba6702e1469582dbb70c2cff075c5535736f76fd
links	auto
tbstyle	top
height	561

Import Process Bridge

Die Import Process Bridge überführt die Daten in eine JSON-LD-Struktur, welche von den nachfolgenden Services für die verschiedenen Endpoints aufbereitet wird. Sie ist damit das Bindeglied zwischen dem ersten Teil des Import-Workflows, welcher ursprünglich als einzigen Endpoint das Fedora-Repository hatte, und dem zweiten Teil - dem “Post-Processing”, der als Quelle die in Fedora gespeicherten Daten hatte. Die Import Process Bridge existiert für alle drei Importworkflows - Dokumente, Bestände und Institutionen.

...

Die durch die Datenpipeline erstellten EDM RDF-XML Dokumente werden im Elasticsearch-Index indexiert (siehe unten Metadaten Ingest). Der Elasticsearch-Index (Indexname oai-v*) ist dann die Grundlage für die /wiki/spaces/MD/pages/366313714 (siehe die Beispielabfrage mit verb ListRecords und einem Set, welches für Europeana erstellt wurde).

Das Mapping der Daten zwischen Memobase RDF und EDM ist aufwendig und benötigt neben den RiCO-Daten weitere Informationen aus den Suchindizes für Institutionen und Bestände. Aus diesen Gründen wurde das Mapping nicht als ad-hoc-Transformation in die OAI-Schittstelle verlegt (wie dies früher bspw. in swissbib SRU gemacht wurde). In anderen, nicht-EDM-bezogenen Fällen kann diese Methode angepasst werden - bspw. indem direkt Memobase RDF in einer XML-Serialisierung ausgeliefert wird.

...

Metadaten Ingest (in Elasticsearch)

[…]

Siehe: Post-Processing Steps (derzeit noch in Erarbeitung)Dieser Service akzeptiert Metadaten im JSON format und indexiert diese in Elasticsearch. Der Service ist optimiert, damit möglichst viele Dokumente gleichzeitig indexiert werden können.

Versions Compared

Old Version 6

New Version Current

Key

Import Process Bridge

Metadaten Ingest (in Elasticsearch)