Datenaggregation in Memobase

Um Dokumente in Memobase zu aggregieren wird ein Bestand sowie eine Institution in Memobase vorausgesetzt. Sowohl eine Instituion als auch ein Bestand können mittels Formular ausgefüllt werden. Memoriav gibt diese Angaben direkt im CMS ein.

Dokumente umfassen nebst den Medienobjekten (alternativ Streaming- oder Embeddinglinks zu den extern gehosteten Medienobjekten) die zugehörigen Metadaten sowie optional Thumbnails zur Visualisierung.

Ablieferungsprozess

Memoriav stellt den datengebenden Institutionen eine Cloud ablage für die Ablieferung zur Verfügung. Ein Austausch über andere Kanäle ist ebenfalls möglich.

Datenaggregation in Memobase - Ablieferungsprozess

Institution und Bestand

Um die Zuweisung von Dokumenten zu Beständen und Institutionen zu ermöglichen müssen diese in Memobase abgebildet werden. Dies geschieht durch Memoriav direkt im CMS.

Vorlage Institution (Datenmodell)

  • Für illustrierende Bilder wie Logos und Teaserbilder werden grundsätzlich folgende Grössen empfohlen, wobei die maximale Dateigrösse jeweils 64 MB beträgt. Als Dateiformate werden die bereits genannten akzeptiert (jpg, jpeg, png, gif).

    • Institution

      • Headerbild: 2850 (B) x 1410 (H) Pixel

      • Teaserbild: 960 (B) x 720 (H) Pixel

      • Logo: Mindestens 350 Pixel breit, Höhe ist variabel

Vorlage Bestand (Datenmodell)

  • Bestand

    • Teaserbild: 960 (B) x 720 (H) Pixel

    • Gallerie: Mindestens 600 Pixel breit, Höhe ist variabel (idealerweise vier Bilder mit möglichst ähnlicher Aspect Ratio)

Dokumente

Die Metadaten werden in einem akzeptierten Dateiformat benötigt (codiert jeweils nach UTF-8):

  • CSV bzw. TSV

  • XLS bzw. XLSX

  • XML oder JSON

  • Abfragen via API (OAI-PMH)

Auf dieser Basis wird durch Memoriav in Absprache mit der datengebenden Institution ein Mapping auf Memobase RDF erstellt. Die Mitwirkung von Datengebern oder eine bedarfsorientierte Zusammenarbeit bei der Erläuterung und Verfeinerung der Metadaten ist von Vorteil (Hinweise zur Datenqualität). Je höher der Grad an Normalisierung und Verknüpfung mit Normdatenbanken ist, desto einfacher ist die Verarbeitung der Daten und desto grösser sind die Möglichkeiten, die Daten optimal für die Suche und die Facetten in Memobase aufzubereiten. Folgende Merkmale sind dabei von Nutzen:

  • Verlinkung mit Normdaten: Eine korrekte Verlinkung über die Identifier der verwendeten Normdatenbank (GND, ORCID, etc.) oder alternativ individualisierende Merkmale - je mehr, desto besser.

  • Individualisierende Merkmale: Bei Personen sind dies etwa Lebensdaten oder Organisationszugehörigkeiten (sog. Affiliationen). Bei Geografika helfen Kantons- bzw. Länderzuordnungen. Die Merkmale stehen idealerweise in spezifischen und klar ausgezeichneten Metadatenfeldern mit einer möglichst einheitlichen Verwendung von Trennzeichen. Personen enthalten zudem im Idealfall eine Beziehungskennzeichnung, also eine Angabe, in welcher Art von Beziehung sie zu einem Objekt stehen (Content Creator, Publisher, Sängerin, Schauspieler, Sprecherin usw.)

Memobase speichert sowohl die Medienobjekten (bzw. deren Streaminglinks) als auch zugehörige Thumbnails. Letztere werden verwendet, um bspw. in der Ergebnisliste der Suche einen ersten Eindruck auf den Inhalt zu vermitteln. Generell werden folgende Dateiformate für alle Arten von Medienobjekten und Thumbnails akzeptiert:

  • jpg bzw. jpeg (auch tif bzw. tiff ist möglich, Memoriav wandelt dies zu jpg um

  • png

  • gif

  • mp3

  • mp4

Der Auflösung bzw. Qualität der Medienobjekte sind nach oben keine Grenze gesetzt. Die Anpassung an die idealen Auflösungen wird im Rahmen des Imports von der Memobase selbst vorgenommen. Je höher die Qualität, desto besser wirken die Medien in Memobase. Grössenlimitationen könne von der datengebenden Instituion gewünscht werden.

Wo keine Thumbnails mitgeliefert werden, werden diese nach Möglichkeit von Memobase selbst erstellt. Dies ist sowohl für stehende Bilder als auch für Videos möglich (Quellen: Youtube, Vimeo oder lokal bei Memobase gespeicherte Objekte). Zudem wird für lokal bei Memobase gespeicherte Audio-Objekte ein Sonogramm erstellt, welches in der Ergebnisliste einen Eindruck auf die ersten dreissig Sekunden des Inhalts vermittelt (ausgenommen: Objekte mit rechtlichen Einschränkungen, die nur auf Memobase+ oder FaroWeb konsultiert werden können).

Die Thumbnails werden auf drei Arten erstellt:

  • Bilder: On-demand vom IIIF-Imageserver erstellt bzw. aus dem Cache geholt.

  • Audio: Das Thumbnail besteht aus einem Sonogramm und einem abgedunkelten Hintergrundbild. Das Sonogramm zeigt die ersten 30 Sekunden des Tracks, während das Hintergrundbild als “Schmuckbild” für den gesamten Bestand via administrativem Backend von den datengebenden Institutionen definiert wird (und damit jederzeit ausgetauscht werden kann, ohne das ein Reimport notwendig wäre). Für lokal vorhandene Audioobjekte wird ein Snippet erstellt und im Medienverzeichnis abgelegt.

  • Videos: Für Videoobjekte wird ein Vorschaubild generiert. Dieses kann entweder im Rahmen des Importprozesses vom Datengeber definiert und mit importiert werden (die Empfehlung lautet hier, eine möglichst hohe Auflösung zu haben - je höher, desto besser). Für Youtube- und Vimeo-Videos wird ein Vorschaubild über deren API heruntergeladen. Für alle anderen Fälle wird schliesslich ein Default-Bild verwendet. Vorschaubilder aus den ersten beiden Varianten werden on-demand vom Medienserver ausgeliefert (analog zu den Thumbnails von Bildobjekten).

 

Inskünftig geplant

  • SWITCH edu-ID Account: Dieser persönliche Account identifiziert die Kontaktperson des Datengebers und ermöglicht den Zugriff auf das Admin-GUI von Memobase. In diesem kann ein Datengeber die Beschreibungen für die Institution und deren Bestände bearbeiten und korrigieren sowie die hochgeladenen Medienobjekte vor deren Publikation auf Memobase prüfen.

  • Unterzeichnete Vereinbarung zur Datenlieferung: Die Vereinbarung regelt die Ablieferung eines Bestandes an Memobase und definiert allfällige rechtliche Einschränkungen.

Use Case SLSP

 

 

Daten werden wie gewohnt in Alma durch die Bibliothek erschlossen.

Alma synchronisiert tagesaktuell die Daten zu Swisscovery und macht dort die Metadaten zugänglich.

Für Memobase muss ein virtuelles Set (entspricht der Erschliessungsstufe Sammlung/Bestand) erstellt werden.

 

Memobase kann via OAI-PMH die Metadaten der virtuellen Sets aus Swisscovery abfragen und nach vordefinierten Regeln in Memobase aggregieren.

Um Ergänzungen und Änderungen zu berücksichtigen, ist eine tagesaktuelle Synchronisation mit Memobase möglich.

 

Zugangangsdaten sind via Memobase zur Verfügung zu stellen, alternativ kann Memobase auch Streamen oder Embedden.

Für den Datenaustausch stellt Memoriav einen Cloud-Dienst zur Verfügung.

Erlaubte Formate sind jpg, mp3 oder mp4 (weitere auf Anfrage).

 

Optional: Eine Rücknahme der angereicherten Metadaten aus Memobase via https://api.memobase.ch/ sowie der Zugangsdaten (aktuell nur Foto) via IIIF ist möglich. Eine Ergänzung der Daten in Alma zum Derivat in Memobase (URL) ist gewünscht.

In Memobase werden die Institution sowie der Bestand / die Sammlung abgebildet. Memoriav kümmert sich um das Mapping und die Transformation der MARC Daten zu RiC (Metadatenformat von Memobase) und spricht dafür die notwendigen Details mit der Institution ab. Memobase reichert die Daten an und normalisiert diese.

Mapping MARC21 zu MBC