Fragestellungen Datenanalyse
Auf dieser Seite werden ausgewählte Beispiele präsentiert, die exemplarisch zeigen, welche Fragestellungen mit der Analyse und Visualisierung der Daten in Kibana beantwortet werden können. Sie geben damit auch für interessierte Institutionen und Nutzer*innen einen Eindruck davon, welches Potential die Datenanalyse mit Kibana bietet.
Die Visualisierungen wurden von der UB Basel erstellt und können grundsätzlich mit anderen Institutionen, die einen auf Alma2Elastic basierenden Index betreiben, ausgetauscht werden (vgl. Exportieren von Dashboards und Visualisierungen).
Beispiele:
Fehleranalyse und Überwachung
Die Datenstruktur im Elasticsearch Index ermöglicht detaillierte Abfragen über die bibliographischen Daten. Diese können unter anderem dazu genutzt werden, Fehler in den Daten aufzufinden. Zur einfachen Überwachung und regelmässiger Bereinigung von Fehlern kann die Anzahl Treffer zu diversen Abfragen auf einem Dashboard zusammengestellt werden. Dadurch wird eine Übersicht über vorhandene Fehler ermöglicht und es existiert ein zentraler Einstiegspunkt für die weitere Bearbeitung.
Diverse Zählervisualisierungen für Abfragen von Fehlern, zum Beispiel:
Aufnahmen ohne Feld 245 $a
Aufnahmen mit einem Feld, dass gemäss MARC21 und lokalen Anwendungsregeln nicht exisiert
Aufnahmen mit einem zu kurzen oder zu langen Feld 008
Aufnahmen mit einem falschen Identifier in Verknüpfungsunterfeldern ($w)
Aufnahmen ohne Jahr in 008, aber mit Jahr an anderer Stelle in der Aufnahme
Status Sacherschliessung
Die folgenden Visualisierungen dienen der Analyse der Abdeckung von bibliographischen Aufnahmen mit Sacherschliessung aus der GND oder aus anderen Normdateien. Sie zeigen auf, wie gross der Anteil Aufnahmen mit, resp. ohne Sacherschliessung ist. Sie können damit Inputs für verschiedene Fragestellungen liefern. Zum Beispiel über das Potential für Datenanreicherungsprojekte oder für den Entscheid, ob sich ein Mapping von vorhandener lokaler Sacherschliessung zur GND lohnt oder nicht.
Anteil Aufnahmen mit/ohne Sacherschliessung
Die Visualisierung zeigt auf, welcher Anteil der bibliographischen Aufnahmen Sacherschliessung enthält und welcher nicht. Der Anteil an Aufnahmen mit Sacherschliessung wird unterteilt in Aufnahmen mit GND-Sacherschliessung und Aufnahmen mit Sacherschliessung aus anderen Normdateien.
Eine analoge Visualisierung steht für Klassifikationen (unterteilt nach DDC, RVK, und keine Klassifikation) zur Verfügung.
Anzahl Aufnahmen pro Normdatei
Ergänzend zur ersten Visualisierung zeigt diese Visualisierung die Anzahl Aufnahmen pro Normdatei. Damit kann insbesondere der Anteil Aufnahmen ohne GND-Sacherschliessung vertiefter analysiert werden.
Analyse GND-Verknüpfungen
Da die bibliographischen Aufnahmen im Rahmen der Verarbeitung durch Alma2Elastic mittels des GND-Service mit Daten aus der GND angereichert werden (vgl. Datenaufbereitung, Anreicherung), sind vertiefte Analysen über die Nutzung von GND-Daten und die verwendeten GND-Datensätze möglich. Diese dienen einerseits dem Auffinden von Fehlern, zum Beispiel mit der Abfrage von Aufnahmen in denen eine Verknüpfung zu einem GND-Satz mit Level 6 vorhanden ist. Andererseits können weitere Informationen zu den Entitäten aus der GND analysiert werden. So ist zumindest ansatzweise eine Analyse darüber möglich, wie viele Frauen, resp. Männer, an den Ressourcen in einem Bestand beteiligt waren.
Die folgenden Visualisierungen zeigen Analysen für die Sucheinstiege für Personen. Sie sind analog für alle anderen Entitäten möglich.
Die Anzahl Felder mit einer GND-Verknüpfung.
Die Anzahl genutzter GND-Sätze von Personen.
Die Anzahl Aufnahmen, in denen eine Verknüpfung zu einer GND-Aufnahme enthalten ist, unterteilt nach Level der GND-Aufnahme.
Diese Analyse setzt die Anreicherung der bibliographischen Daten mit Daten aus der GND voraus.
Die Anzahl Aufnahmen, in denen eine Verknüpfung zu einer GND-Aufnahme enthalten ist, unterteilt nach dem Teilbestandskennzeichen der GND-Aufnahme.
Diese Analyse setzt die Anreicherung der bibliographischen Daten mit Daten aus der GND voraus.
Anteil Aufnahmen unterteilt nach Gender-Angaben aus der GND der beteiligten Personen.
Diese Analyse setzt die Anreicherung der bibliographischen Daten mit Daten aus der GND voraus. Eingeschränkt wird sie auf Seite der GND-Daten dadurch, dass Gender-Angaben in der GND nur zwischen männlich/weiblich unterscheiden und nicht in allen Datensätzen vorhanden sind.
Auf Seite der bibliographischen Daten wird die Visualisierung dadurch eingeschränkt, dass ausschliesslich oder zusätzlich Personen ohne Verknüpfungen zur GND oder zu einer GND-Aufnahme ohne Gender-Angabe vorhanden sind.
Bestand entdecken
Mit Kibana sind auch Visualisierungen über die bibliographischen Daten möglich, die dazu einladen, einen Bestand zu entdecken und aus einer anderen Perspektive anzuschauen.
Aufnahmen nach erstem Erscheinungsjahr
Die Anzahl Aufnahmen nach ihrem ersten Erscheinungsjahr auf einem Zeitstrahl.
GND-Themen als Tag Cloud
Eine Tag Cloud über die 300 am häufigsten verwendeten Sachschlagwörter aus der GND.
Anzahl Aufnahmen pro Erscheinungs-/Druckort auf einer Karte
Die Verortung der Aufnahmen, die eine Verknüpfung zum Erscheinungs- oder Druckort in der GND enthalten.
Diese Analyse setzt die Anreicherung der bibliographischen Daten mit Daten aus der GND voraus. In diesem Fall wurden die Koordinaten verwendet, die in GND-Aufnahmen für Orte häufig enthalten sind.