10 Linked Data

Linked Data

Der Einsatz eines (neueren) Discovery-Systems bedeutet im Bibliotheksbereich oftmals, dass die Einbindung, Verwaltung und Handhabung von elektronischen Ressourcen (kurz e-Ressourcen) verbessert möglich – oder überhaupt ermöglicht wird. Um diesen Mehrwert nutzen zu können, werden e-Ressourcen-Management-Systeme eingesetzt, die wiederum auf einen sogenannten “Central Index” (Artikel-Index) zugreifen. Konkrete Suchanfragen darin werden über die Oberfläche des Discovery Systems oder die des e-Ressourcen-Management-Systems umgesetzt. Wichtig zu verstehen ist hier also, dass nebst einer Software oftmals auch die Daten im Hintergrund, respektive ein Central Index „mitgekauft“ wird.

Dies wurde mit Sandras Erklärungen und ihrem Praxisbeispiel der Universität Bern sehr gut (be)greifbar:

Wird eine Suche nach „Bern“ über die Discovery-View der Institutionzone Bern getätigt, werden während dem Tippen des Suchbegriffs mehrere Menüs, bzw. Suchmöglichkeiten vorgeschlagen: (physische) Zeitschriften- und Buchbestand der Universität und PH Bern, UniBe und PH plus oder swisscovery. Wenn Sandra eingeloggt ist und in UniBe und PH plus (CDI) sucht (was der CDI, also der Central Discovery Index ist), werden alle mittels ihrer IP-Adresse zur Verfügung stehenden Ressourcen angezeigt. So werden E-Books-Kapitel oder elektronische Artikel angezeigt, die in einer normalen Suche im (physischen) Zeitschriften und Bücherbestand nicht ausgegeben werden. Wenn ein System wie Aleph oder VuFind vorhanden ist, kann zu den eigenen Daten über die dann dementsprechend selbst verfügt wird – mittels einem Central Index die Suche und dessen Ergebnisse erweitert werden. Die Daten kommen dann von einem zentral verwalteten “Datenpot” von bspw. Ex Libris.

Daneben wurde von Herr Lohmeier auf finc.info hingewiesen. Dies ist ein Versuch einer Nutzergemeinschaft von VuFind Anwender’innen selbst einen (offenen) Suchmaschinenindex aufzubauen und zugänglich zu machen. Dazu lädt die Universitätsbibliothek Leipzig verschiedene Daten und bietet so wie es bspw. Exlibris auch tut das dann als Central Index an. Ein ähnliches Projekt ist das des gemeinsamen Bibliotheksverbund K10. K10 ist ein gemeinsamer Katalog von zwei Biliotheksverbünden in Deutschland. Über K10 Plus Zentral werden dann (wie es auch Exlibris tut) verschiedene Metadatenquellen zusammengefügt und das dann wiederum als Suchindex für alle teilnehmenden Bibliotheken zur Verfügung gestellt. Im gleichen Kontext wird Crossref als die grösste Agentur, die die allseits bekannte DOI vergibt verortet. Crossref ist DIE Datenbank für elektronische Artikel, die jeweils in öffentlichen Discovery-indizes oder bspw. in Primo Central verzeichnet sind – weit über die Hälfte der Daten für die Central Discovery Indizes stammen aus Crossref.

Aktuelle Datenmodelle für Metadaten

BIBFRAME für die Bibliothekswelt

BIBFRAME ist ein Datenformat, das von der Library of Congress ins Leben gerufen wurde. Es soll als Nachfolgerin von MARC21 (und dem bisschen schlankeren MARC21, dem sogenannten MODS (Modern Object Description Schema)) die modernen Entwicklungen hin Richtung Semantic Web und Linked Data Strukturen besser abbilden und diesen Konzepten gerecht werden, indem es auf dessen Paradigmen beruht.

Basis von BIBFRAME ist FRBR (Functional Requirements for Bibliographic Records). Dieses hat viele Ähnlichkeiten mit dem CIDOC CRM, was eher Bedingungen und Voraussetzungen für ein Datenformat definiert, als es selbst eines ist. In FRBR wird also keine Formatvorgabe gemacht, sondern „nur“ Entitäten und Perspektiven beschrieben. Basis von RFBR wiederum ist RDA (Resource Description and Access), das für die Beschreibung und den Nachweis von Quellen in Bibliotheken und Archiven dient. BIBFRAME hingegen setzt weder RDA noch FRBR vollständig um, was auch durchaus für Kritik sorgt.

Erwähnenswert erscheint mir, dass sich BIBFRAME aus einem Datenmodell und einem Vokabular/einer Ontologie zusammensetzt. Das Datenmodell lässt sich (im Unterschied zu MARC21) mittels 3 verschiedener Ebenen aufteilen in:

Work: das Werk, die intellektuelle Idee selbst, also bspw. “Stolz und Vorurteil”
Instance: die verschiedenen Ausgaben der Verlage, die sich auf dasselbe Werk beziehen
und Item: das einzelne, spezifische Buch

Daraufhin werden dann wie auf einer weiteren Ebene im Datenmodell Entitäten beschrieben:

Agent: die zur Entstehung des Objekts beigetragen haben
Subject: Personen, Ereignisse oder Themen, die das Werk behandelt
und Event: einen Event, das das Werk wiedergibt

Im Vokabular werden Konzepte und deren Eigenschaften definiert um die Entitäten des Datenmodells genauer beschreiben zu können. Dies geschieht mittels Klassen (Class) und den jeweiligen konkreten Eigenschaften derer (Property). Class und Property ist vergleichbar mit den MARC-Feldern und deren Unterfeldern. Im Gegensatz zu einem Datensatz in MARC21 unterliegen Class und Property aber teils einem hierarchischen Konzept. Ganz Konkret: Jane Austen hat mehrere Bücher geschrieben. In BIBFRAME wird dies als „Beziehungsnetz“ oder „Beziehungsgeflecht“ dargestellt, denn Jane Austen wird mit all ihren Büchern verknüpft. In MARC21 ist man jedoch gezwungen, sie bei jedem einzelnen Buch erneut als Autorin zu erfassen. Hier wird Kontextwissen wie „mitgeliefert“, in MARC21 hingegen ist dies nicht per se nötig um einen Datensatz verstehen und in einem Katalog abbilden zu können. Eine Konvertierung von einem Datensatz in MARC21 zum Format BIBRAME ist möglich, aber es gibt noch keine Tools, respektive Anwendungen, die dann den Mehrwert oder das Innovative aus BIBFRAME wirklich herausholen können.

Records in Context (RiC) für die Archivwelt

RiC ist in den kurzen, prägnanten Worten des Dozenten „genau dasselbe wie BIBFRAME - einfach für Archive“. Im Bibliotheksbereich hat im Vergleich zu den Archiven eine grössere Standardisierung stattgefunden. Standards wie z.B. ISAAR (CPF) oder ISDF, die wir auch im Studium sehr theoretisch kennen gelernt haben, sind in der Praxis nie so wirklich zur Anwendung gekommen. RiC soll das besser machen, was bei ISAD(G) in der heutigen Zeit klar fehlt: neue und vor allem auch mehrfache Beziehungen zwischen Records, respektive Entitäten ermöglichen. RiC soll sich nun also etablieren und dem konsequenten Einsatz von Normdaten in Archiven eine neue Chance geben. Ich werde mir auf jeden Fall mal noch das Projekt ‘ENSEMEN’ ansehen, das an einer schweizerischen Ausprägung des neuen Standards arbeitet.

Abschliessend wurden uns noch folgende Tutorials zum selber durcharbeiten emppfohlen: