"Ein Bibliotheksadressverzeichnis für alle Fälle" – RDFa löst Infrastrukturprobleme
Ein einheitliches und aktuelles, aber nicht manuell zu pflegendes Bibliotheksadressverzeichnis ist seit langem Wunsch der bibliothekarischen Einrichtungen und Gremien. Unterschiedlichste Anläufe wurden bereits genommen und endeten mehr oder weniger vielversprechend – langfristige und stabile Lösungen bedingen jedoch den Rahmen von existierenden Infrastrukturen und größeren Dienstleistungen wie z.B. die ISIL-Stelle an der Zeitschriftendatenbank (ZDB) oder die Deutsche Bibliotheksstatistik (DBS).
Es ist zu beobachten, dass erste Bibliotheken begonnen haben, ihre über Jahrzehnte gesammelten Informationen (Titeldaten, Sacherschließung, Bestandsangaben etc.) aus den traditionellen fachinternen Formaten (MAB, MARC) in einen allgemeinen, webkompatiblen Standard (Resource Description Framework, RDF) zu überführen. Mit diesem Schritt können bibliothekarische Informationen in das World Wide Web integriert und die Kataloge so aus dem Deep Web gehoben werden. Allerdings sind neben den klassischen Katalogdaten auch Informationen zu Bibliotheken und Sammlungen selbst, zu Öffnungszeiten, Bestand, Kontakt- und Ausleihmöglichkeiten wichtig. Eher versteckt und nicht auf der Startseite der Bibliothekswebseiten liegen diese Informationen zur Abholung bereit. Diese Informationen sind in der Regel nur menschen-, jedoch nicht maschinenlesbar.
Ein Projekt des hbz soll nun die Möglichkeiten untersuchen, Informationen über Institutionen und Sammlungen auf Webseiten maschinenlesbar zu machen, indem sie mit RDFa – das heißt durch das Hinzufügen einiger zusätzlicher HTML-Attribute – angereichert werden. Auf dieser Basis können diese Daten von zentralen Diensten aggregiert und durchsuchbar gemacht werden, so dass Bibliotheken und ihre Dienste im Web optimal auffindbar sind. Die Publikation der aggregierten Daten unter einer offenen Lizenz ermöglicht zudem die Integration der Daten in bestehende Dienste sowie die Entwicklung darauf basierender neuer Dienste.
Bestehende Bibliotheksverzeichnisse
Ein Überblick über nationale und regionale Bibliotheksadresssammlungen zeigt derzeit in Deutschland mindestens zehn Bibliotheksverzeichnisse. Diese unterscheiden sich teilweise stark in:
- Anzahl der erfassten Bibliotheken,
- Umfang der erfassten Informationen (Metadatenfelder),
- Erscheinungsart und -medium,
- Zugriffs- und Abfragemöglichkeiten,
- Aktualität.
Eine Bibliothek, die in mehreren dieser Verzeichnisse aufgeführt ist, muss dementsprechend Informationen über sich selbst an mehrere Verzeichnisse senden und aktuell halten. Unter dieser Praxis leidet zuallererst die Aktualität der Daten, denn kaum jemand schafft es, die Informationen regelmäßig an mehreren Orten gleichzeitig zu aktualisieren.
Ein weiterer Nachteil dieser Zusammentragungen ist, dass die Informationen nicht in ma-schinenlesbaren Webstandards für Daten vorliegen, so dass sie ohne Weiteres von anderen Diensten konsumiert und weiterverarbeitet werden könnten. Meist sind die Daten – wenn sie nicht sogar in Druckpublikationen vorliegen – Teil des Deep Webs.
Hintergrund
In einem Vorläuferprojekt wurden im hbz das ISIL-Verzeichnis und die MARC Organization Codes der Library of Congress in RDF überführt und im Web präsentiert und durchsuchbar gemacht. Dieses Verzeichnis ist Teil des vom hbz gestarteten experimentellen Dienstes lobid.org, der auch die offenen Titeldaten des hbz als Linked Open Data enthält, und kann unter http://lobid.org/de/organisation/suche.html durchsucht werden. Die einzelnen Einträge enthalten Adressdaten der jeweiligen Institution angereichert mit Google Maps. Hinter der menschenlesbaren Präsentation verbergen sich maschinenlesbare RDF-Daten.
Unable to render content due to system error: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'com.adaptavist.confluence.footnotes.AddFootnoteMacro': Lookup method resolution failed
Im Laufe des Projekts stellte sich die Frage, wie die Daten gepflegt werden können und wir kamen zu dem Schluss, dass zentral gepflegte Verzeichnisse nicht längerfristig überzeugen können. Das hbz möchte nun in einem Folgeprojekt die Grundlagen und Möglichkeiten eines dezentralen Ansatzes erforschen und Wege der Umsetzung finden.
Ein RDFa-basierter Ansatz dezentraler Beschreibung und nachträglicher Aggregierung
Die Entwicklung von Linked-Data-Standards ermöglicht es, völlig neue Wege zu gehen in der Erstellung und Pflege zentraler Verzeichnisse von Bibliotheken und verwandten Institutionen. Die grundlegende Technologie für einen solchen Ansatz bietet RDFa, das für RDF in Attributes steht. RDFa ermöglicht die Verquickung menschenlesbarer Information mit maschinenlesbarem RDF. Mit RDFa lassen sich HTML-Seiten derart anreichern, dass aus einer Seite maschinenlesbare RDF-Tripel extrahiert werden können, die Linked-Data-Standards folgen.
Unable to render content due to system error: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'com.adaptavist.confluence.footnotes.AddFootnoteMacro': Lookup method resolution failed
Konzept
Folgende Grundidee zur Präsentation von Bibliotheken im Web und zur Erstellung und Pflege von Bibliotheksverzeichnissen steckt hinter dem Projekt:
- Es werden Vokabulare entwickelt, auf dessen Basis bibliothekarische Institutionen und ihre Sammlungen standardisiert beschrieben werden können.
- Bibliotheken beschreiben sich und ihre Sammlungen unter Nutzung dieses Vokabulars auf ihren Webseiten und reichern diese Information mit RDFa an.
- Bibliotheken melden die URL der Beschreibungsseite an zentrale Verzeichnisse wie das Sigelverzeichnis, die DBS oder lobid.org.
- Die Daten werden von lobid.org sowie allgemeinen Suchmaschinen wie Google eingesammelt und dienen als Basis von Verzeichnis- und Suchdiensten, wodurch die Auffindbarkeit einer Institution und ihrer Sammlungen im Web optimiert wird.
Vorteile
Vorteile eines solchen Ansatzes sind untere anderem:
- Die Datenerstellung und -pflege findet einmalig statt und Mehraufwand durch redun-dante Arbeit wird verhindert.
- Institutionelle Webseiten sind jene Orte, an denen die Information am zuverlässig-sten gepflegt und aktualisiert wird. Im Ergebnis führt dieser Ansatz dazu, dass die Informationen zuverlässig in der aktuellsten Form vorliegen.
- Die Daten stehen beliebiger Wiederverwendung zu anderen Zwecken offen. Auch Google berücksichtigt seit einiger Zeit RDFa-Anreicherung in Webseiten zur Verbesserung seiner Suchdienste. Die Daten dienen also nicht nur der Erstellung von Bibliotheksverzeichnissen, sondern können etwa auch durch Suchmaschinen und Kartendienste wie die Open Street Map oder Google Maps sowie in anderen Diensten wiederverwendet werden.
- Die Publikation der Daten auf institutionellen Webseiten hat den sehr wichtigen "Nebeneffekt", dass über den jeweiligen Namensraum der Informationsseite (z.B. hbz-nrw.de) eine Autorisierung der Informationen möglich ist und dadurch Spam oder Falschinformationen ohne eine komplexes und ressourcenaufwändiges Redaktionsverfahren reduziert werden können.
- Durch zunehmende Verknüpfung der gesammelten Daten mit anderen Daten (Linked Data) ergeben sich Möglichkeiten für komplexere Recherchen und neue Dienste. So ließe sich etwa mit wenig Aufwand das Ziel erreichen, eine Abfrage der Daten von Bibliotheken einer bestimmten Region zu bewerkstelligen.
Arbeitsschritte
Folgende Schritte hat das hbz im Rahmen dieses Projekts bereits identifiziert:
- Finden von kooperierenden Bibliotheken, die erste experimentelle Anwendungen auf ihren Webseiten umsetzen.
- Auswahl und Entwicklung von Vokabularen zur Beschreibung bibliothekarischer Organisationen und Sammlungen im engen Austausch mit Bibliotheken und unter Berücksichtigung der derzeitigen Praxis der Beschreibung in Bibliotheksverzeichnissen und auf Institutionswebseiten
- Prototypische Beschreibung einiger Institutionen und Sammlungen auf den institutionseigenen Webseiten unter Verwendung der entwickelten Vokabulare inklusive RDFa-Anreicherung.
- Bereitstellung und Pflege von Informationen und Diensten zur Unterstützung von Bibliotheken bei der Erstellung von RDFa-angereicherten Webseiten in unterschiedlichen Systemen (CMS, statische HTML-Seiten, Wikis etc.).
- Entwicklung eines Melde- und Aggregierungsmechanismus für RDFa-angereicherte Organisations- und Sammlungsbeschreibungen.
Darüber hinaus müssen auch unterstützende Informationen und Tools bereitgestellt werden, die Bibliotheken bei der Erstellung von RDFa-angereicherten Webseiten in unterschiedlichen Systemen (CMS, statische HTML-Seiten, Wikis etc.) unterstützen. - Aggregation der Daten auf lobid.org und Publikation des Aggregats unter einer offenen Lizenz
Unable to render content due to system error: org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'com.adaptavist.confluence.footnotes.AddFootnoteMacro': Lookup method resolution failed
zur Nachnutzung durch das ISIL-Verzeichnis, die DBS etc.
Die Rolle des Kompetenznetzwerks für Bibliotheken
Der Aufbau der geschilderten dezentralen Infrastruktur hängt letztlich davon ab, wie sehr die Grundidee Verbreitung und Akzeptanz findet und von wie vielen Institutionen sie umgesetzt wird. Es gilt also möglichst zügig eine „kritische Masse“ von Institutionen zu finden, die sich auf ihren Homepages auf der Basis eines vorgegebenen Vokabulars beschreiben und diese Beschreibungen mit maschinenlesbarem RDF anreichern. Der Erfolg des Unterfangens hängt dabei maßgeblich von zwei Dingen ab:
- Möglichst viele Institutionen zu erreichen, um auf das Projekt aufmerksam zu machen, seinen Nutzen zu verdeutlichen und Anwender zu finden.
- Interessierte Akteure durch Informationsangebote und andere Dienste in die Lage zu versetzen, die Beschreibung nach den technischen Vorgaben und Anforderungen des Vokabulars durchzuführen.
Es sind diese beiden maßgeblichen Aspekte, bei denen das KNB als Kooperationspartner dem Projekt von großem Nutzen sein könnte. Denn sowohl erreicht das KNB aufgrund seiner Netzwerkstruktur eine Menge Akteure als auch kann es wertvolles Feedback zu den Wünschen, Fragen und Implementierungsproblemen auf Seiten von bibliothekarischen Einrichtungen liefern.