Metadaten-Updates allgemein

Mit Metadaten-Updates können deskriptive, administrative und strukturelle Metadaten der digitalen Ressourcen aktualisiert werden, die sich bereits im Speicher eines technischen Systems befinden, wie zum Beispiel einem Repositorium oder einem Langzeitverfügbarkeitssystem.

In einem LZV-System sind Metadaten-Updates immer dann nötig, wenn sich die Metadaten eines Objekts im Quellsystem ändern. In diesem Fall müssen die Metadaten auch im LZV-System aktualisiert werden, um beide Metadatensätze anzugleichen.

Mögliche Gründe für Änderungen an den Metadaten sind beispielsweise nachträgliche Berichtigungen oder eine Änderung am lizenzrechtlichen Status eines Objekts, z. B. durch das Ablaufen einer Sperrfrist.

Metadaten-Updates in Rosetta

Es können sowohl deskriptive, administrative als auch strukturelle Metadaten aktualisiert werden. Nach jedem Update erzeugt Rosetta eine neue Version der entsprechenden IEs.

Im vom hbz betriebenen Rosetta-System gibt es dabei drei wesentliche Möglichkeiten, um Metadaten-Updates durchzuführen:

Manuelle Updates von einzelnen IEs im Web Editor
Manuelle Updates von mehreren IEs mittels Publishing Configuration
Automatisierte Updates von ganzen Beständen mittels Rosetta OAI Updater

Manuelle Updates im Web Editor werden durchgeführt, wenn zum Beispiel kleinere Änderungen an einem oder wenigen Objekten nötig sind. Dabei werden IEs im Web Editor gesperrt und dann händisch bearbeitet. Manuelle Updates können von allen Kooperationspartnern selbstständig in Rosetta durchgeführt werden.

Updates mit einer Publishing Configuration eignen sich vor allem zum einmaligen Aktualisieren von größeren Datenmengen, z. B. um bereits eingelieferte Daten mit neueren Daten anzugleichen. Außerdem kann der Update Metadata Job für Metadaten genutzt werden, die nicht über eine OAI-Schnittstelle eingeliefert worden sind. Mit einer Publishing Configuration werden mehrere IEs zu einem Set zusammengefasst. Die Metadaten dieser IEs werden dann vorübergehend im Operational Storage als XML-Dateien abgelegt. Dieser Vorgang wird als Publishing bezeichnet, da die Metadaten für ein Update "zur Verfügung gestellt" werden. Auf diese Metadatensätze greift dann der Update Metadata Job von Rosetta zu, um sie mittels XSLT zu verändern und die IEs entsprechend zu aktualisieren.

Updates via Rosetta OAI Updater eignen sich für das regelmäßige Updaten von einem oder mehreren Beständen. So können Einlieferungsbestände fortlaufend mit den Metadaten im entsprechenden Quellsystem angeglichen werden. Voraussetzung dabei ist, dass die Metadaten über eine OAI-Schnittstelle nach Rosetta eingeliefert worden sind. Der Rosetta OAI Updater ist ein vom hbz entwickeltes Tool, das regelmäßig die OAI-Schnittstelle eines Quellsystems abfragt und dabei feststellt, ob sich die ausgelieferten Metadaten aller Objekte in einem Bestand seit der letzten Abfrage verändert haben. Wird eine Änderung festgestellt, werden die Metadaten der geänderten Objekte erneut geharvestet und als XML-Dateien auf dem zwischengeschalteten Speicher abgelegt. Das Vorgehen ist dabei ähnlich wie beim initialen Ingest der Daten. Vor dem Ablegen der Metadaten werden diese vom Rosetta OAI Updater mittels XSLT umgewandelt, sodass das gewünschte Mapping umgesetzt wird. Sowohl das XSLT für das Metadaten-Update als auch das XSLT für die Einlieferung basieren auf dem aktuell definierten Mapping des jeweiligen Bestandes. Auf die so erzeugten Metadatendateien greift daraufhin ein in Rosetta automatisierter Metadata Update Job zu, der die Metadaten der entsprechenden IEs auch in Rosetta aktualisiert. Anschließend entsprechen die Metadaten in Rosetta den aktuellen Metadaten im Quellsystem.

Gut zu wissen

Für Updates mittels Publishing Configuration oder automatisiert mittels Rosetta OAI Updater benötigt das LZV-Serviceteam die Information, welche Bestände und Felder in welchem Turnus aktualisiert werden sollen. Dazu bitten wir unsere Kooperationspartner, ein Ticket im Ticketsystem zu schreiben.

Weiterführende Infos

Weiterführende Infos zum Update Metadata Job finden Sie im Ex Libris Developer Network:

Updating IE Metadata with the Update Metadata Job

Batch Update of DC records

Manuelle Updates im Web Editor einzelner IEs

Für ein manuelles Update wird in den Web Editor der entsprechenden IE navigiert und sperrt diese mit Action: Lock Object. Daraufhin können die Metadaten im Tab Metadata bearbeitet werden. Geupdated werden können dabei deskriptive Metadaten in DC, administrative Metadaten in DNX, Source Metadata in XML und Strukturmetadaten in METS. Nicht bearbeitet werden können Retention Policies und Access Rights Policies.

Sind die Änderungen abgeschlossen, werden diese mit Action: Commit Changes gespeichert und die IE wieder freigegeben. Sollen die Änderungen nicht gespeichert werden, wird Action: Rollback Changes genutzt. Auch dann wird die IE daraufhin wieder freigegeben.

Automatisierte Metadaten-Abgleiche und -Updates zur regelmäßigen Anwendung

In diesem Abschnitt wird unseren Kooperationspartnern das Vorgehen für automatisierte Abgleiche und Updates von Metadaten mittels des vom hbz entwickelten Rosetta OAI Updaters beschrieben.
Dazu wird ein eigenständiges XSLT benötigt, wie oben bereits beschrieben.

Weiterführende Infos

In GitHub steht der Code des Rosetta OAI-Updaters zur Nutzung und Weiterentwicklung zur Verfügung.
Er ist im LZV.nrw-Bereich unter https://github.com/lzv-nrw/rosetta-oai-updater veröffentlicht.

Konfiguration und Ausführung des Rosetta OAI Updaters

Warnhinweis

Der Rosetta OAI Updater kann nur vom LZV-Serviceteam konfiguriert und ausgeführt werden.

Auf dem I/O-Server wird für jede Rosetta-Institution eine Konfigurationsdatei im YAML-Format erstellt.
Mittels dieser Datei lassen sich Updates für einen oder mehrere Bestände konfigurieren.
Die Konfigurationsdatei enthält:
- Angaben für die Rosetta Index-Anfragen
  - url: URL zur Solr-Instanz
  - authHeader: HTTP-Authorization-Header
- Angaben für die Oracle Datenbank-Abfragen
  - url: Oracle JDBC Thin URL
  - user: Benutzername
  - password: Passwort
  - schemaPrefix: Präfix für die Datenbankschemata
- Angaben zu Institution und Bestand
  - name: Name des Bestandes
  - baseUrl: OAI-PMH base URL
  - metadataPrefix: Bezeichnung des Metadatenformat
  - sets: Sets auf der OAI-Schnittstelle
  - xsltPath: NFS Pfad zum XSLT
  - resultPath: NFS Pfad zum Ergebnisverzeichnis (enthält die update.xml für jede IE zur anschließenden Verarbeitung mittels Update Metadata Job)

Auf den I/O-Server wird mittels Cronjob der Rosetta OAI Updater gemäß festgelegtem Zeitplan ausgeführt.

Konfiguration und Durchführung des Update Metadata Jobs

Update Metadata Jobs über Data Management → Manage Sets and Processes → Update Metadata Job aufrufen

auf Add Job klicken

Namen eingeben
Achtung! Beim Anlegen eines neuen Jobs erst unter Scheduling den gewünschten Zeitpunkt terminieren, sonst wird der eingegebene Name zurückgesetzt.
Scheduling: den gewünschten, regelmäßigen Zeitpunkt, an dem der Harvester Job laufen soll, auswählen
- alternativ: No Scheduling
User ID: den eigenen Benutzernamen eingeben
NFS Path: der Pfad des Ordners auf dem I/O-Server, der zuvor in der Konfiguration des Rosetta OAI Updaters festgelegt wurde
auf Apply klicken

der angelegte Job erscheint nun in der Übersichtsliste und kann über Run Now ausgeführt werden

Manuelle Metadaten-Updates zur einmaligen Anwendung

Ein Weg, ein Metadaten-Update in Rosetta durchzuführen, ist die XSLT-Umwandlung von bereits existierenden Records innerhalb von Rosetta via Publishing Configuration und des daraufhin durchgeführte Update Metadata Jobs. Dies wird in diesem Abschnitt explizit für unsere Kooperationspartner näher erläutert.

Für das Updaten von Metadaten in Rosetta sind verschiedene Komponenten notwendig:

XSL Stylesheet: Das Stylesheet für die Transformation der XML-Metadaten gibt an, welche Metadaten zu einer Intellectual Entity (IE) auf welche Weise durch das Metadaten-Update verändert werden sollen.

Publishing Configuration (Set + Publishing Profile):

Set: Über das Set in der Publishing Configuration wird festgelegt, für welche IEs aus dem Permanent Storage ie.xmls auf dem I/O-Server erzeugt werden sollen, damit deren Metadaten dort im Anschluss aktualisiert werden können.
Publishing Profile: Im Publishing Profile wird festgelegt, welcher Ordner auf dem I/O-Server und welches XSL-File für die Transformation der Metadaten genutzt werden.

Publishing Job: Ist die Publishing Configuration erstellt, kann sie als Publishing Job laufen. Dadurch werden auf dem I/O-Server ie.xmls erzeugt, die die transformierten Metadaten der ausgewählten IEs enthalten.

Update Metadata Job: Erst durch das Ausführen des Update Metadata Jobs werden Metadaten der IEs tatsächlich aktualisiert, sofern der Job Abweichungen zwischen den originalen und den transformierten Metadaten feststellt.

Publishing Profile anlegen

im Reiter Profiles auf Add Profile klicken

einen Namen und bei Bedarf eine Beschreibung eingeben
Preservation Type: freilassen
Converter Type: XSLIEConverterPlugin
Target Type: NFSPublisherPlugin
Include CMS: freilassen
Include Access Rights: freilassen
auf Next klicken

XSL File: die richtige XSL-Datei auswählen
Folder: im Output-Ordner des I/O-Servers einen neuen Ordner für den Update Metadata Job anlegen und den entsprechenden Pfad hier eingeben
- Wenn mehrere Update Metadata Jobs durchgeführt werden sollen, muss für jeden Job ein neuer Ordner angelegt werden.
Number Of Sub-directories: 1
File Extension: xml
- ohne Punkt!
auf Save klicken
in der Übersicht des Profiles erneut auf Save klicken

Konfiguration und Durchführung des Update Metadata Jobs

Update Metadata Jobs über Data Management → Manage Sets and Processes → Update Metadata Job aufrufen

auf Add Job klicken

Namen eingeben
Achtung! Beim Anlegen eines neuen Jobs erst unter Scheduling den gewünschten Zeitpunkt terminieren, sonst wird der eingegebene Name zurückgesetzt.
Scheduling: den gewünschten, regelmäßigen Zeitpunkt, an dem der Harvester Job laufen soll, auswählen
- alternativ: No Scheduling
User ID: den eigenen Benutzernamen eingeben
NFS Path: der Pfad des Ordners auf dem I/O-Server, der zuvor im Publishing Profile festgelegt wurde
auf Apply klicken

der angelegte Job erscheint nun in der Übersichtsliste und kann über Run Now ausgeführt werden

Seitenhierarchie

Metadaten-Updates allgemein

Metadaten-Updates in Rosetta

Manuelle Updates im Web Editor einzelner IEs

Automatisierte Metadaten-Abgleiche und -Updates zur regelmäßigen Anwendung

Hinterlegung eines XSL Stylesheets für die Metadaten-Transformation (XSLT) auf den I/O-Server

Konfiguration und Ausführung des Rosetta OAI Updaters

Konfiguration und Durchführung des Update Metadata Jobs

Manuelle Metadaten-Updates zur einmaligen Anwendung

Hinterlegung eines XSL Stylesheets für die Metadaten-Transformation (XSLT) im Rosetta-Administrationsbereich

Konfiguration der Publishing Configuration

Neue Publishing Configuration anlegen

IE-Set für das Metadaten-Update festlegen

Publishing Profile anlegen

Publishing Job ausführen

Konfiguration und Durchführung des Update Metadata Jobs

Seitenhierarchie

Updates von Metadaten in Rosetta

Metadaten-Updates allgemein

Metadaten-Updates in Rosetta

Manuelle Updates im Web Editor einzelner IEs

Automatisierte Metadaten-Abgleiche und -Updates zur regelmäßigen Anwendung

Hinterlegung eines XSL Stylesheets für die Metadaten-Transformation (XSLT) auf den I/O-Server

Konfiguration und Ausführung des Rosetta OAI Updaters

Konfiguration und Durchführung des Update Metadata Jobs

Manuelle Metadaten-Updates zur einmaligen Anwendung

Hinterlegung eines XSL Stylesheets für die Metadaten-Transformation (XSLT) im Rosetta-Administrationsbereich

Konfiguration der Publishing Configuration

Neue Publishing Configuration anlegen

IE-Set für das Metadaten-Update festlegen

Publishing Profile anlegen

Publishing Job ausführen

Konfiguration und Durchführung des Update Metadata Jobs