Auf dieser Seite finden Sie

Updates von Metadaten in Rosetta



Metadaten-Updates allgemein

Mit Metadaten-Updates können deskriptive, administrative und strukturelle Metadaten der digitalen Ressourcen aktualisiert werden, die sich bereits im Speicher eines technischen Systems befinden, wie zum Beispiel einem Repositorium oder einem Langzeitverfügbarkeitssystem.

In einem LZV-System sind Metadaten-Updates immer dann nötig, wenn sich die Metadaten eines Objekts im Quellsystem ändern. In diesem Fall müssen die Metadaten auch im LZV-System aktualisiert werden, um beide Metadatensätze anzugleichen.

Mögliche Gründe für Änderungen an den Metadaten sind beispielsweise nachträgliche Berichtigungen oder eine Änderung am lizenzrechtlichen Status eines Objekts, z. B. durch das Ablaufen einer Sperrfrist.




Metadaten-Updates in Rosetta

Es können sowohl deskriptive, administrative als auch strukturelle Metadaten aktualisiert werden. Nach jedem Update erzeugt Rosetta eine neue Version der entsprechenden IEs.

Im vom hbz betriebenen Rosetta-System gibt es dabei drei wesentliche Möglichkeiten, um Metadaten-Updates durchzuführen:

  • Manuelle Updates von einzelnen IEs im Web Editor
  • Manuelle Updates von mehreren IEs mittels Publishing Configuration
  • Automatisierte Updates von ganzen Beständen mittels Rosetta OAI Updater

Manuelle Updates im Web Editor werden durchgeführt, wenn zum Beispiel kleinere Änderungen an einem oder wenigen Objekten nötig sind. Dabei werden IEs im Web Editor gesperrt und dann händisch bearbeitet. Manuelle Updates können von allen Kooperationspartnern selbstständig in Rosetta durchgeführt werden.

Updates mit einer Publishing Configuration eignen sich vor allem zum einmaligen Aktualisieren von größeren Datenmengen, z. B. um bereits eingelieferte Daten mit neueren Daten anzugleichen. Außerdem kann der Update Metadata Job für Metadaten genutzt werden, die nicht über eine OAI-Schnittstelle eingeliefert worden sind. Mit einer Publishing Configuration werden mehrere IEs zu einem Set zusammengefasst. Die Metadaten dieser IEs werden dann vorübergehend im Operational Storage als XML-Dateien abgelegt. Dieser Vorgang wird als Publishing bezeichnet, da die Metadaten für ein Update "zur Verfügung gestellt" werden. Auf diese Metadatensätze greift dann der Update Metadata Job von Rosetta zu, um sie mittels XSLT zu verändern und die IEs entsprechend zu aktualisieren.

Updates via Rosetta OAI Updater eignen sich für das regelmäßige Updaten von einem oder mehreren Beständen. So können Einlieferungsbestände fortlaufend mit den Metadaten im entsprechenden Quellsystem angeglichen werden. Voraussetzung dabei ist, dass die Metadaten über eine OAI-Schnittstelle nach Rosetta eingeliefert worden sind. Der Rosetta OAI Updater ist ein vom hbz entwickeltes Tool, das regelmäßig die OAI-Schnittstelle eines Quellsystems abfragt und dabei feststellt, ob sich die ausgelieferten Metadaten aller Objekte in einem Bestand seit der letzten Abfrage verändert haben. Wird eine Änderung festgestellt, werden die Metadaten der geänderten Objekte erneut geharvestet und als XML-Dateien auf dem zwischengeschalteten Speicher abgelegt. Das Vorgehen ist dabei ähnlich wie beim initialen Ingest der Daten. Vor dem Ablegen der Metadaten werden diese vom Rosetta OAI Updater mittels XSLT umgewandelt, sodass das gewünschte Mapping umgesetzt wird. Sowohl das XSLT für das Metadaten-Update als auch das XSLT für die Einlieferung basieren auf dem aktuell definierten Mapping des jeweiligen Bestandes. Auf die so erzeugten Metadatendateien greift daraufhin ein in Rosetta automatisierter Metadata Update Job zu, der die Metadaten der entsprechenden IEs auch in Rosetta aktualisiert. Anschließend entsprechen die Metadaten in Rosetta den aktuellen Metadaten im Quellsystem.


Gut zu wissen

Für Updates mittels Publishing Configuration oder automatisiert mittels Rosetta OAI Updater benötigt das LZV-Serviceteam die Information, welche Bestände und Felder in welchem Turnus aktualisiert werden sollen. Dazu bitten wir unsere Kooperationspartner, ein Ticket im Ticketsystem zu schreiben.


Weiterführende Infos

Weiterführende Infos zum Update Metadata Job finden Sie im Ex Libris Developer Network:

Updating IE Metadata with the Update Metadata Job

Batch Update of DC records

 


Manuelle Updates im Web Editor einzelner IEs

Für ein manuelles Update wird in den Web Editor der entsprechenden IE navigiert und sperrt diese mit Action: Lock Object. Daraufhin können die Metadaten im Tab Metadata bearbeitet werden. Geupdated werden können dabei deskriptive Metadaten in DC, administrative Metadaten in DNX, Source Metadata in XML und Strukturmetadaten in METS. Nicht bearbeitet werden können Retention Policies und Access Rights Policies.

Sind die Änderungen abgeschlossen, werden diese mit Action: Commit Changes gespeichert und die IE wieder freigegeben. Sollen die Änderungen nicht gespeichert werden, wird Action: Rollback Changes genutzt. Auch dann wird die IE daraufhin wieder freigegeben.




Automatisierte Metadaten-Abgleiche und -Updates zur regelmäßigen Anwendung

In diesem Abschnitt wird unseren Kooperationspartnern das Vorgehen für automatisierte Abgleiche und Updates von Metadaten mittels des vom hbz entwickelten Rosetta OAI Updaters beschrieben.
Dazu wird ein eigenständiges XSLT benötigt, wie oben bereits beschrieben.




Hinterlegung eines XSL Stylesheets für die Metadaten-Transformation (XSLT) auf den I/O-Server

Warnhinweis

Die Erstellung eines XSLT, auf Basis des aktuell vorhandenen Mappings für einen jeweiligen Bestand, wird vom LZV-Serviceteam übernommen.

  • Die XSL-Datei wird vom hbz auf dem I/O-Server im Ordner xslt des Update-Verzeichnisses bereitgestellt.
  • Der Dateiname der XSLT setzt sich folgendermaßen zusammen: update_<Bestandsname>.xsl




Konfiguration und Ausführung des Rosetta OAI Updaters

Warnhinweis

Der Rosetta OAI Updater kann nur vom LZV-Serviceteam konfiguriert und ausgeführt werden.

  • Auf dem I/O-Server wird für jede Rosetta-Institution eine Konfigurationsdatei im YAML-Format erstellt.
  • Mittels dieser Datei lassen sich Updates für einen oder mehrere Bestände konfigurieren.
  • Die Konfigurationsdatei enthält:
    • Angaben für die Rosetta Index-Anfragen
      • url: URL zur Solr-Instanz
      • authHeader: HTTP-Authorization-Header
    • Angaben für die Oracle Datenbank-Abfragen
      • url: Oracle JDBC Thin URL
      • user: Benutzername
      • password: Passwort
      • schemaPrefix: Präfix für die Datenbankschemata
    • Angaben zu Institution und Bestand
      • name: Name des Bestandes
      • baseUrl: OAI-PMH base URL
      • metadataPrefix: Bezeichnung des Metadatenformat 
      • sets: Sets auf der OAI-Schnittstelle
      • xsltPath: NFS Pfad zum XSLT
      • resultPath: NFS Pfad zum Ergebnisverzeichnis (enthält die update.xml für jede IE zur anschließenden Verarbeitung mittels Update Metadata Job)



  • Auf den I/O-Server wird mittels Cronjob der Rosetta OAI Updater gemäß festgelegtem Zeitplan ausgeführt.




Konfiguration und Durchführung des Update Metadata Jobs

  • Update Metadata Jobs über Data Management Manage Sets and Processes → Update Metadata Job aufrufen



  • auf Add Job klicken



  • Namen eingeben
  • (Warnung) Achtung! Beim Anlegen eines neuen Jobs erst unter Scheduling den gewünschten Zeitpunkt terminieren, sonst wird der eingegebene Name zurückgesetzt.
  • Scheduling: den gewünschten, regelmäßigen Zeitpunkt, an dem der Harvester Job laufen soll, auswählen
    • alternativ: No Scheduling 
  • User ID: den eigenen Benutzernamen eingeben
  • NFS Path: der Pfad des Ordners auf dem I/O-Server, der zuvor in der Konfiguration des Rosetta OAI Updaters festgelegt wurde
  • auf Apply klicken


  • der angelegte Job erscheint nun in der Übersichtsliste und kann über Run Now ausgeführt werden





Manuelle Metadaten-Updates zur einmaligen Anwendung

Ein Weg, ein Metadaten-Update in Rosetta durchzuführen, ist die XSLT-Umwandlung von bereits existierenden Records innerhalb von Rosetta via Publishing Configuration und des daraufhin durchgeführte Update Metadata Jobs. Dies wird in diesem Abschnitt explizit für unsere Kooperationspartner näher erläutert.

Für das Updaten von Metadaten in Rosetta sind verschiedene Komponenten notwendig:

XSL Stylesheet: Das Stylesheet für die Transformation der XML-Metadaten gibt an, welche Metadaten zu einer Intellectual Entity (IE) auf welche Weise durch das Metadaten-Update verändert werden sollen.

Publishing Configuration (Set + Publishing Profile): 

  • Set: Über das Set in der Publishing Configuration wird festgelegt, für welche IEs aus dem Permanent Storage ie.xmls auf dem I/O-Server erzeugt werden sollen, damit deren Metadaten dort im Anschluss aktualisiert werden können.
  • Publishing Profile: Im Publishing Profile wird festgelegt, welcher Ordner auf dem I/O-Server und welches XSL-File für die Transformation der Metadaten genutzt werden.

Publishing Job: Ist die Publishing Configuration erstellt, kann sie als Publishing Job laufen. Dadurch werden auf dem I/O-Server ie.xmls erzeugt, die die transformierten Metadaten der ausgewählten IEs enthalten.

Update Metadata Job: Erst durch das Ausführen des Update Metadata Jobs werden Metadaten der IEs tatsächlich aktualisiert, sofern der Job Abweichungen zwischen den originalen und den transformierten Metadaten feststellt.




Hinterlegung eines XSL Stylesheets für die Metadaten-Transformation (XSLT) im Rosetta-Administrationsbereich

Das Stylesheet für die Umwandlung der XML-Metadaten gibt an, welche Metadaten zu einer IE auf welche Weise durch das Metadaten-Update verändert werden sollen.


Warnhinweis

Das XSL Stylesheet kann nur im Administrationsbereich von Rosetta durch das LZV-Serviceteam hinterlegt werden. 





Konfiguration der Publishing Configuration

  • Aufruf über Data ManagementManage Sets and ProcessesPublishing Configuration





Neue Publishing Configuration anlegen

  • auf Add Configuration klicken



  • unter General Details einen Namen und ggf. eine Beschreibung angeben
  • Republish all on next sync: Wird diese Option ausgewählt, werden bei einem erneuten Laufen des Publishing Jobs alle IEs erneut verarbeitet, ansonsten nur die neu hinzugekommenen; werden also z. B. Änderungen am XSLT vorgenommen, sollte die Option ausgewählt werden.





IE-Set für das Metadaten-Update festlegen
  • auf Sets klicken
  • ein bestehendes Set über Add Set auswählen oder
  • über Create Set ein neues Set anlegen


Weiterführende Infos

Informationen und eine ausführliche Anleitung zur Erstellung von Sets gibt es im Service-Wiki.

Sets und Prozesse in Rosetta



Publishing Profile anlegen
  • im Reiter Profiles auf Add Profile klicken



  • einen Namen und bei Bedarf eine Beschreibung eingeben
  • Preservation Type: freilassen
  • Converter Type: XSLIEConverterPlugin
  • Target Type: NFSPublisherPlugin
  • Include CMS: freilassen
  • Include Access Rights: freilassen
  • auf Next klicken


  • XSL File: die richtige XSL-Datei auswählen
  • Folder: im Output-Ordner des I/O-Servers einen neuen Ordner für den Update Metadata Job anlegen und den entsprechenden Pfad hier eingeben
    • Wenn mehrere Update Metadata Jobs durchgeführt werden sollen, muss für jeden Job ein neuer Ordner angelegt werden.
  • Number Of Sub-directories: 1
  • File Extension: xml
    • ohne Punkt!
  • auf Save klicken
  • in der Übersicht des Profiles erneut auf Save klicken





Publishing Job ausführen

  • Die Publishing Configuration erscheint nun in der Übersicht unter Data ManagementManage Sets and ProcessesPublishing Configuration.
  • über Run Now kann die Configuration als Publishing Job ausgeführt werden 





Konfiguration und Durchführung des Update Metadata Jobs

  • Update Metadata Jobs über Data Management Manage Sets and Processes → Update Metadata Job aufrufen



  • auf Add Job klicken



  • Namen eingeben
  • (Warnung) Achtung! Beim Anlegen eines neuen Jobs erst unter Scheduling den gewünschten Zeitpunkt terminieren, sonst wird der eingegebene Name zurückgesetzt.
  • Scheduling: den gewünschten, regelmäßigen Zeitpunkt, an dem der Harvester Job laufen soll, auswählen
    • alternativ: No Scheduling 
  • User ID: den eigenen Benutzernamen eingeben
  • NFS Path: der Pfad des Ordners auf dem I/O-Server, der zuvor im Publishing Profile festgelegt wurde
  • auf Apply klicken



  • der angelegte Job erscheint nun in der Übersichtsliste und kann über Run Now ausgeführt werden





  • Keine Stichwörter