Auf dieser Seite finden Sie

Fehler-behandlung in Loading


Loading-Fehler in Rosetta

Bei einem halbautomatisierten Ingest oder einem Ingest via OAI-PMH Harvester Job und anschließendem Submission Job können in Rosetta Loading-Fehler auftreten. Betroffene Submission Information Packages (SIPs) werden in den Technical Analyst verschoben und sind dort im Reiter Loading zu finden.



Loading-Fehler treten auf, wenn SIPs nicht vom Rosetta Deposit Storage in die Staging Area geladen werden können, wo die Objekte als Intellectual Entities (IEs) angelegt und weiterverarbeitet werden. Eine mögliche Ursache sind Probleme beim initialen Ingest, die verhindert haben, dass eine oder mehrere Dateien vom Quellsystem in den Deposit Storage von Rosetta heruntergeladen werden konnten. Mehrere Ursachen kommen in Frage, insbesondere die folgenden:

  • Verbindungsabbrüche während des Submission Jobs
  • Dateinamen, die zu lang sind oder unerlaubte Sonderzeichen enthalten (z. B. den Schrägstrich "/")
  • fehlende bzw. zugriffsgeschützte Dateien im Quellsystem

Um Loading-Fehler zu beheben, reicht das Anstoßen eines Reruns nicht aus, da Rosetta dabei lediglich versucht, die beschädigten Daten im Deposit-Storage erneut in die Staging Area zu laden. Es findet kein erneuter Downloadversuch der Daten vom Quellsystem in den Deposit Storage statt. Der Fehler bleibt unverändert erhalten. Loading-Fehler können auf diesem Weg nicht behoben werden.




Fehlerbehebung

Um Loading-Fehler zu behandeln, empfiehlt es sich, zunächst die Fehlerursache zu ermitteln, um anschließend Schritte zur Behebung planen und ausführen zu können.

Im Quellsystem können folgende Maßnahmen zum Erfolg führen:

  • Umbenennen von Dateien / Kürzen von Dateinamen
  • Einfügen von fehlenden Dateien ins Quellsystem
  • Freigeben von Daten mit Nutzungsbeschränkungen

Sofern Loading-Fehler durch Verbindungsabbrüche hervorgerufen worden sind, sollte die Verbindung zum Quellsystem nach Möglichkeit stabilisiert werden.

Nach Abschluss der Maßnahmen können die fehlerhaften Objekte neu eingeliefert werden. Dieser Vorgang ist ein mehrschrittiger Prozess.



Warnhinweis

Für Dateinamen muss Folgendes beachtet werden:

  • zu vermeidende Sonderzeichen sind bspw.:
    • “ / \ : * ? ‘ < > [ ] & $ = ; , | %
    • Umlaute wie Ä, Ü, Ö, usw.
  • maximale Länge von Dateinamen:
    • 255 Zeichen inkl. Dateiendung (z.B. ".tiff")





Re-Ingest der Daten nach Rosetta

Bei einem Ingest, der mehrere SIPs enthält, empfiehlt sich folgende Reihenfolge.
Handelt es sich um den Ingest eines einzelnen SIPs, kann direkt mit Schritt 3 begonnen werden.

  1. Zuerst sollten alle anderen Fehlertypen wie z.B. Validation und Metadata Extraction Errors in Rosetta behoben werden.
  2. Dann können alle fehlerfreien SIPs in den Permanentspeicher verschoben werden.
  3. Anschließend werden die fehlerhaften SIPs im Tab "Loading" declined, um sie aus Rosetta zu entfernen.
  4. Nach dem Entfernen der fehlerhaften Daten kann ein neuer Harvester Job oder eine halbautomatisierte Deposity Activity angestoßen werden, um einen Re-Ingest durchzuführen.
    1. Damit der Job nur die zuvor entfernten Records harvestet, muss sowohl Ignore Last Runtime ausgewählt werden, als auch Match mit dem Wert "OAI header id". Dann kann der Harvester erneut gestartet werden. Auf diese Weise werden nochmals alle Records der ausgewählten Sets geharvestet. Records, bei denen Rosetta anhand der OAI header id erkennen kann, dass diese Objekte bereits im Permanent Storage gespeichert sind, werden ignoriert. Durch dieses Matching werden während des Harvests nur die Metadaten der fehlenden, vorher entfernten Objekte in SIPs auf dem I/O-Server gespeichert und alle anderen Records übersprungen.
  5. Diese SIPs können nun mittels Submission Job erneut geingested werden.

Wenn die vorherige Fehlerbehebung erfolgreich verlaufen ist, treten beim Re-Ingest keine Loading-Fehler mehr auf.




  • Keine Stichwörter