Im allgemeinen Sprachgebrauch spricht man von Dateiformaten, im Rahmen der LZA ist jedoch eine technisch präzisere Klassifizierung anhand der PRONOM-puids ('fmt/...') vonnöten. Zur Suchmaske für PRONOM-Identifier geht es hier: http://www.nationalarchives.gov.uk/PRONOM/PUID/proPUIDSearch.aspx?status=new

Unterstützte Primärdatenformate

Unterstützte Formate gelten als derzeit langzeitarchivierungssicher und werden bei Obsoleszenz automatisch konvertiert.

  • JPG2000 (x-fmt/392)
  • TIFF uncompressed
  • PDF/A
    • Validierung mittels PDFBox für nächste Version geplant
  • DOCX (fmt/412,fmt/494)
  • PCM-WAV

Verstandene Primärdatenformate

Verstandene Primärdatenformate sind diejenigen, die effektiv von der Langzeitarchivierungskomponente des System in unterstützte Formate umgewandelt werden.

  • TIFF compressed
    • x-fmt/399,x-fmt/388,x-fmt/387,fmt/353,fmt/152,fmt/153,fmt/154,fmt/155,fmt/156 -> TIFF uncompressed (Zielformat-puid???)
    • ungeklärt: fmt/367
  • JPEG 
    • fmt/41,fmt/42,fmt/43,fmt/44,x-fmt/398,x-fmt/390,x-fmt/391 -> JPEG2000 (x-fmt/392)
    • ungeklärt: fmt/112, fmt/367
  • BMP 
    • fmt/114,fmt/115,fmt/116,fmt/117,fmt/118,fmt/119,x-fmt/270 -> TIFF uncompressed (Zielformat-puid)
  • PNG
    • fmt/11,fmt/12,fmt/13 -> TIFF uncompressed (Zielformat-puid)
  • PDF 
    • Konversion mittels Ghostscript, ohne Validierung
    • fmt/14,fmt/15,fmt/16,fmt/17,fmt/18,fmt/19,fmt/20,fmt/276 -> PDF/A (puid - Zielformat) 
    • ungeklärt: fmt/95, fmt/354
  • MP3
    • fmt/134 -> WAV (Zielformat-puid???)

Alle hier nicht gelisteten, anderen PUID dieser Formatgruppen fallen in die Kategorie der akzeptierten Formate. 

Andere Formate

Akzeptierte Formate

Alle in den oberen beiden Kategorien nicht aufgeführten Formate fallen automatisch in diese Kategorie, wenn sie als eindeutig klassifizierbare Formate erkannt werden können (Wenn also ein Pronom Identifer o.ä. für sie bereit steht). Für akzeptierte Formate kann lediglich Bitstream-Preservation garantiert werden.

Wie aus akzeptierten Formaten verstandene gemacht werden können, zeigt das Kapitel: "Liste aller potentiell möglichen Dateiformate bei der Einlieferung".

Unbekannte Formate

Im Unterschied zu akzeptierten Formaten, können unbekannte Dateien unbekannten Formats auch nicht klassifiziert werden. Das bedeutet, dass für solche Daten keine Formatidentifier vorliegt und selbst wenn zu einem späteren Zeitpunkt ein geeigneter Konverter existiert, der aus Daten dieses Typs LZA-fähige Dateien generieren kann, ist dies schwierg feststellbar, da kein Identifier in der Datenbank des DANRW für die Daten vorliegt, um dies herauszufinden.

Liste aller potentiell möglichen Dateiformate bei der Einlieferung

Grundsätzlich unterstützt die DA-NRW Software-Suite die Einbindung unterschiedlichster Formatkonversionsprogramme. Dabei ist lediglich zu beachten, dass diese auf der Linux-Kommandozeile ausgeführt werden können. Die entsprechenden Datenbankeinträge für die Policies werden vom DA-NRW-Admin vorgenommen (für eine Hilfestellung siehe hierzu auch die technische Dokumentation).

Hinweis: Es ist wünschenswert, dass, wenn eine neue Konversionroutine systemweit hinzugefügt wird, dass also alle Knoten diese unterstüzten, d.h. installieren. Es ist aber auch möglich, die Konversionsroutine auf einzelnen Knoten einzurichten und die Bearbeitungsfunktionalität den übrigen Knoten im Grid zur Verfügung zu stellen. Dies beinträchtigt die Performace des Gesamtsystems und sollte daher nur in Fällen in Erwägung gezogen werden, in denen Lizenzierungsgründe die Installation des entsprechenden Konverters auf den anderen Knoten einschränken.

Hier in finden sie eine Auflistung von Formaten, die leicht zu den Verstanden hinzugefügt werden können, da die entsprechenden Konverter bereits auf allen Knoten vorliegen

ImageMagickListe aller von ImageMagick lesbaren Dateiformte (ggf. unter Verwendung weiterer Bibliotheken)

TODO: Handbrake

  • Keine Stichwörter