- Erstellt von Pia Rudnik, zuletzt aktualisiert von Carmen Sonntag am 07.01.2026 Lesedauer: 5 Minute(n)
Auf dieser Seite finden Sie
METS-Ingest
Der METS-Ingest ist eines von mehreren Ingest-Verfahren zur Überführung digitaler Ressourcen in das LZV-System Rosetta. Bei einem METS-Ingest werden Nutzdateien nach Rosetta eingeliefert, deren inhaltliche, technische, administrative und strukturelle Eigenschaften als Metadaten in Form einer METS-Datei abgebildet sind. Diese METS-Datei wird neben den Nutzdateien als Teil des Submission Information Packages (SIPs) in Rosetta eingeliefert. Zwar werden dort nach jedem Ingest alle Metadaten in METS-Dateien gespeichert, allerdings muss ein Ingest nicht zwingend als METS-Ingest erfolgen. Zur genauen Struktur einer METS-Datei für die Einlieferung in Rosetta s. auch Das METS-Metadatenaustauschformat in Rosetta.
Beim METS-Ingest beschreibt eine METS-Datei immer eine Intellectual Entity (IE) sowie ihre 1-n Representations und Files. Der METS-Ingest eignet sich gut für halbautomatisierte und automatisierte Ingests größerer Datenmengen bzw. für regelmäßige Ingests über längere Zeiträume hinweg.
Weiterführende Infos
Weitere Informationen zu PREMIS, METS, SIPs und weiteren Begriffen der Langzeitverfügbarkeit finden Sie im Glossar
Anforderungen an die METS-Ordnerstruktur
Beim METS-Ingest müssen die einzuliefernden Ressourcen in einer bestimmten Ordnerstruktur vorliegen, damit Rosetta sie als SIP verarbeiten kann. Diese Struktur dient vor allem dazu, einzelne SIPs sowie deren Metadaten und Nutzdateien voneinander zu unterscheiden und sie PREMIS-konform als IEs, Representations und Files in Rosetta abzubilden.
Mit Ausnahme des Sonderfalls Limited METS, s. Abschnitt Limited METS-Ingest in Rosetta, wird die Struktur einer IE mitsamt ihrer Representations und Files in den Sektionen <structMap> und <fileSec> in der METS-Datei definiert. Ein SIP kann mehrere IEs enthalten, eine IE wird dabei immer durch maximal eine METS-Datei beschrieben.
Ob eine METS-Datei valide ist, kann bereits vor einem Ingest geprüft werden, indem das METS gegen das Rosetta-METS validiert wird. Mehr dazu im Artikel: Validierung einer METS-Datei.
Weiterführende Infos
Mehr zum Aufbau einer METS-Datei erfahren Sie im Service-Wiki Bereich:
Weiterführende Infos
Aufbau der METS-Ordnerstruktur
schematische Darstellung einer METS-Struktur
METS-Ordnerstruktur im Windows-Explorer
/PollingFolder/
Beim Ingest werden die Daten aus diesem Ordner und den dazugehörigen Unterordnern (Sub-directory) ausgelesen und in Rosetta eingeliefert. Dieser Ordner muss im Submission Format konfiguriert werden. In der zentralen Rosetta-Infrastruktur des hbz ist hier der Upload-Ordner der jeweiligen Institution anzugeben.
Der Polling-Folder kann ein oder mehrere SIP-Folder enthalten.
/PollingFolder/SIPFolder/
In diesem Unterordner befinden sich der Ordner content sowie ggf. eine dc.xml-Datei. Die dc.xml-Datei enthält optionale Metadaten im Dublin Core-Metadatenschema für das SIP Processing.
Die Metadaten in der dc.xml werden in Rosetta nur während der Verarbeitung des SIPs angezeigt. Mit der Übertragung in den Permanent-Speicher werden sie gelöscht und nicht als deskriptive Metadaten zu den jeweiligen IEs übertragen.
/PollingFolder/SIPFolder/content/
Der Ordner content enthält den Ordner streams für die Nutzdateien und die nummerierten METS-xml-Dateien mit Metadaten für die einzelnen IEs, z. B. ie1.xml, ie2.xml, usw.
Je nach Anzahl der IEs können sich hier mehrere ie.xml-Dateien befinden. Die ie.xml-Dateien sind durchnummeriert (ie1.xml, ie2.xml etc.). Pro IE gibt es immer nur eine ie.xml-Datei.
/PollingFolder/SIPFolder/content/streams/
Der Ordner streams enthält die eigentlichen Nutzdateien, die in Rosetta langzeitverfügbar gehalten werden sollen.
Besonderheiten der Konfigurationen des Material Flow für einen METS-Ingest
Content Structure
Bei einem METS-Ingest wird die Content Structure METS ausgewählt.
Auswahl der Content Structure in Rosetta
Limited METS-Ingest
Ein Limited METS stellt einen vergleichbar unkomplizierten Weg des METS-Ingests dar, da keine vollständige METS-Datei erstellt werden muss. Ein Limited METS enthält nur Metadaten auf IE-Ebene und keine Strukturinformationen über Representations oder Dateien. Dies vereinfacht die METS-Erstellung, sorgt aber auch dafür, dass mit diesem Ingestverfahren nur IEs mit einer Representation eingeliefert werden können. Ein Limited METS gilt zwar als unvollständige METS-Datei, kann aber dennoch von Rosetta verarbeitet werden.
Weiterführende Infos
Im Rosetta Producer's Guide finden Sie weitere Informationen zum Limited METS-Ingest in Rosetta.
Submissions of Limited METS
Warnhinweis
Beim Limited-METS-Ingest werden keine technischen Metadaten auf REP- oder File-Ebene eingeliefert. Diese werden von Rosetta im Zuge des Ingests ergänzt. Auch ist bei diesem Ingest-Verfahren keine Einlieferung struktureller Metadaten nötig, da sich die Struktur der IE aus der Ordnerstruktur ergibt.
Erstellen einer Limited METS-XML-Datei
Ein Limited METS besteht nur aus den folgenden METS-Sektionen auf IE-Ebene:
- Deskriptive Metadaten <mets:dmdSec> im Dublin-Core-Schema
- Administrative Metadaten <mets:amdSec> im DNX-Schema
- Source Metadata <mets:sourceMD> in der <mets:amdSec> (optional)
Im unteren Beispiel ist die Struktur einer Limited METS-Datei für den Ingest mit einer Set of Files-Content Structure dargestellt. Es enthält eine Descriptive Metadata-Sektion <mets:dmdSec>, Source Metadata in einem beliebigen Metadatenschema <mets:sourceMD ID="ie-amd-source"> und administrative Metadaten in der Sektion <mets:techMD ID="ie-amd-tech">.
<mets:mets xmlns:mets="http://www.loc.gov/METS/"> <mets:dmdSec ID="ie-dmd"> <mets:mdWrap MDTYPE="DC"> <mets:xmlData> <record xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:mods="http://www.loc.gov/standards/mods/v3/mods-3-0.xsd"> <dc:identifier>000001</dc:identifier> <dc:title>Meine Erinnerungen</dc:title> <dc:creator>Smith, John</dc:creator> <dc:description>Die Autobiographie von John Smith</dc:description> <dc:date>2015</dc:date> <dc:type>Monographie</dc:type> <dc:format>pdf</dc:format> <dc:identifier>263712</dc:identifier> <dc:language>Deutsch</dc:language> <dc:rights>https://rightsstatements.org/page/InC/1.0/?language=de</dc:rights> </record> </mets:xmlData> </mets:mdWrap> </mets:dmdSec> <mets:amdSec ID="ie-amd"> <mets:sourceMD ID="ie-amd-source-dc"> <mets:mdWrap MDTYPE="DC"> <mets:xmlData> <dc:record xmlns:dc="http://purl.org/dc/elements/1.1/"> <dc:creator>John Smith</dc:creator> <dc:title>Meine Erinnerungen</dc:title> <dc:date>01-01-2015</dc:date> </dc:record> </mets:xmlData> </mets:mdWrap> </mets:sourceMD> <mets:techMD ID="ie-amd-tech"> <mets:mdWrap MDTYPE="OTHER" OTHERMDTYPE="dnx"> <mets:xmlData> <dnx xmlns="http://www.exlibrisgroup.com/dps/dnx"> <section id="generalIECharacteristics"> <record> <key id="IEEntityType">Other</key> </record> </section> </dnx> </mets:xmlData> </mets:mdWrap> </mets:techMD> </mets:amdSec> </mets:mets>
Aufbau der Limited METS-Ordnerstruktur
Die Limited METS-Ordnerstruktur entspricht dem Aufbau der METS-Ordnerstruktur.
Besonderheiten der Konfigurationen des Material Flow für einen Limited METS-Ingest
Content Structure
Für die Content Structure eines Limited METS kann nicht der Typ METS ausgewählt werden, da das Limited METS keine Strukturierung der Daten enthält. Dementsprechend muss hierfür eine Content Structure gewählt werden, die sich für den Ingest von unstrukturierten Daten eignet. Dies sind entweder Set of Files (SoF) oder Dublin Core (DC).
- Set of Files: Hier wird unterschieden zwischen SoF.Simple und SoF.Complex:
- Bei Anwendung von SoF.Simple wird pro Nutzdatei eine IE erzeugt. Wird z. B. eine IE mit zehn Nutzdateien eingeliefert, werden daraus von Rosetta zehn IEs erstellt. Da es aber nur eine METS-Datei mit deskriptiven Metadaten gibt, wird der Inhalt aus dem Feld dc:title in das Feld dc:alternative verschoben und stattdessen der Name der Nutzdatei in das Feld dc:title eingetragen, um IEs mit eindeutigen Titeln zu erhalten.
- Wird SoF.Complex angewandt, werden alle Nutzdateien zu einer einzigen IE zusammengefasst. Beim Limited Mets-Ingest ist dies im Falle der Einlieferung einer IE mit mehreren Nutzdateien anzuwenden.
- Dublin Core (DC): Bei einem Ingest mit DC kann jede IE nur eine Datei enthalten. Wird die DC-Content Structure verwendet, muss die <dmdSec> des Limited METS ein dc:identifier-Feld mit einem bestimmten Attribut enthalten, in dem der Pfad zur einzuliefernden Datei steht. Dieses Attribut ist xsi:type="ContentURL".
Warnhinweis
Wir empfehlen, immer die Content Structure SoF.Complex zu nutzen.
Bei SoF.Simple wird der Inhalt aus dem Feld <dc:title> in das Feld dc:alternative verschoben und stattdessen der Name der Nutzdatei in das Feld <dc:title> eingetragen.
Gut zu wissen
In der Regel eignet sich Set of Files besser für einen Limited METS Ingest, da die ie.xml leichter zu erstellen ist und das Feld dc:identifier nicht mit einem Dateipfad gefüllt werden muss.
- Keine Stichwörter