Page tree
Skip to end of metadata
Go to start of metadata

Hier wird kurz die Überführung der in der HTML-Repräsentation der Bibliographie der Hispanistik in der Bundesrepublik Deutschland, Österreich und der deutschsprachigen Schweiz (1978 - 2001) verwendeten Klassifikation nach SKOS erläutert. Ausgangspunkt ist diese HTML-Version der Bibliographie.

Download und Bereinigung der relevanten Dokumente

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/Gliederung.html|tidy -asxml -utf8 > Gliederung.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/A.html|tidy -asxml -utf8 > A.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/L.S.html|tidy -asxml -utf8 > L.S.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/S.html|tidy -asxml -utf8 > S.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/L.P.html|tidy -asxml -utf8 > L.P.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/P.html|tidy -asxml -utf8 > P.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/L.K.html|tidy -asxml -utf8 > L.K.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/K.html|tidy -asxml -utf8 > K.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/L.G.html|tidy -asxml -utf8 > L.G.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/G.html|tidy -asxml -utf8 > G.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/L.B.html|tidy -asxml -utf8 > L.B.html

$ curl http://www.uni-muenster.de/Hispanistikbibliographie/Bibliographie%201978-1998/B.html|tidy -asxml -utf8 > B.html

$ find . -name "*.html" | xargs sed -i 's/ //g'

Generierung einer RDF/XML Repräsentation der Klassifikation

Anhand dieses XSLT-Skripts wird die HTML- in eine RDF-XML-Repräsentation überführt:

$ xsltproc toSKOS.xsl Gliederung.html > bibhisp.rdf

Überprüfung auf valides RDF/XML:

$ rapper -c bibhisp.rdf 
rapper: Parsing URI file:///home/fo/hbz/data/bibhisp/bibhisp.rdf with parser rdfxml
rapper: Parsing returned 2924 triples

Das Ergebnis ist hier verfügbar. Diese Dokumentation sollte im Idealfall als Provenienzinformation mit dem resultierenden SKOS verknüpft werden.

  • No labels