XML-Austauschformat für Online-Findbücher

XML-Ausstauschformat für Online-Findbücher mit Schnittstelle zu EAD (Encoded Archival Description)

 

Bericht über den 1. Workshop zur Erstellung eines XML-Ausstauschformats für Online-Findbücher
Bericht über den 2. Workshop zur Erstellung eines XML-Ausstauschformats für Online-Findbücher

Informationen über MIDOSAonline mit dem fertiggestellten XML-Generator und Bestellmöglichkeit finden auf unseren Midosa-Seiten

 


Der 1. Workshop zur Erstellung eines XML-Ausstauschformats für Online-Findbücher

Am 8. und 9.2.2000 fand in der Archivschule Marburg ein Workshop statt, bei dem in intensiver gemeinsamer Arbeit das Modell für ein Austauschformat für Online-Erschließung entworfen wurde. Dieses Austauschformat hat folgende Funktionen:

 

  • Größere Flexibilität der Darstellung von Online-Findmitteln sowohl bei der Präsentation am Bildschirm, als auch beim Ausdruck auf Papier von derselben Datenbasis aus, die zudem mit Recherchewerkzeugen wie Suchmaschinen in definierbaren Bereichen durchsucht werden kann.
  • Kombination von Beständeübersichten und Findbüchern.
  • Integrierbarkeit der Datenbasis in ausländische Suchmaschinen über eine EAD-konforme Ausgabe.

 

Das Austauschformat nutzt die gleiche Technik, die mit EAD für archivische Erschließung eingesetzt wird, allerdings an den neueren Entwicklungsstand der Internettechnologie angepasst und ohne die Erschließungsverfahren, die in EAD impliziert sind, zu übernehmen. Die Technik bedeutet, dass zwischen der Repräsentation der Datenstruktur von Findmitteln in einer DTD (Document Typ Definition) oder einem RDF (Resource Definiton Format) auf der einen Seite (Authoring) und der Präsentation der Daten am Bildschirm oder im Ausdruck, gesteuert durch Stylesheets, also Ausgabeformulare, auf der anderen Seite (Viewing) getrennt werden kann. Auf Grund dieser Trennung kann sich die Abbildung der Datenstruktur in einem Austauschformat auf die Aufzählung der erforderlichen Elemente und ihre Integration in einen hierarchischen Aufbau konzentrieren.

Der Workshop diente zur genaueren Definition der Anforderungen für ein bis Mitte 2000 zu erstellendes Austauschformat mit folgenden Funktionen:

 

  1. Repräsentation von Findbüchern und Beständeübersichten in einer XML-DTD (oder RDF);
  2. Präsentation der entsprechend kodierten Findmittel im InternetExplorer5;
  3. Editierbarkeit der Daten im Austauschformat mit einem XML-Editor zur Ergänzung der Titelseite und der Einleitung.
  4. Transformation der XML-kodierten Daten in eine EAD-konforme Ausgabe zur Integration in ausländische Suchmaschinen.

 

An dem Workshop nahmen teil:

  • von der Archivschule Marburg: Werner Engel, Dr. Angelika Menne-Haritz, Dr. Karsten Uhde,
  • von der Landesarchivdirektion Baden-Württemberg: Dr. Nicole Bickhoff, Dr. Gerald Meier,
  • vom Bundesarchiv (als Beobachter): Dr. Edgar Büttner, Axel Schmidt
  • von der Firma Startext als Auftragnehmer: Paul Bantzer (Geschäftsführer), Marcus Blaha.

 

Die Ergebnisse des Workshops sind:

  1. Verfahrensfestlegung: Das Austauschformat ist an die Datenstruktur von MIDOSA95 angepaßt. MIDOSA liefert die Daten, die entweder als Angaben für das Findbuch oder die Beständeübersicht erfasst wurden. Die Datenstruktur wird ergänzt durch weitere Felder, die aus dem Bestandsverwaltungsprogramm AZULAV der LAD Stuttgart übernommen werden. Aus beiden Datenbanken wird mit einem Generator, ähnlich dem bereits eingesetzten Generator für Onlinefindbücher, über eine CSV-Datei der nach XML-kodierte Datenpool erstellt. Dazu werden die Elemente verwendet, die in dem Austauschformat definiert sind.
  2. Zukünftige Referenzdatei: Zukünftig wird die im Austauschformat gespeicherte Datenmenge die Referenzmenge sein. Ein Reimport zu MIDOSA95 ist nicht vorgesehen. Die Referenzmenge kann aber jederzeit durch Import aus MIDOSA95 ergänzt werden, das weiterhin als Erfassungswerkzeug beibehalten wird. Daneben soll die Ergänzung oder Veränderung der Referenzmenge mit einem dazu angepassten XML-Editor möglich werden. Genauso können Daten aus anderen Anwendungen mit entsprechenden Filtern in die Referenzmenge aufgenommen werden. Damit ist ein Zugriff von Suchmaschinen auf einen gemeinsamen Datenpool über mehrere Bestände und über mehrere Archive hinweg möglich.
  3. Struktur des Austauschformates: Die im Verzeichnungsdatensatz erfassten einzelnen Elemente wie Titel, Enthältvermerk, Laufzeit, Sperrfristen etc. werden von dem Element "Verzeichnungseinheit" eingeschlossen, das selbst ein oder mehrere Elemente für "Zusatzinformationen" enthalten kann. Das Element "Verzeichnungseinheit" kann sich beliebig oft wiederholen. Alle Wiederholungen werden vom Element "Bestand" eingeschlossen, das innerhalb des übergeordneten Elements "Findbuch" ebenfalls bei Bedarf wiederholbar ist. Die Gliederungsebene wird mit einem Element angegeben, das ähnlich wie die "component"-Elemente in EAD funktioniert und für den Aufbau des linken Navigationsrahmens genutzt wird. Innerhalb von "Beständeübersicht" sind die Elemente "Bestandsbezeichnung" beliebig oft wiederholbar. Von Ihnen aus werden Verknüpfungen zu Findbüchern als n-zu-1 oder 1-zu-n Relationen generiert werden.

 

Die Ergebnisse des Projektes sollen Mitte des Jahres verfügbar sein und können von MIDOSA-Anwendern als Ergänzung oder Ersatz zu MIDOSAOnline eingesetzt werden.

Zurück zum Anfang

 

Der 2. Workshop zur Erstellung eines XML-Ausstauschformats für Online-Findbücher

Am 5. April fand der zweite und letzte Workshop im Rahmen des Projektes XML-Austauschformat statt. Bis zum Mai 2000 ist die Arbeit abgeschlossen. Das Ergebnis wird auf dem Stand der Firma Startext bei der Infobase am 2. Mai 2000 präsentiert. Bei dem Workshop wurde vorgeführt:

  • ein Generator, der die dBase Daten aus MIDOSA in ein XML-Format einliest,
  • ein Stylesheet, das aus den in die XML-DTD eingelesenen Daten ein Online-Findbuch herstellt.

Gemeinsam erstellt wurde eine Tabelle mit Entsprechungen der MIDOSA-DTD und EAD-Tags.
Weiter gearbeitet wird jetzt an einem zweites Stylesheet, das ebenfalls aus den XML-Dateien eine EAD-konforme Ausgabe erstellt. Ziel ist die Integration deutscher Findbücher in amerikanische Spezialsuchmaschinen für den Archivbereich.

Das ganze Softwarepaket wird auf jedem PC lauffähig sein. Das Findbuch kann mit dem InternetExplorer 5 gelesen werden. Dabei werden Navigationsframes wie im bisherigen Online-Findbuch aufgebaut und eingesetzt.

Ergebnisse des Workshops:
Das fertige Produkt wird den Generator zur Erstellung von XML-Daten aus einer Datenbank sowie die beiden Stylesheets zur Darstellung der XML-Daten enthalten. Außerdem gehört dazu ein Editierwerkzeug für die XML-Dateien, mit dem das Titelblatt, die Einleitung und die Zusatzinformationen wie in MIDOSA-Online bearbeitet werden können.

Für die Präsentation von XML-Findbüchern im Internet wird ein Server erforderlich sein, der die XML-Daten je nach Benutzerabfrage portionsweise an den Client übermittelt. Die Auftraggeber beschlossen bei dem Workshop, darauf zu verzichten, den in WindowsNT serverseitig vorhandenen Parser zu nutzen und stattdessen den bisher nur im WindowsExplorer clientseitig eingebauten Parser einzusetzen. Damit werden die Voraussetzungen für den Serverbetrieb weiter gefaßt und neben WindosNT kann auch Linux etc eingesetzt werden.

Registrierte MIDOSA-Anwender werden das neue Werkzeug auf Anfrage kostenlos als Update erhalten. 

Zurück zum Anfang




© 2005   Uhde@staff.uni-marburg.de, Stand: 01.07.2001