A Space Odyssey

01 ArchiveSpace

Liveshow: Lösung zur letzten Übung und Aufbau Tektonik

Für mich war es auch nach der Live-Demo noch etwas unübersichtlich, aber grundsätzlich sieht die Usability ja nicht schlecht aus und ich denke, wenn man’ in einem Archiv arbeitet mit echten Beständen und Objekten, dann ist es einfach zu bedienen und die Felder „erschliessen sich einem“ :-)

Bei der Diskussion kam die Frage auf, wie es denn so mit anderen Archivsystemen aussieht und ob jemand aus der Klasse Erfahrung mit solchen hat…

Deshalb gibt es hier einen kleinen Ausflug in AtoM (von Karin):

AtoM (Access to Memory) ist ein webbasiertes Archivinformationssystem, das sowohl für die Erschliessung wie auch für die Recherche genutzt werden kann und auf den internationalen Archivstandards ISAD(G), ISAAR(CPF), ISDF und ISDIAH basiert. Erstere beiden haben wir ja letztes Mal ein bisschen kennengelernt. Das System wird unter einer Open Source-Lizenz von einer kanadische Firma bereitgestellt. In der Schweiz ist die Firma docuteam für das Hosting zuständig. docuteam betont den Vorteil eines offenen und auf Standards basierten Systems, denn so lässt es sich mit weiteren Komponenten und Systemen verbinden (die docuteam für die DILZA anbietet - Achtung Schleichwerbung).

Import und Export

Wie auch Koha unterstützt ArchivesSpace den dateibasierten Datenex- und import von unterschiedlichen Formaten (EAD, MARCXML, CSV) und verfügt über eine OAI-PMH-Schnittstelle.

Zum Import & Export folgte direkt eine Übung: Zuerst EAD-Daten in ArchivesSpace IMportieren und im zweiten Schritt in MARCXML EXportieren. Die Daten luden wir von einer virtuellen Bibliothek https://eadiva.com die Beispiele zum Üben und Kennenlernen des EAD XML Standards zur Verfügung stellt.

Erkenntnisse:

  • EAD ist nicht unbedingt das Beste, aber das einzige Austausch-Format.
  • Es gibt keine Garantie, dass der Austausch funktioniert.
  • Die Daten werden in Zyklen in ArchivesSpace geladen und erschliessen sich nur aus dem Kontext.
  • Viele Felder fehlen, sind zu kurz etc.
  • Den Export konnten wir in unserer Gruppe nicht mehr durchführen, unsere Annahme war aber: „Wahrscheinlich funktioniert der Export nicht verlustfrei“
  • Uns genau dies sollte auch das Ziel der Übung sein: zu verstehen, dass Datenaustausch zwischen unterschiedlichen Systemen eine Herausforderung ist. Die Systeme haben einen anderen Aufbau, verschiedene Hirachien und auch andere Transformationsregeln. Für verlustfreien Export und Import braucht es also immer eine gute “Übersetzung” der Daten. Die Prüfung, ob die XML-Dateien sauber sind, kann danach über ein Schema erfolgen. Grundsätzlich gilt die Regel: Verlustfreie Konvertierung ist möglich, wenn das Zielformat mehr Möglichkeiten bietet als das Ausgangsformat (z.B. von DublinCore zu MARC21). Umgekehrt ist es schwieriger, weil Felder im Zielformat fehlen und so ein Datenverlust erfolgt.

02 Marktüberblick Archivsysteme

In der Schweiz dominieren die Systeme scope.Archiv (z.B. beim Schweizerischen Bundesarchiv) und CMISTAR - neu CMI Archiv (z.B. bei der Uni Zürich). Hinweis aus der Klasse: es gibt noch ein neues Archivsystem aus & in der Schweiz mit dem Namen anton - gemäss Website „eine webbasierte, mehrsprachige und standardorientierte Archivdatenbank.“

Ausserdem wurde nochmals der grosse Unterschied zwischen Bibliotheks- und Archivssystemen und -standards betont!

  • Bibliothek
    • Bestand: (Massen-)Medien (Bestand nicht so divers, meist „nur“ Bücher, Filme, Zeitschriften, Spiele)
    • Erwerb: nach Thema und Nachfrage
    • Software: medienzentriert
    • Oberfläche: Benutzerinteraktion (Recherche & Ausleihe)
    • Metadatenformat: MARC21, zukünftig BIBFRAME? (note: ich hoffe wir hören davon noch mehr - RDF ist ja auch grad Thema im Modul SESY)
    • Standard: MARCXML ist medienzentriert, beschreibt also eine einzige Ressource
  • Archiv
    • Bestand: Einzelstücke; Medien aller Art; eher stehender, unikaler Bestand.
    • Erwerb: Aktenbildner, Entstehungszusammenhang,
    • Software: orientiert sich an traditionellen analogen Findmitteln
    • Oberfläche: Benutzerinteraktion (starker Fokus auf Recherche; Ausleihe/Nutzung oft nur auf Anfrage)
    • Metadatenformat: EAD, zukünftig RiC
    • Standard: ist auf mehrere Ressourcen ausgerichtet

03 Software für Publikationen und Forschungsdaten (und Forschungsinformationen)

Hier ein paar Definitionen rund um die Begriffe „Forschung“ und „Open“:

  • Forschungs-Publikationen
    • alles was Forschende publizieren (Artikel, Bücher etc.)
    • kann in gedruckten Medien oder online publiziert werden unter unterschiedlichen Veröffentlichungslizenzen (siehe Open Access)
  • Forschungs-Daten
    • Daten die während dem Forschungsprozess erhoben und ausgewertet werden.
    • Teilweise wird auch der Begriff „Datensatz“ verwendet
  • Forschungs-Informationen
    • Informationen über Forschende, Drittmittelprojekte, Patente etc.
    • dient der Forschungsberichterstattung über Institutionen und Forschende
    • die Infos werden in Forschungsinformationssysteme (FIS; englisch CRIS current research information system) erfasst (oder aus anderen Systemen eingespielt)
  • Open Access
    • Offener Zugang zu Forschungs-Publikationen
    • Es gibt verschiedene Wege Open Access zu publizieren, hier anhand eines Beispiels für Artikel in Zeitschriften:
      • Gold: Primärpublikation in Open-Access-Zeitschrift (online oder print)
      • Grün: zuerst Erscheinung in Closed-Access-Zeitschriften (online oder print), danach Zweitveröffentlichung auf institutionellen Repositories (online)
      • Hybrid:
    • oft werden auch Hochschulschriften (BA, Master, Diss.) direkt Open Access durch die Hochschulen publiziert
  • Open Data
    • offener Zugang zu Forschungs-Daten
    • Fokus: Primärdaten, die bei der Forschung entstehen. Oft Daten als Anhang zu Zeitschriftenartikeln.
  • Open Source
    • offener Quellcode von Software
    • Eine Übersicht von Bibliotheken die Open-Source-Software einsetzen (und mitgestalten) gibt es unter den Best Practice Beispielen des “Open Library Badge” . Die Initiative Open Library Badge möchte ein Anreizsystem für Bibliotheken schaffen, die das Konzept der Offenheit verfolgen. Der Badge wird an Bibliotheken verliehen, die mind. 5 der 15 Kriterien zu verschiedenen Themen rund um “Open” erfüllen.
  • Open Education
    • kostenfrei zugängliche Lernmaterialien (oft online) und frei zugängliche Lernplattformen

Repository-Software DSpace / Forschungsinformationssystem DSpace-CRIS

Die Software DSpace ist geeignet für Publikationen und Forschungsdaten - und wurde unter DSpace-CRIS erweitert für Forschungsinformationen. Im weltweiten Vergleich hat DSpace mit fast 40% einen sehr grossen Marktanteil.

Eingesetzt wird DSpace-CRIS z.B. von der Technischen Universität Hamburg (TUHH) unter dem Namen TORE (TUHH Open Research) - es ist sowohl:

  • Repositorium für Open-Access-Publikationen
  • Repositorium für Forschungsdaten (Open Data) und seit neustem
  • auch Forschungsinformationssystem (FIS / CRIS) Dieses System werde ich mir noch genauer anschauen, da die Unibibliothek als Betreiberin angegeben ist, und ich gerade noch eine Seminar-Arbeit über die Rolle der Bibliotheken bei FIS/CRIS schreiben (muss/darf/soll).

Die ersten Übungen mit DSpace waren für mich jetzt nicht weltbewegend, da ich schon Erfahrung mit Zenodo habe und die sich im grunsätzlichen Aufbau sehr ähnlich sind.

Marktüberblick Repository-Software

Zenodo:

  • Ist ein Open Access Repository für Publikationen und Daten
  • Betrieben wird es vom CERN - est ist kostenlos für andere Hochschulen, weil die Physikern eh schon so viele riesige Daten haben und die restlichen Daten der Hochschulen für sie nur ein „Tropfen auf den heissen Stein sind“.
  • Die Software dahinter heisst invenio
  • Aktuell Best-Practice Lösung in der Schweiz
  • Ist auch ein bisschen FIS, wegen der ORCID-Anbindung (ORCID ist eine ID-Vergabe für Personen die in der Wiss. tätig, damit lassen sich Publikationen und Personendaten gut verknüpfen)

Im DACH-Raum sind vorallem diese 6 Systeme relevant (und alle sind Open Source :-):

  • DSpace
  • EPrints
  • Fedora
  • Invenio
  • MyCoRe
  • OPUS
Quellen:
* https://bain.felixlohmeier.de
* https://www.accesstomemory.org
* https://www.docuteam.ch/angebot/digitales-archiv-docuteam-cosmos/atom-2
* https://open-access.net/informationen-zu-open-access/was-bedeutet-open-access
* https://tore.tuhh.de/