Google, what else?

Heute stand die Abschlussübung auf dem Programm, bei der wir die Daten, die wir im Laufe des Kurses aus koha, ArchivesSpace, DSpace und DOAJ geharvestet und mit MarcEdit und OpenRefine in Marc21-XML konvertierten haben, in das Discovery System VuFind importieren.

Noch ein letztes Mal das Schaubild für die Übersicht:

Die (erneute) Definition der zentralen Begriffe und vorallem deren Abgrenzung scheint mir hier aber wichtiger als das CopyPasting der Befehle zu sein, weshalb ich auf die Übung nur am Rande eingehe.

01 Was ist ein Bibliothekskatalog?

Der Bibliothekskatalog ist das Verzeichnis des Bestandes, in dem Angaben über Standort, Inhalt etc. der Medien verzeichnet sind. Früher war das der klassische Zettelkatalog, der in jeder Bibliothek vorhanden war. In elektronischer Form wird von Online Public Access Catalogue“ (OPAC) gesprochen. Diese digitale Form ist jedoch nicht zu vergleichen mit den modernen Discovery Systemen. OPAC werden nur noch selten als erster Einstieg gewählt, weil die Usability nicht mehr dem modernen „Google-Gefühl“ entspricht und die Kataloge oft eine hohe Komplexität aufweisen, also eigentlich für Informationswissenschaftler besser geeignet wären als für normale Nutzer. Ausserdem können sie die Anforderungen für die Anbindung und die Sichtbarmachung der elektronischen Ressourcen nicht erfüllen.

Der klassische OPAC folgt dem Paradigma “exact match”, während Discovery-Systeme “best match” liefern (mehr weiter unten bei „Was ist ein Discovery System?“ und „Ranking“).

Beispiele:

  • Karlsruher Virtuelle Katalog (KVK): kostenloser und frei zugänglicher Metakatalog der gleichzeitige Recherche in verschiedenen OPACs ermöglicht.
  • WorldCat: die weltgrößte bibliografische Datenbank, die Kataloge von tausenden Mitgliederbibliotheken des OCLC Online Computer Library Center umfasst. Hat selber eine OPAC-Oberfläche.
  • Alter OPAC-Katalog des NEBIS-Verbund: ist noch zugänglich, wurde aber erst durch nebis.recherche und seit dem 7.12.2020 durch swisscovery abgelöst

02 Was ist ein Bibliothekssystem?

Das Bibliothekssystem ist die Software, mit der die Bibliotheksmitarbeiter’innen arbeiten. Sie enthalten die klassischen Module wie Ausleihe, Erwerbung und Katalogisierung und bieten in den neueren Systemen auch die Möglichkeit e-Ressourcen besser zu verwalten. Diese Systeme sind seit den 80er im Einsatz, meist als integriertes Bibliothekssystem. Heute laufen viele dieser Systeme, wie auch andere moderne Software, nicht mehr über eine Installation auf den Endgeräten, sondern über cloud-basierte Browseranwendung.

Beispiele:

Open Source Software:

  • koha :-)

Proprietäre Software:

  • Aleph (Ex Libris): intergriertes System (R.I.P)
  • ALMA (Ex Libris): Browseranwendung, cloud-basierte Datenbank, Nachfolger von Aleph
  • WorldShare Management Services (OCLC): cloud-basiert

03 Was ist eine Suchmaschine / ein Suchindex?

Suchmaschinen sind Anwendungen, die Datenstrukturen gezielt nach bestimmten Inhalten oder Datentypen durchsuchen. Bei Suchmaschine denkt man’ natürlich zuerst an Google, daneben gibt es aber noch eine ganze Reihe von anderen alternativen Suchmaschinen, wie z.b. Ecosia, swisscow, duckduckgo etc. Und auch die Suchleiste auf dem eigenen Gerät ist eine Suchmaschinen, einfach eine lokale. Eine Suchmaschine durchforstet einen vorgegebenen Datensatz nach Kriterien, die zuvor festleget werden. Das gängigste Kriterium ist ein einfacher Suchbegriff.

Beispiele:

Im Rahmen dieses Kurses sind wir schon ein paarmal über den Begriff Solr (Apache Lucene) gestolpert und heute bleuchten wir, im wahrsten Sinne des Wortes, diese Anwendung genauer. Solr ist eine Open Source Volltextsuchmaschine nach normaler Internettechnologie, die neben Elasticsearch am weitesten verbreitetet und quasi “Industriestandard” ist.

Solr hat selber gar keine eigene Suchoberfläche, sondern läuft nur im Hintergrund. Sie wird in unterschiedlichen Anwendungsbereichen eingesetzt, also nicht nur in Bibliotheken und Archiven, jedoch wird sie mit vielen Discovery Systemen kombiniert, z.B. bei

  • VuFind (Open Source)
  • Primo (Ex Libris)
  • swissbib.ch (auch R.I.P)

04 Was ist ein Discovery System?

Discovery Systeme sind bibliothekarische Rechercheportale, die auf Suchmaschinentechnologie beruhen und die bisherigen OPAC-Kataloge immer mehr ersetzen. Das Discovery System ist eigentlich nur die Weboberfläche und dahinter steckt eine Suchmaschine oder eine Datenbank. Discovery Systeme versuchen die von Suchmaschinen aus dem Web bekannte Suchfunktionalität (ein Suchschlitz und Treffer nach Relevanz sortiert) auf Bibliothekskataloge zu übertragen und auch elektronische Medien in einer übergreifenden Suche mit einzubeziehen.

Beispiele:

Open Source Software:

Proprietäre Software:

  • EBSCO Discovery Service
  • Primo (ExLibris)
  • Summon (Serial Solutions)

Exkurs: Ranking

Während die OPACs eher möglichst exakte Suchergebnisse liefern (lieferten), zeigen Discovery Systeme sehr viele Suchergebnisse an, die ähnlich wie bei bekannten Suchmaschinen mit einem Algorithmus nach Relevanz sortiert werden. Der Algorithmus dahinter zählt das Vorkommen der Suchbegriffe in den Katalogeinträgen, z.B. sind Treffer in bestimmten Feldern wie Titel und Autor’in mehr wert als Treffer im Beschreibungstext oder in Verlagsangaben. Daraus errechnet die Suchmaschine einen Ergebniswert und sortiert die Trefferliste entsprechend. Die Gewichtung der einzelnen Felder kann dabei „individuell“ entschieden werden, von den Verantwortlichen aus Bibliothek bzw. IT. Je nach Nutzergruppe ist die Gewichtung der verschiedenen Feldern unterschiedlich.

Das Bild zeigt das Ranking aus der Übung in VueFind bzw. Solr, bei der die verschieden Gewichtung der Felder zu sehen ist: z.B. title_full hat die Gewichtung 400, während title_alt nur eine Gewichtung von 200 hat.

Gerne verlinke ich hier auf den Blogbeitrag von Regina, die das - aus meiner Sicht - mit dem Ranking und der Relevanz sehr gut erklärt hat.

Quellen:
* https://bain.felixlohmeier.de
* http://www.slideshare.net/steilen/discoverysysteme-die-opacs-der-zukunft
* https://praxistipps.chip.de/was-ist-eine-suchmaschine-einfach-erklaert_41289
* https://de.wikipedia.org/wiki/Discovery-System