Wo ist denn die Information?

Kommt einer an die Theke: „Hamse was zu Depression?“. So (oder ähnlich) beginnen manche Geschichten von Kollegen, die Auskunftsdienst in der Bibliothek machen. Die Geschichten handeln im weiteren Verlauf dann üblicherweise von mehr oder weniger amüsanten Dialogen, in deren Verlauf das Informationsbedürfnis des Ratsuchenden weiter eingegrenzt wurde, bis man ihn schließlich mit irgendwas doch hilfreichem loswerden konnte.1

Mancher OPAC und manche Datenbank könnten sicher ähnliches erzählen: Kommt einer, tippt „Depression“ ein… Der weitere Verlauf der Geschichte wäre dann leider oft weniger erheiternd und auch mit weniger gutem Ende als die Erzählungen von Bibliothekaren. Denn der elektronische Katalog weiß ja wenig mehr als den dürren Suchbegriff über das Informationsbedürfnis des Benutzers. Der Bibliothekar (seine Kollegin selbstverständlich auch) kann ja nachfragen: Psychologie oder Wirtschaftswissenschaften? Wozu brauchen Sie das denn? Was haben Sie denn schon gelesen? Darfs auch was auf Englisch sein? … Vielleicht weiß er (bzw. die Kollegin) sogar, dass nächste Woche doch Klausur bei Prof. Stresebrecht aus der Wirtschaftsgeschichte ist, die dieses Semester die Weltwirtschaft in der Zeit zwischen den Kriegen gelesen hat. Deswegen sollte der Student (3. Semester, zweites Nebenfach Wirtschaftsgeschichte, sieht man dem doch an) unbedingt das Standardwerk der Stresebrecht aus der Lehrbuchsammlung dazu lesen, wenn er es noch nicht unter dem Kopfkissen hat. Es wäre aber vollkommener Unsinn, per Fernleihe Fachartikel zu bestellen zum letzten Diskussionsstand in der Frage, ob es eine Korrelation zwischen den Auswirkungen der Großen Depression auf den Butterkonsum in Milwaukee und dem Streusalzimport von Grönland gibt. Brandneue Erkenntnisse in dieser Frage konnte man aber der Stresebrecht empfehlen, als sie neulich ihren Hiwi fragen ließ, ob es was neues für ihre Depression gibt.

Genau das ist doch Information, oder? „Geglückter Transfer von problemlösendem Wissen“ (Harald H. Zimmermann) oder weniger mechanisch klingend: „Wissen in Aktion“ (Rainer Kuhlen)2. Dem Geschichtsstudenten bei der Prüfungsvorbereitung ist bei der Fragestellung „Depression“ mit ganz anderen Antworten geholfen als dem Wissenschaftler aus der klinischen Psychologie bei seiner Forschung. Beide haben ein Problem, zu dessen Lösung Wissen beitragen kann. Beide benötigen in ihrer jeweiligen Situation aber unterschiedliches Wissen. Und beide formulieren ihre Suchanfragen an Suchmaschinen leider meist so, dass man aus diesen dürren Worten eher wenig über ihr konkretes Problem ableiten könnte. Wer möchte, kann sich typische Suchanfragen an den öffentlichen Prototypen unserer Suchkiste bei Twitter anschauen3

Die Antworten, die gängige sogenannte Informationssysteme (oder gar Information Retrieval Systeme) auf solche Suchanfragen geben, sind keine Information im oben zitierten Sinne. Es sind mehr oder weniger geordnete Datendumps, in denen zur schlechten(?) Suchanfrage passende Bitmuster auftreten. Um daraus Information zu machen, ist dann viel mühsame Handarbeit notwendig. Natürlich kann einem keine Maschine die intellektuelle Beurteilung abnehmen, ob sich hinter den Daten, die man da gefunden hat, problemlösendes Wissen verbirgt. Die Maschine könnte einen aber vielleicht dabei unterstützen, diese Auswahl mit weniger Qual als der Durchsicht einer großen Zahl mehr oder weniger willkürlich sortierter Datensätze vorzunehmen. Ein Ansatz dazu ist Relevance Ranking. Die Definition von Relevanz, nach der da sortiert wird, ist aber in vielen Systemen für alle Suchanfragen und in allen Situationen gleich, sie ist statisch festgelegt in der Software. Neulich las ich eine interessante Frage auf einer Mailingliste zur Retrievalsoftware Solr: Wie könnte man denn das Relevance Ranking Verfahren dieser Software so nutzen, dass bei der Suchanfrage „Charlie Brown“ im Oktober der Treffer „It’s the Great Pumpkin, Charlie Brown“ auf Platz eins der Trefferliste steht, im Dezember dann aber „A Charlie Brown Christmas„. Tolle Idee!

Letztendlich führen solche Überlegungen zu einer stärkeren Individualisierung von Suchergebnissen, vielleicht zu einer Sortierung nach Pertinenz. Google (man kann halt keinen Artikel zum Thema Suche schreiben ohne dieses Reizwort zu benutzen) macht das ja auch schon: Zum Beispiel indem sie anhand der IP-Adresse von Benutzern deren Sprachkenntnis erraten und dann Suchergebnisse in dieser Sprache höher gewichten. Eine andere Form von Individualiserung erprobt man gerade bei iGoogle, indem man Nutzer ihre Trefferlisten umsortieren lässt4. Und dann gibt es die individualisierte Werbung in Google Mail (da „wissen“ sie ja auch wirklich viel über den einzelnen Benutzer)…

Wir sind in den letzten Wochen mehr und mehr zu der Überzeugung gekommen, dass wir auch bei der Suchkiste individuelle oder situative Aspekte der Benutzer berücksichtigen sollten, damit aus den Daten einfacher Information werden kann5. Das wirft viele Fragen auf: Was wissen wir überhaupt über Benutzer und ihre individuellen Informationsbesdürfnisse bzw. was können wir herausfinden? Wie verwenden wir diese Erkenntnisse, denn sie müssen letztendlich in die Suchanfragen auf den Datenbestand abgebildet werden? Und wie können wir überprüfen, was solche Maßnahmen tatsächlich bringen?

Anregungen, Gedanken und Hinweise dazu aus dem Kreis der Leserschaft sind herzlich willkommen.

  1. Diese Geschichte ist natürlich frei konstruiert. Ähnlichkeiten mit der alltäglichen Praxis sind rein zufällig und nicht beabsichtigt.
  2. Interessierte an einer detaillierteren Diskussion der ausführlicheren Fassungen, Herleitungen, Begründungen und Unterschiede dieser schlagwortartigen Definitionen sowie weiterer Betrachtungen des Allerweltsworts Information mögen sich in ein Proseminar zur Einführung in die Informationswissenschaft begeben. An dieser Stelle muss eine weitere Auseinandersetzung mit diesen Aspekten zugunsten des guten Klangs dieses Artikels unterbleiben.
  3. Das ist natürlich eine sehr willkürliche Auswahl aus Suchanfragen an Retrievalsysteme. Außerdem wissen wir gar nicht, wer den Prototypen benutzt. Erkennbar ist aber zumindest, dass es neben sehr allgemeinen Suchbegriffen auch einige Suchen mit sehr spezifischen, aber wenigen Suchbegriffen gibt
  4. Wobei man damit vermutlich eher „wisdom of the crowds“-Effekte im Blick hat, also aus dem individuellen Verhalten vieler einzelner Nutzer Erkentnisse gewinnen will
  5. Letztendlich ist das nichts neues, klassische Konzepte des Information Retrievals wie relevance feedback gehören ja auch in diese Kategorie, sind in Bibliothekskatalogen bisher aber nicht verbreitet.

3 comments.

  1. […] temporal context was also referred to by Till Kinstler in a (German) blog post about the new “Suchkisten” search system prototype of the German Union Library Network […]

  2. Gibt es eigentlich schon wissenschaftliche Analysen bzw. Forschungarbeiten zum „Einfluss von Suchmaschinen auf die Wahrnehmung und Verarbeitung themenrelevanter Informationen“. Dieses Thema ist m.E. überaus brisant, da Google durch das Ranking der Treffer eine neue Wahrnehmung von Informationsbedeutungen kreiert.
    Rolf

  3. Danke, gefällt mir !