Sehr geehrte(r) Leser(in),
Sie brauchen für Ihre Arbeit den Siedepunkt eines selten benutzten
Lösungsmittels oder den Marktanteil für ein generisches Arzneimit-
tel. Sie werfen Google an und werden fündig.
Wagen Sie es, die gefundenen Informationen für Ihre Planung einzu-
setzen?
In der Informationswissenschaft wird Informationsqualität bzw. Daten-
qualität mit komplizierten Definitionen eingegrenzt, um sie von ande-
ren Begriffen, wie der Semantik und der statistischen Signifikanz, zu
unterscheiden.
Für die einfacheren Bedürfnisse des Internetnutzers, der im Web nach
isolierten Fakten sucht, braucht es nicht so kompliziert zu sein. Die
Qualität eines gefundenen Faktums wird bestimmt durch die folgenden
Eigenschaften:
a) Die Information ist richtig.
b) Die Information ist zutreffend.
Dass die Information "richtig" ist, bedeutet zum Beispiel, dass der
Siedepunkt von Wasser bei 1013,25 mbar mit 100,0 °C angegeben wird,
und nicht mit 100 °F, 100 K oder 79,8 °C.
"Zutreffend" bedeutet, die Information ist genau die, die wir gesucht
haben. Wenn wir, um bei dem banalen Beispiel zu bleiben, den Siede-
punkt von Wasser bei 1013 mbar suchen, dann könnte der Siedepunkt von
Wasser bei 50 mbar zwar eine richtige Information sein, aber keine, die
unsere Frage beantwortet.
Der Begriff "richtig" ist übrigens nicht so trivial, wie es scheint:
Ein Faktum - eine Stoffeigenschaft zum Beispiel - ist nur dann richtig,
wenn alle damit verknüpften Randbedingungen zutreffen. Als Beispiel sei
der Flammpunkt von Acetonitril genannt [1]: Je nach abgefragter Daten-
quelle schwankt er zwischen 2 °C und 13 °C, was mit den zur Bestimmung
verwendeten Verfahren zusammenhängt. Daraus ergibt sich eine weitere
Forderung für die Informationsqualität:
c) Die Information muss vollständig dokumentiert sein.
Für unser Beispiel bedeutet das, die Information kann sowohl richtig (a)
als auch zutreffend (b) sein, wenn wir aber nicht wissen, nach welchem
Verfahren der Wert gemessen wurde, können wir ihn nicht verwenden.
Ein Tutorial, um im Internet die Spreu vom Weizen trennen zu lernen, fin-
det sich hier:
Evaluate Web Pages
Beurteilung gefundener Webseiten (die "Röntgenbrille" für Informations-
suchende):
http://www.library.cornell.edu/t/help/res_strategy/evaluating/evaluate.html
... und als Checkliste:
http://www.library.cornell.edu/olinuris/ref/webcrit.html
Ausführlicherer Artikel zum Thema Informationsqualität, sowie einige
Tipps für die erfolgreiche Zusammenarbeit mit Infobrokern:
http://www.arnold-chemie.de/recherche.html
"Web Wisdom" von J. E. Alexander und M. A. Tate, ISBN 0-8058-
3123-1, enthält eine vollständige und lesbare Darstellung des Themas
Informationsqualität im Internet. Das Buch ist auch nützlich für Web-
autoren, die sichergehen wollen, dass ihre Seiten als glaubwürdig
eingestuft werden:
Web Wisdom auf Amazon
Wenn hochwertige Informationen (a) richtig und (b) zutreffend sind,
dann sollte die ideale Suchmaschine auch nur richtige und zutreffen-
de Suchergebnisse liefern.
Bei Punkt (a) sind die Suchmaschinen machtlos (beinahe). Es gibt aber
viel Entwicklungsarbeit, um wenigstens möglichst zutreffende Ergeb-
nisse zu liefern. Die richtige Suchmaschine für die jeweilige Anfrage
richtig zu bedienen, ist der Trick.
Eben die Leute, die wissen, wie man mit seiner Website bei den Such-
maschinen nach oben kommt, wissen auch, wie die Suchmaschinen "ticken",
wie man also am besten suchen kann. Stefan Karzauninkat ist einer der
"dienstältesten" Suchmaschinenexperten in Deutschland:
http://www.suchfibel.de/
Das Buch von Dirk Lewandowski enthält eine ausführliche Darstellung
der "Technologien zur Informationssuche im Internet". Wer sich genau
über die mögliche Informationsqualität im Web informieren möchte, ist
mit dem Buch gut bedient. Die Druckausgabe ist zwar vergriffen, das
Buch ist jedoch kostenlos online zugänglich unter:
http://www.durchdenken.de/lewandowski/web-ir/
Weitere Publikationen des selben Autors, alle zum Thema Suchmaschinen-
qualität, Suchmaschinenlandschaft und Sinn und Unsinn von Ranking-Ver-
fahren (d. h. des Verfahrens, mit dem die Suchmaschine die Treffer in
einer Rangfolge anordnet):
http://www.durchdenken.de/lewandowski/publikationen.php
Eine Liste von Suchmaschinen, die irgendetwas anders machen, findet
sich hier. Die Suchmaschinen verarbeiten entweder natursprachliche An-
fragen, oder sie gruppieren die Ergebnisse, oder sie geben dem Benutz-
er einen Rat, was er denn mit den Ergebnissen anfangen soll (und darauf
haben wir alle schon gewartet):
Top 100 Alternative Search Engines