NEWSLETTER "CHEMIE UND VERFAHRENSTECHNIK IM WEB"

Informationen für Planer und Anlagenbetreiber
Erscheint monatlich
ISSN 1613-2513
38. Ausgabe April 2007

WEBAUSGABE

Sie erhalten diesen Newsletter, weil Sie

- sich im Verteiler auf der Website eingetragen haben
- oder bereits in Kontakt mit mir stehen und dem Versand zugestimmt haben.

Ihre E-Mail-Adresse wird ausschließlich zum Versand des Newsletters
gespeichert und nicht weitergegeben.

Sie können den Newsletter jederzeit abbestellen. Eine leere Mail an die
folgende Adresse genügt: newsletter@arnold-chemie.de?subject=remove


Thema dieser Ausgabe:


Über Informationsqualität, und über die Suche nach der Perle in
der Müllhalde


1. Über Informationsqualität
2. Der Feind, die Suchmaschine

Sehr geehrte(r) Leser(in),

Sie brauchen für Ihre Arbeit den Siedepunkt eines selten benutzten
Lösungsmittels oder den Marktanteil für ein generisches Arzneimit-
tel. Sie werfen Google an und werden fündig.

Wagen Sie es, die gefundenen Informationen für Ihre Planung einzu-
setzen?

1. Über Informationsqualität

In der Informationswissenschaft wird Informationsqualität bzw. Daten-
qualität mit komplizierten Definitionen eingegrenzt, um sie von ande-
ren Begriffen, wie der Semantik und der statistischen Signifikanz, zu
unterscheiden.

Für die einfacheren Bedürfnisse des Internetnutzers, der im Web nach
isolierten Fakten sucht, braucht es nicht so kompliziert zu sein. Die
Qualität eines gefundenen Faktums wird bestimmt durch die folgenden
Eigenschaften:

a) Die Information ist richtig.
b) Die Information ist zutreffend.

Dass die Information "richtig" ist, bedeutet zum Beispiel, dass der
Siedepunkt von Wasser bei 1013,25 mbar mit 100,0 °C angegeben wird,
und nicht mit 100 °F, 100 K oder 79,8 °C.

"Zutreffend" bedeutet, die Information ist genau die, die wir gesucht
haben. Wenn wir, um bei dem banalen Beispiel zu bleiben, den Siede-
punkt von Wasser bei 1013 mbar suchen, dann könnte der Siedepunkt von
Wasser bei 50 mbar zwar eine richtige Information sein, aber keine, die
unsere Frage beantwortet.

Der Begriff "richtig" ist übrigens nicht so trivial, wie es scheint:
Ein Faktum - eine Stoffeigenschaft zum Beispiel - ist nur dann richtig,
wenn alle damit verknüpften Randbedingungen zutreffen. Als Beispiel sei
der Flammpunkt von Acetonitril genannt [1]: Je nach abgefragter Daten-
quelle schwankt er zwischen 2 °C und 13 °C, was mit den zur Bestimmung
verwendeten Verfahren zusammenhängt. Daraus ergibt sich eine weitere
Forderung für die Informationsqualität:

c) Die Information muss vollständig dokumentiert sein.

Für unser Beispiel bedeutet das, die Information kann sowohl richtig (a)
als auch zutreffend (b) sein, wenn wir aber nicht wissen, nach welchem
Verfahren der Wert gemessen wurde, können wir ihn nicht verwenden.

CHECKLISTEN FÜR DIE BEURTEILUNG VON INFORMATIONEN

Ein Tutorial, um im Internet die Spreu vom Weizen trennen zu lernen, fin-
det sich hier:
Evaluate Web Pages

Beurteilung gefundener Webseiten (die "Röntgenbrille" für Informations-
suchende):
http://www.library.cornell.edu/t/help/res_strategy/evaluating/evaluate.html

... und als Checkliste:
http://www.library.cornell.edu/olinuris/ref/webcrit.html

ÜBER KLASSISCHE UND INTERNETRECHERCHEN

Ausführlicherer Artikel zum Thema Informationsqualität, sowie einige
Tipps für die erfolgreiche Zusammenarbeit mit Infobrokern:
http://www.arnold-chemie.de/recherche.html

BUCHTIPP

"Web Wisdom" von J. E. Alexander und M. A. Tate, ISBN 0-8058-
3123-1, enthält eine vollständige und lesbare Darstellung des Themas
Informationsqualität im Internet. Das Buch ist auch nützlich für Web-
autoren, die sichergehen wollen, dass ihre Seiten als glaubwürdig
eingestuft werden:
Web Wisdom auf Amazon

2. Der Feind, die Suchmaschine

Wenn hochwertige Informationen (a) richtig und (b) zutreffend sind,
dann sollte die ideale Suchmaschine auch nur richtige und zutreffen-
de Suchergebnisse liefern.

Bei Punkt (a) sind die Suchmaschinen machtlos (beinahe). Es gibt aber
viel Entwicklungsarbeit, um wenigstens möglichst zutreffende Ergeb-
nisse zu liefern. Die richtige Suchmaschine für die jeweilige Anfrage
richtig zu bedienen, ist der Trick.

SUCHFIBEL

Eben die Leute, die wissen, wie man mit seiner Website bei den Such-
maschinen nach oben kommt, wissen auch, wie die Suchmaschinen "ticken",
wie man also am besten suchen kann. Stefan Karzauninkat ist einer der
"dienstältesten" Suchmaschinenexperten in Deutschland:
http://www.suchfibel.de/

WEB INFORMATION RETRIEVAL - DAS SUCHMASCHINENBUCH

Das Buch von Dirk Lewandowski enthält eine ausführliche Darstellung
der "Technologien zur Informationssuche im Internet". Wer sich genau
über die mögliche Informationsqualität im Web informieren möchte, ist
mit dem Buch gut bedient. Die Druckausgabe ist zwar vergriffen, das
Buch ist jedoch kostenlos online zugänglich unter:
http://www.durchdenken.de/lewandowski/web-ir/

Weitere Publikationen des selben Autors, alle zum Thema Suchmaschinen-
qualität, Suchmaschinenlandschaft und Sinn und Unsinn von Ranking-Ver-
fahren (d. h. des Verfahrens, mit dem die Suchmaschine die Treffer in
einer Rangfolge anordnet):
http://www.durchdenken.de/lewandowski/publikationen.php

ALTERNATIVE SUCHMASCHINEN

Eine Liste von Suchmaschinen, die irgendetwas anders machen, findet
sich hier. Die Suchmaschinen verarbeiten entweder natursprachliche An-
fragen, oder sie gruppieren die Ergebnisse, oder sie geben dem Benutz-
er einen Rat, was er denn mit den Ergebnissen anfangen soll (und darauf
haben wir alle schon gewartet):
Top 100 Alternative Search Engines

[1] Jörg Steinbach, "Chemische Sicherheitstechnik", ISBN 3-527-28710-8

Haben Sie Anmerkungen, Fragen oder Kommentare zu dem Thema?


Was würden Sie gerne wissen? Schreiben Sie mir! Die interessantesten
Zuschriften werden veröffentlicht.
newsletter@arnold-chemie.de?subject=Anmerkung_zum_Newsletter_38.Ausgabe


Ältere Ausgaben des Newsletters finden Sie im Archiv:



http://www.arnold-chemie.de/newsletter/newsletter.html

Dort können Sie den Newsletter auch abonnieren, oder Sie schreiben an die folgende
Adresse: newsletter@arnold-chemie.de
Geben Sie bitte Ihren Namen an.

Ich freue mich, wenn Sie den Newsletter weiterleiten oder Textteile daraus verwenden,
aber löschen Sie bitte nicht die Copyrightangaben.


Herausgeber



Dr. Arnold Chemie-Beratung
Claudia Arnold
Hinterm Ließ 13

88481 Balzheim
Tel: +49(7347)920 233
Fax: +49(7347)920 597
Mobil: (0175)928 12 91
E-Mail: ca@arnold-chemie.de
http://www.arnold-chemie.de
Umsatzsteuer-Identifikationsnummer DE210204914
© Dr. Claudia Arnold 2007