2006-11-12

noch'n Mashup

Bei der Suche nach Informationen, die man geokodieren und mit Google Maps darstellen kann, haben sich bisher nicht allzuviele Anwendungen aufgedrängt. Viele interessante Daten sind nämlich nicht mit Ortsinformationen versehen, oder lassen sich nicht so ohne weiteres damit verknüpfen. Bei einer Sache ist etwas unklar, ob bzw. wie gut es geht: IP-Adressen. Nachdem ich ja bereitwillig darüber Auskunft gebe, wann ich mich wo aufhalte, ist es meiner Meinung nach nur fair, wenn auch die Leser meiner Webseiten die gleiche Offenheit an den Tag legen. Für meinen Webserver www.oe-files.de habe ich daher zwei Mashups gemacht. Das erste zeigt die gerngesehenen Leser, die typischerweise via Google auf die Folien zu meinen Kursen stoßen. Da ich es mit der Überwachung aber auch nicht übertreiben will, zeige ich weder die genaue IP-Adresse, die Zahl der Zugriffe, die angefragten Daten noch den Zeitpunkt oder die Verweildauer an. Die zweite Karte zeigt diejenigen "Leser", die auch gerne wegbleiben könnten: Nämlich diejenigen, die offensichtlich per Scan meinen vServer gefunden haben. In aller Regel sind das Bots, die nach bekannten URLs suchen, über die z.B. PHP-basierte Web-Foren missbraucht werden können. Ich überlasse es jetzt mal jedem einzelnen zu entscheiden, ob diese Zugriffe im Vergleich zu den erstgenannten aus signifikant anderen Regionen der Welt stammen. Da ich als einzige Information nur einen Hostnamen oder eine IP-Adresse habe, ist natürlich die Frage berechtigt, ob sich daraus überhaupt Ortsinformationen sicher ableiten lassen. Zwar gibt es im Prinzip die Möglichkeit, diese Daten dort abzulegen, wo sie sinnvollerweise hingehören, die Zahl der Provider, die RFC 1876 implementieren, dürfte aber verschwindend gering sein. Da IP-Adressen aber nicht völlig willkürlich verteilt werden, sondern ganze Blöcke den RIRs und von dort dann den einzelnen LIRs zugeordnet werden, scheint eine Verknüpfung dennoch möglich zu sein. Man kann sich einen entsprechenden Dienst zwar einkaufen (wobei die Firma auch eine kostenlose Light-Variante anbietet), ich habe mich aber für die Lösung von hostip.info entschieden. Vor allem, weil man über ein ziemlich simples HTTP-API einfach eine IP-Adresse hinschickt und die entsprechenden Ortsinformationen zurückbekommt. Die Qualität der Daten scheint sehr unterschiedlich zu sein. Ich sehe (zumindest jetzt, während ich das hier schreibe) Zugriffe aus Aachen oder aus Mannheim bzw. Walldorf. Da hätte ich schon einen Verdacht, wer das sein könnte :) Andererseits wurde meine eigene, mir von meinem Provider zugewiesene Adresse, zunächst in Hamburg verortet. Man kann das zwar korrigieren, was ich auch gemacht habe, aber ob damit nun nicht andere Adressen fälschlicherweise in Bielefeld landen, ist unklar. Ich lasse das Mashup jetzt erstmal eine Weile laufen, die Karten werden einmal pro Tag aktualisiert. Um die Leser dieses Blogs zu geokodieren, müsste ich ein paar einfache Tricks anwenden, da ich keinen direkten Zugriff auf die log-Daten habe. Aber das ist natürlich kein wirkliches Hindernis... Update: Ich cache jetzt die geocodierten Daten lokal per Datenbank, und frage nur für neue Adressen bei hostip.info nach. Dadurch habe ich keine Bedenken mehr, das update-Intervall deutlich zu verkürzen. Neue, bisher nicht gesehene IP-Adressen, werden nun durch rote Punkte gekennzeichnet.

Keine Kommentare: