Einträge von April 2010

Homepage-Statistiken aus Logfiles selbst erstellen

Um Statistiken über Besucherzahlen und Seitenaufrufe ermitteln zu können, habe ich folgendes Bash-Script geschrieben:

#!/bin/bash
#mailstat v0.3
d=$(date +%d/%b/%Y)
for url in "xn--sdumgehung-9db.de" "mbecker-tech"; do
echo "Domain: $url:" >> out
ges=$(grep "$d" /var/log/apache2/access.log | grep "$url" | awk '{print $1}' | sort | uniq -c | grep -c ".")
echo "Besucher: $ges (IPs)" >> out
echo "" >> out
echo "Besuchte Seiten:" >> out
grep "$d" /var/log/apache2/access.log | grep "$url" | awk '{print $11}' | sort | uniq -c | sort -b -n -r >> out
echo " " >> out
done
echo " " >> out
echo "Statistic generated by mb-mailstat v0.3" >> out
echo "Copyright 2010 by M. Becker | http://mbecker-tech.de" >> out
echo " " >> out
mail -s "Statistik $d" <emailadresse> < out
rm out

Das Script wird täglich von cron aufgerufen und durchsucht die access.log vom apache-Webserver nach dem aktuellen Datum. Diese Rohdaten werden anschließend noch nach den URLs der VHosts durchsucht und die Anzahl der Besucher (anhand der IPs) ermittelt.

Anschließend werden noch die angezeigten Unterseiten ausgefiltert und gezählt.

Diese Statistik wird dann per E-Mail an mich gesendet:

Domain: mbecker-tech:
Besucher: 20 (IPs)

Besuchte Seiten:
    122 "http://mbecker-tech.de/2010/04/18/
         donaukurier-und-google-street-view/"
     87 "http://mbecker-tech.de/"
     79 "http://mbecker-tech.de/?p=803&preview=true"
     62 "http://mbecker-tech.de/wp-content/themes/eximius/style.css"
     46 "http://mbecker-tech.de/wp-admin/post.php?action=edit&post=803"
     32 "http://mbecker-tech.de/wp-admin/css/colors-fresh.css?ver=20091217"
     28 "http://mbecker-tech.de/wp-admin/"
     23 "http://mbecker-tech.de/wp-admin/post-new.php"
     15 "http://mbecker-tech.de/tag/freenet/"
     15 "http://mbecker-tech.de/fuhrpark/"
     12 "http://mbecker-tech.de/impressum/"
      9 "http://mbecker-tech.de/2010/04/02/service-bei-1und1/"
      6 "http://mbecker-tech.de/wp-includes/js/tinymce/themes/advanced/
         skins/wp_theme/ui.css?ver=327-1235100"
      6 "http://mbecker-tech.de/wp-admin/edit.php"
      3 "http://mbecker-tech.de/category/motorsport/"
      1 "http://mbecker-tech.de/projekte/"
      1 "http://mbecker-tech.de/it-skills/"

Statistic generated by mb-mailstat v0.3
Copyright 2010 by M. Becker | http://mbecker-tech.de

Donaukurier und Google Street View

Unsere Lokalzeitung “Donaukurier” läuft ja momentan Sturm gegen Googles “Street View” – es vergeht fast kein Tag, an dem nichts darüber berichtet wird. Es gibt sogar eine eigene Unterseite auf deren Homepage zu diesem Thema.

Schaut man sich als internet-affiner Mensch die Homepage des Donaukuriers allerdings genauer an, wird man folgendes feststellen:

Einerseits predigt man Datenschutz und “hetzt” regelrecht gegen Google Street View, nutzt aber selbst Googles umstrittenes Web-Analyse-Tool “Google-Analytics” (sehr interessanter Wikipedia-Artikel) zur Aufzeichnung / Zählung / Auswertung der Homepagebesucher.

Google bekommt somit von allen Besuchern der DK-Homepage diverse Informationen:

  • Internet-Einwahlpunkt (Standort)
  • Internet-Service-Provider (z. B. Telekom, 1und1, freenet…)
  • Betriebssystem + Browser
  • Bildschirmauflösung
  • Flash- und Java-Unterstützung
  • u.v.m.

Und natürlich auch (wofür der Dienst ja eigentlich gedacht ist) folgende Informationen:

  • welche DK-Seiten wie lange betrachtet wurden
  • wie man genau auf die Seite des DKs gekommen ist (direkt, per Suchbegriff “asdf” über Suchmaschine “jklö” oder per Link “http://asdf.invalid”)

Außerdem wird von Google Analytics ein Cookie gesetzt, womit der Besucher bei einem späteren Seitenaufruf von Google wieder identifiziert werden kann.

An und für sich erscheint das ja nicht weiter schlimm – es ist aber nicht auszuschließen, das Google diese Daten mit anderen Informationen anderer Seiten (die ebenfalls Analytics einsetzen) kombiniert und somit “Nutzerprofile” anlegen kann, die Rückschlüsse auf das Surfverhalten der Einzelpersonen ziehen lassen!

Betrachtet man die Seiten des DKs weiter, fallen diverse aktive Inhalte fremder Anbieter auf (z. B. zur Einblendung der Werbung), die es Dritten ermöglichen, ebenfalls Daten über den Homepage-Besucher sammeln zu können:

  • twing.com (???)
  • twitter.com (Kurznachrichtendienst)
  • adlink.net (Werbung)
  • nuggad.net (Werbung)
  • adtoma.com (Werbung)
  • ivwbox.de (Analyse-Tool für Werbung)
  • brightcove.com (???)
  • doubleclick.net (gehört zu Google)

Dies ist jetzt nicht spezifisch für die Internetseiten des Donaukuriers – viele Seiten benutzen Google Analytics zur Zählung / Analyse der Besucherzahlen (auch ich) oder binden über aktive Inhalte Werbung anderer Seiten ein.

Es erscheint aber mehr als nur absurd, ständig gegen die Datensammlung von Google zu propagieren, selbst aber zahlreichen solcher Unternehmen zur Profilerstellung aus Nutzerdaten zu verhelfen.

Wer im Glashaus sitzt…

Update: Ausführlicherer Artikel zum Download

Update: Leserbrief vomm 21. April in stadtzeitung.in / blickpunkt.in zum Download

Update: Auch sehr interessant: Prof. Dr. Thomas Grauschopf (FH Ingolstadt) über Datensammel- und Profilingtechniken im Web, es wird auch die Homepage des Donaukuriers unter die Lupe genommen

Update: Leserbrief und Blog-Eintrag haben offenbar gefruchtet, die Homepage des Donaukurier ist nun frei von Google-Analytics. Allerdings stellt sich für mich die Frage, ob beim DK die linke Hand nicht weiß, was die rechte tut…

Update: Auch prostreetview berichtet über meinen Artikel / Leserbrief

Service bei 1und1

Heute musste ich feststellen, dass es Servicecenter gibt, die noch langsamer als die bei freenet sind:

27.12.2009:
Ich stelle im Kundencenter die Frage, wie ich die in meinem DSL-Vertrag laut AGB enthaltene Domain bestellen kann

25.01.2009:
Ich erhalte eine “Standardantwort” mit einem Video, das die Navigation durch’s Kundencenter an die richtigen Unterpunkte zeigt. An und für sich ist das ja eine gute und kundenfreundliche Lösung – allerdings sehe ich die im Video gezeigten Navigationspunkte nicht. Ich schreibe als noch am selben Tag eine neue Anfrage im Supportcenter.

02.04.2009:
Ich erhalte nach über 2 Monaten (!) eine Antwort auf meine Frage! Als erstes entschuldigt man sich für die Zitat “längere Bearbeitungszeit” und erklärt mir dann, dass in meinem Vertrag leider doch keine Domain enthalten ist, da dieser Vertrag noch aus “freenet-Altbeständen” stammt. Da ich mittlerweile mit meinen Domains zu prosite gewechselt bin und damit mehr als zufrieden bin, ist mir das jetzt aber auch egal.

Es stellt sich für mich aber die Frage, ob dies der in den vielen 1und1-TV-Spots so groß angekündigte grandiose Service sein soll?

Im TV-Spot wird auch auf die E-Mail-Adresse des “Leiters für Kundenzufriedenheit”, Herrn Marcell D´Avis, verwiesen: davis@1und1.de.

Da E-Mail-Adressen bei Unternehmen i.d.R. vorname.nachname@firma.tld lauten, versuchte ich es mal mit einer Mail an Marcell.DAvis@1und1.de und siehe da – es funktioniert: Ich bekam zwar eine Abwesenheitsnotiz, dass der gute Herr Davis bis 5. April außer Haus ist, bin mir aber sicher, dass er sich danach über meine Mail freuen wird.

Sollte jemand wie ich also auch Probleme mit 1und1 haben, einfach mal vertrauensvoll an Marcell.DAvis@1und1.de wenden!

02.05.2010:
Weder auf meine E-Mail an davis@1und1.de, noch auf die an Marcell.DAvis@1und1.de habe ich bisweilen eine Antwort erhalten. Was ist jetzt mit dem großen Service von 1und1?