SEO und Datenschutz – Tracking Tools gesucht
Diese Woche kam der Blog leider etwas zu kurz aber auf den Webmaster Friday will ich nicht verzichten und da nehme ich mir auch die Zeit, wenn auch leicht verspätet, die Frage zum Thema der Woche SEO und Datenschutz – Google Analytics rausschmeißen? aus meiner Sicht zu erörtern. Dieses Thema wird sehr wahrscheinlich alle Webmaster und Blogger, noch eine ganze Weile beschäftigen. Ob man will oder nicht.
Gesucht: Analytics Ersatz
Es ist ziemlich kalt draußen geworden aber auch im Internet ist es seit kurzem durch die neue Datenschutz Angelegenheit, ein Stück kälter geworden. Während man das kalte Wetter gut im beheizten Zuhause mit einer heißen Tasse Tee (selbstverständlich schwarzer Tee mit Milch) gelöst bekommt, stellt sich die Internet Angelegenheit als wesentlich problematischer dar. Um es vorweg zu nehmen, es mangelt an einer ausgereiften Lösung, einer echten Alternative zum bewährten Google Analytics.
Natürlich gibt zahlreiche Alternativen die einen ähnlichen Funktionsumfang bieten und durch ausgeklügelte grafischen Darstellungen auffallen. Allerdings weisen sämtliche Counter, Tracking Tools oder wie man sie auch nennen mag, das gleiche große Manko auf: sie liefern schlicht keine exakten Werte. Google Analytics ist wesentlich effizienter und dies ist auch jederzeit belegbar. Analytics filtert beispielsweise Bots mit einer beeindruckenden Genauigkeit aus seiner Statistik heraus, wie ich es bisher bei keinem Tracking Tool erlebt habe. Selbst Spam Bots, die mit abwechselnder IP auf eine Seite zugreifen, werden erkannt und nicht in die Analyse mit einbezogen. Dies betrifft die ganze Seite inklusive sämtlicher Unterseiten. Eine Beeindruckende Leistung die eben andere Tools nicht bewältigen können.
Die Besucherzahl lässt sich einigermassen mit diversen Tools (chcounter, Piwik) gut feststellen, nach meiner Erfahrung, schwanken die tatsächlichen Werte zu denen von Google Analytics, zwischen 10-25% was eine gezielte Statistikauswertung von vornerein ausschließt. Kann man also bei der Besucherzahl noch abstriche und grobe Einschätzungen machen, sieht es bei den Seitenaufrufen (Pageviews) erheblich schlimmer aus.
Die oben erwähnte Bot Problematik, schlägt bei den Seitenaufrufen richtig zu buche. Abweichende Ergebnisse bis zu 300% sind da die Folge und je öfter Bots auf die Seite zugreifen, umso problematischer wird es. Ein harmloser Bot, der bei einem publizierten Artikel vorbeischaut, verursacht bereits einen Seitenaufruf für den Counter. Wenn dieser Bot dann im laufe des Tages noch einmal vorbeischaut weil eventuell der Artikel ein Update oder Veränderung wiederfahren ist, wird wieder mitgezählt.
Wer wie ich noch Twitter oder Facebook nutzt und seine Artikel dort bewirbt, der wird leicht von gut einem Dutzend Bots am Tag besucht, die teilweise auch auf die Feeds zurück greifen. Wer sich über die ständig schwankenden Angabe bei FeedBurner wundert, sollte bei Gelegenheit seine Logs auswerten und diesen Bots den Zugriff verweigern.
Intern / Extern
Wer nun auf der Suche nach einer adäquaten Lösung ist und in Zukunft aufgrund der Datenschutz Problematik auf Google Analytics verzichten will, sollte tunlichst auf externe Anbieter verzichten. Denn gerade damit haben die Datenschützer ein großes Problem mit. Datenspeicherung durch Dritte, das wird sicherlich auch in Zukunft weiter torpediert werden. Auf diesen Umstand, sollte man sich speziell in Deutschland einrichten. Da wird es wahrscheinlich nur unzureichende Kompromisse geben. Bei der Wahl des neuen Tracking Tools, sollten also sämtliche erfasste sowie gespeicherte Daten, auf Eurem Server oder Host, nur Euch zugänglich sein. Eine Auslagerung wie im Fall von Google Analytics, wird problematisch bleiben. Niemand kann sagen oder gar kontrollieren, was mit den externen Daten noch passiert oder wer noch Zugang zu diesen besitzt.
Ich persönlich verwende neben Google Analytics, den kostenlosen chcounter, mit dem die Speicherung von IP Adressen abgeschaltet werden kann. Allerdings ist chcounter ebenfalls sehr anfällig bei der Auswertung von Pageviews. Um eine vernünftige Auswertung der Besucherzahlen zu bekommen, benötigt es etwas Arbeit sowie Pflege des chcounter.
Exakte Werte bzw. Statistiken sind für den privaten Blogger interessant und aufschlussreich, wer aber mit seinem Blog Geld verdienen will und Banner sowie Ads zur Vermietung anbietet, der kommt um genaue Statistiken, wie sie Google Analytics liefert, nicht herum. Denn diese werden nicht nur von potenziellen Werbe Interessierten verlangt, sondern bestimmten teilweise auch den Preis. Wer keine belegbaren Statistiken vorweisen kann, verliert möglicherweise Geld. Zumindest bedeutet es einen Nachteil bei möglichen Preisverhandlungen.

Ich habe mich ja dazu entschlossen auf Analytics zu verzichten. Stattdessen habe ich die von dir genannten Piwik und chcounter ausprobiert. Beide sind toll und erfüllen auch ihre Aufgaben. Aber ich bin mit beiden nicht zufrieden gewesen. Usability/Optik passten mir überhaupt nicht in den Kram. Aber zumindest bei Piwik sehe ich die Chance das dies irgendwann noch kommen kann. Evtl. werde ich in einigen Monaten nochmals auf Piwik zurückgreifen und sehen was sich getan hat. Ein paar fleißige Bastler sind ja pausenlos damit beschäftigt. Open Source sei Dank.
Aktuell sehe ich die Problematik dass die internen Lösungen alle nicht an die Qualität externer Lösungen heranreichen. Google Analytics oder auch Postrank Analytics (welches ich furchtbar gerne nutzen würde) sind halt doch noch eine andere Liga.
Im Interesse des Datenschutzes sollte man nun auf externe Tracking Anbieter verzichten. Das Argument kann ich nachvollziehen. Aber auch das ist nicht ohne Weiteres für jedermann möglich oder? Hat denn jeder die nötigen Voraussetzungen bei seinem Hoster um ein hochwertiges internes Tracking zu betreiben? Langzeitstatistiken und deren Analyse erfordern Datensammlung über Monate und Jahre, und nicht jeder hat eine Datenbank die solche Mengen ohne weiteres speichern kann. Ich finde die internen Lösungen gehen schon nach 1-2 Monaten gewaltig in die Breite in der Datenbank.
Wird dadurch nun jeder Selbstständige im Internet gezwungen monatlich mehr Geld zum Hoster zu tragen damit die für das Geschäft nicht gerade unwichtige Besucheranalyse möglich ist? Es gibt nämlich auch viele Selbstständige die mit einem Mini-Webspace arbeiten und nicht auf eigene Server etc. zurückgreifen können.
Ich selbst finde Datenschutz wichtig, keine Frage. Aber irgendwie ist das doch alles Sch….. ohne gescheite Statistikauswertung !
Das Google Analytics die Bots so gut ausfiltert liegt meiner Meinung nach einfach daran, daß die meisten Bots kein (externes) Javascript ausführen und sie somit quasi technisch bedingt gar nicht erst erfaßt werden.
Ich persönlich setze ja auf die Logfile-Auswertung und finde es zum Teil gar nicht mal so uninteressant zu wissen, wie oft und wann z.B. die Bots der großen Suchmaschinen auf welche meiner Seiten und Dateien zugreifen.
@Piet
Ist leider wirklich so eine verzwickte Situation. Interne Lösungen funktionieren nicht ausreichend und externe sind wieder zu heikel aufgrund des Datenschutzes. Keine Lösung in Sicht :-(
@Schnurpsel
Die vom Hoster zur Verfügung gestellten Logfiles gehe ich auch regelmäßig durch. Der Yahoo Bot ist bei mir erstaunlicherweise am fleißigsten zugange. Allerdings ziehe zur Auswertung doch lieber Analytics oder chcounter vor. Übersichtlicher und schneller als meine Logfiles.
Hallo,
beschäftige mich auch gerade mit dem Thema. Auf Google Analytics würde ich gerne verzichten und auf eine “interne” Lösung zurückgreifen. Dabei ist es natürlich wichtig möglichst genaue Zahlen zu bekommen.
Zu der Bot-Problematik: Zeigt der chCounter die nicht an? Dann könnte man die doch von den Gesamtabrufen abziehen und hätte doch recht genaue Zahlen, oder?
Viele Grüße,
Marco
Hi Marco,
das Problem bei einigen Bots besteht darin, das diese gerne “rotierende” IP Adressen bzw. Proxies verwenden. Da wird es etwas schwer, diese auszufiltern. Das macht man dann am besten via Htaccess (?). Es gibt zumindest eine Option, die Bots anhand einer Zeiterfasssung auszusperren. Bedeutet: Ein Bot der im Sekundentakt deinen Blog crawlt, wird automatisch gesperrt. Normalerweise sollte ein relativ harmloser Bot, mindestens 3 wenn nicht sogar 5 Sekunden Abstand beim crawlen einer Seite lassen. Diese Bots beachten in der Regel auch die robots.txt.
Ich bin aber alles andere als ein htaccess Experte aber via Google sollte da einiges zu finden sein.
Gruß,
Andreas
Hi Andreas,
aber wenn bspw. chCounter den Bot einmal erkannt hat, dann müsste er den doch auch erkennen wenn der mit einer anderen IP kommt!? Klar, wenn er nen Proxy nutzt, dann wirds deutlich schwerer.
Wenn es bei mir richtig losgeht werde ich mal schauen wie sich das so verhält.
Schönen Abend,
Marco
Hi Marco,
ein klares Jein dazu ;-) Das ist leider nicht mehr so einfach, die sind ganz schön trickreich geworden. Ich bin da auch kein Experte und habe schon das ein oder ausprobiert. 100% funktionieren tut es auf Dauer leider nie.
Gruß,
Andreas