(Fast) Alle tracken mit Google Analytics

Was WordPress fĂŒr die CMS-Landschaft ist, ist Google-Analytics im Sektor Webanalyse. Beide dominieren ihren jeweiligen Bereich. Google Analytics hat sich mit ĂŒber 8o Prozent Marktanteil allerdings viel deutlicher an die Spitze gesetzt als WordPress fĂŒr Content-Management-Systeme. Hier weist W3Techs einen Anteil von mittlerweile 27 Prozent fĂŒr WordPress aus. Allerdings ist der Abstand zur Nummer zwei, Joomla, Ă€hnlich frappierend wie der Abstand von Analytics zu Yandex.Metrika, das ich auf Platz zwei befindet (etwas ĂŒber acht Prozent). Jetpack, das Tool von Automattic (WordPress.com) folgt dicht dahinter mit etwa sieben Prozent. Jetpack funktioniert nur, wenn das entsprechende kostenlose WordPress-Plugin installiert und ein Account bei wordpress.com registriert ist.

Die oft zitierte Open-Source-Alternative zu Google Analytics, Piwik, erreicht nach den Analysen von W3Techs einen Marktanteil von nur zwei Prozent.

Piwik ist in Deutschland recht beliebt, da das Hosting auf eigenen Servern und die weitgehende Kontrolle ĂŒber die gesammelten Daten als großer Vorteil gesehen wird. Allerdings brechen die W3Techs-Analysen die Ergebnisse nicht auf LĂ€nder herunter, so dass sich im weltweiten Vergleich nur ein geringer Anteil fĂŒr Piwik offenbart.

Quelle: Usage Statistics and Market Share of Traffic Analysis Tools for Websites, April 2017

Welche Zukunft haben Open-Source-Webapplikationen?

Einige Open-Source-Webapplikationen dominieren das Web – aber wie kommen kleinere Projekte zurecht?

Nach eigenem Bekunden sind weltweit mehr als 20 Prozent aller Webseiten mit WordPress realisiert. Manche Analysten kommen auf noch höhere Werte. WordPress ist der Prototyp einer Anwendung fĂŒr Webserver, die unter einer quelloffenen Lizenz steht und sich mit der weitverbreiteten Serverzusammenstellung Linux, Apache, MySQL und PHP -ebenfalls alles unter quelloffenen Lizenzen verfĂŒgbar – begnĂŒgt.

„Welche Zukunft haben Open-Source-Webapplikationen?“ weiterlesen

Warum Deutschland im Internet so rĂŒckstĂ€ndig ist

Magnetspeicher als Massensopeicher
Bundeswirtschaftsminister Gabriel hat die „Digitale Agenda“ ausgerufen. Die Cebit 2016 war dafĂŒr ein schöner Anlass. Immer klarer wird selbst den notorisch technologiefernen Gruppen wie der der Berufspolitiker, dass einiges im Argen liegt. Deutschland hat den Anschluss verloren. Woran könnte das liegen?

„Warum Deutschland im Internet so rĂŒckstĂ€ndig ist“ weiterlesen

Was bringt den Geheimdiensten diese Really Big Data – Analyse eigentlich? – Antwort: Einen Blick in die Zukunft (UPDATE)

Visualization of all editing activity by user "Pearle" on Wikipedia (Pearle is a robot). To find out more about this project, go to: www.research.ibm.com/visual/projects/chromogram.html

UPDATE des Artikels vom 23.6.2013

Am Wochenende hat sich der Skandal um die Überwachungsabitionen weiter ausgeweitet. Dies ist die dritte Woche in Folge, in der sich durch weitere EnthĂŒllungen neue Ausmaße abzeichnen.

Langsam, finde ich, wird es Zeit fĂŒr etwas genauere Analysen. Soweit ich das ĂŒberblicke, ist noch nirgendwo eine verlĂ€ssliche oder glaubwĂŒrdige EinschĂ€tzung erschienen, welchen Nutzen diese immens teuren SchnĂŒffelaktionen ĂŒberhaupt haben.

Okay, wir wissen, dass sich Geheimdienste In USA und UK Zugang zu den Glasfaserknoten und den wichtigen Netzknoten verschafft haben. Damit lĂ€sst sich der darĂŒber fließende Internetverkehr grundsĂ€tzlich abhören und mitschneiden, also speichern. Da es sich um Daten auf recht rohem Niveau handelt, dĂŒrften recht aufwĂ€ndige Analysen nötig sein, um den Fragmenten dieses Datenstroms einen Sinn zu geben.

Die Frage ist doch auch: Was lĂ€sst sich mit dieser Datensuppe eigentlich anfangen? Welche Möglichkeiten sind den Diensten ĂŒberhaupt gegeben? Ich vermute, nach dem ich ein paar sowieso selten zu findende, weiterfĂŒhrende Artikel gelesen habe, dass man in der Lage sein wird, einzelne E-Mailkonten zu ĂŒberwachen. Und in einigen FĂ€llen wird es möglich sein, neben der reinen AktivitĂ€tsmessung auch die Inhalte zu entschlĂŒsseln bzw. zuzuordnen. Vielleicht erleben wir deswegen die hĂ€ufigen unspezifischen Warnungen wie zuletzt vor AnschlĂ€gen auf Fanmeilen. Möglicherweise stellt man fest, dass ĂŒber bekannte Mobilfunkverbindungen bzw. E-Mailadressen verstĂ€rkter Traffic lĂ€uft und darauf kann man schließen, dass die eine oder andere Gruppe etwas vor hat.

Vermutlich kann man auch im gespeichertem Datenbestand nachtrĂ€glich Spuren finden, wenn man weiß, wonach man suchen soll. Dass AnschlĂ€ge verhindert werden, wird behauptet. Bewiesen ist das glaube ich noch nicht. Offensichtlich ist der Versuch, Verbrechen mit Big Data Analysen zu verhindern viel viel schwieriger als gezielte Fahndung.

FĂŒr Deutschland auch kein Neuland. Bereits in den 1970ern versuchte das BKA per damals auch umstrittener Rasterfahndung der RAF auf die Spur zu kommen. Geholfen hat das wohl nicht viel.

Es wĂ€re also sehr schön, es erschiene bald irgendwo im Spiegel oder in der SĂŒddeutschen oder wo auch immer ein Beitrag, der einige HintergrĂŒnde etwas genauer ausleuchtet und nicht nur auf Empörung setzt.

UPDATE 6.7.2013

Inzwischen hat sich die PRISM-Geschichte weiterentwickelt. Wir wissen, dass der englische Geheimdienst und auch die NSA Glasfaserkabel anzapft. Wir wissen, dass auch die Franzosen und auch die Deutschen (BND am DECIX) abhören.

Was also macht man mit dieser Riesenmenge an Daten?

Es ist der Versuch, durch korrelative ZusammenhĂ€nge Erkenntnisse ĂŒber die Zukunft ermitteln zu können. Eine Anwendung davon ist Predictive Policing, also der Versuch, aus vergangenen Mustern von KriminalitĂ€t Vorhersagen aus damit gewonnenen Zusammenhangsmodellen zu gewinnen. Dies ist in diesem Dokument genau beschrieben. 

Der englische Guardian hat eine entsprechende Geschichte ĂŒber prĂ€diktive Analysen veröffentlicht: http://www.guardian.co.uk/science/2013/jul/01/how-algorithms-rule-world-nsa

Das Prinzip: Man sieht sich vorhandene Daten an, sucht nach inneren ZusammenhĂ€ngen, die auch versteckt sein können, indem man geeignete statistische Verfahren anwendet (Stichwort: Strukturgleichungsmodelle) und kann dieses Modell darauf prĂŒfen, wie gut es der RealitĂ€t entspricht (Model Fit). Wenn dieser Model Fit hoch genug ist, taugt das Modell auch als Vorhersagemodell fĂŒr zukĂŒnftige ZusammenhĂ€nge. Die Vorhersagekraft kann enorm sein, beĂ€ngstigend und faszinierend zugleich, denn die ZusammenhĂ€nge sind ja tatsĂ€chlich, abgesehen von einer statistischen Fehlerwahrscheinlichkeit, tatsĂ€chlich vorhanden.

In vielen Lebensbereichen funktioniert predictive analysis sehr gut, gerade auch in kreativen Bereichen, von denen man naiv annehmen wĂŒrde, hier kommt der menschliche freie, d.h. unvorhersehbare Wille zu tragen. Das ist offensichtlich nicht so.

So lÀsst sich mit guter Treffsicherheit vorausberechnen, ob ein Popsong eine Hit wird oder nicht. Ein Wedesigner names McCready entwickelte so ein Verfahren, das auf erweiterter Spektralkonvolution basiert.

Beschrieben sind solche Methoden, wie man oft liest, in „Automate This: How Algorithms Came to Rule Our World“ von Christopher Steiner.

Automate This: How Algorithms Came to Rule Our World

Neues aus Bluffdale?

Die Aufregung auch in Deutschland war groß, als die SĂŒddeutsche mit einer Story aufmachte, wonach in den USA praktisch der komplette Datenstrom von Google, Amazon, Microsoft, Facebook ĂŒber die National Security Agency (NSA) ausgewertet wird.

Hier ist eine nette Infografik zum Aufbau und der Funkitionsweise der NSA.

Dass die NSA in Bluffdale eine Riesenanlage (Datacenter) gebaut hat, ist schön lĂ€nger (durch den Informanten und Exmitarbeiter William Binney) bekannt und das Ansinnen der Behörde eigentlich auch: Den Datenverkehr zu scannen und und in der Lage zu sein, auch sichere VerschlĂŒsselungen zu brechen. Blöderweise kann aber jeder US-BĂŒrger und natĂŒrlich auch AuslĂ€nder damit ĂŒberwacht werden (das erinnert an die TV – Serie „Person of Interest„, die in Deutschland abgesetzt worden ist, weil das Publikum von RTL die Szenerie nicht verstanden hat).

Die VorwĂŒrfe von ihm gegen die US-Regierung sind etwa ein Jahr alt und Wire hat darĂŒber ausfĂŒhrlich berichtet: http://www.wired.com/threatlevel/2012/03/ff_nsadatacenter/

Irritierend waren Formulierungen in einem angeblich geleakten Dokument, wonach die staatlichen Behörden „direkten Zugriff“ auf die Server der Unternehmen haben. Dies sei im sogenannten Prism-Programm so auf Basis geltenden Rechts wie dem Patriot Act oder FISA (Foreign Intelligence Surveillance Act), unter denen auch die Echelon – Anlagen in Deutschland fielen.

Die Frage ist natĂŒrlich, ob die gezeigte Prism-PrĂ€sentation echt ist. Besonders professionell gestaltet wirken Logo und Aufmachung ja nicht gerade. Da wĂ€re vielleicht ein Design-Job frei, wie der englische Guardian bemerkte, der auch festgestellt hat, dass auch englische Geheimdienste auf die Erkenntnisse aus der NSA-Datenflut zugreifen konnten. Involviert ist hier der britische GCHQ mit dem harmlos klingenden Namen Goverment Communications Headquaters, der allerdings auch in kalten Kriegszeiten in Deutschland Echelon mitbetrieben hat.

Ernst genommen wird die Affaire, die auch den US-PrĂ€sindenten unter Druck geraten lĂ€sst dennoch erstaunlich heftig. Nach dem 11.September 2001 war Abhören salonfĂ€hig geworde, egal was, egal wo, egal wen – wenn’s nur dem Kampf gegen den Terror dient.

Auch wenn man in USA Datenschutzfragen nicht mit der IntensitĂ€t diskutiert und bewerten wie in Deutschland, lassen sich auch Amerikaner nicht gerne von ihrer Regiererung ĂŒberwachen. Verkaufbar ist das nur unter dem Totschlagargument TerrosismusbekĂ€mpfung, doch die Beweise dafĂŒr, dass man ein solches System wie Prism braucht, fehlen.

Die Amerikaner lassen sich die NSA nun einiges kosten. Überwachung der eigenen Bevölkerung hat noch nie besonders gut funktioniert – in Deutschland hat man das ĂŒber einige Jahrzehnte zumindest im östlichen Teil sehr ernsthaft versucht und alles eingesetzt, was damals technisch und menschlich möglich war. Die CIA war dabei und sollte eigentlich daraus gelernt haben (Stichwort Rosenstolz).

Insbesondere Apple und Google dementieren, dass es Zugriff auf deren Server von staatlicher Seite gibt. In Google Plus finden sich zitierten Dementis, verbreitet ĂŒber den Account von +MattCutts (http://googleblog.blogspot.de/2013/06/what.html) und +LarryPage.

Ich hatte gestern eine interessante Diskussion mit Leuten, die ohnehin sehr Google kritisch eingestellt sind. Eine Stimme meinte, man könne „schon selbst etwas tun“, zumindest die Big4 meiden (Google, Microsoft, Facebook und Apple).

Auch der hessische Justizminister hat sich – ich finde naiverweise – dafĂŒr ausgesprochen, die betroffenen, d.h. erst mal die stĂ€ndig benannten US-Anbieter zu meiden. Ansonsten zeigt sich Verbraucherschutzministerin Aigner empört, leider hört man von den Piraten nichts (da sollte man eigentlich die Kompetenz am ehesten vermuten).

Ich denke, der Schein der seeligen Internetinsel trĂŒgt: Wer auf deutsche oder auch europĂ€ische Anbieter setzen will, muss zunĂ€chst erstmal welche finden: Auch Anbieter mit deutsch klingenden Namen haben Filialen in den USA und damit dĂŒrfte Patriot Act fĂŒr sie ebenso gelten. Internetinfrastruktur ist international. Pure lokale Player sind sehr selten. Dazu gehören 1&1 (und damit auch mail.com, web.de, gmx.xyz), Deutsche Telekom mit T-mobile), Hetzner (Dienstleister fĂŒr Jimdo) und viele viele mehr. Google, Facebook, Apple liefern Dementis und Beteuerungen, es gĂ€be keinen „direkten Zugriff“ auf die eigenen Server. Von deutscher international aktiver Seite hört man auffĂ€llig wenig.Man hĂ€lt sich zurĂŒck, solange die deutschen Internetnutzer sich dem noch nicht bewusst geworden sind.

Die grĂ¶ĂŸten Infrastrukturanbieter sind (nach Markosweb.com; gelb markiert die europĂ€ischen bzw. deutschen) :

1. GoDaddy.com 480662 139801 114836
2. Google 416917 8961 13579
3. THEPLANET.COM INTERNET SERVICES 338908 79727 128702
4. Bluehost 178043 48370 26205
5. SoftLayer Technologies 148042 55884 57967
6. Ovh Systems 126252 25010 16722
7. Hetzner Online AG 125884 40265 27697
8. Rackspace Hosting 122243 68806 21835
9. 1&1 Internet AG 117878 62421 9091
10. New Dream Network, LLC 85968 13341 13830
11. Layered Technologies 83124 55991 41211
12. Oversee.net 79935 50713 35268
13. Secure Hosting 76057 59658 19197
14. Peer 1 Network 72991 42038 61947
15. The Endurance International Group 71332 17522 13297
16. AMAZON.COM 61126 30577 15372
17. 1&1 Internet 60942 7923 10886
18. Castle Access 58171 48388 19896
19. Plus.line AG 57107 46894 15188
20. MEDIA TEMPLE 55400 14330 10018

Diese europĂ€ischen bzw. deutschen Anbieter unterhalten in den USA BĂŒros, Datacenter, Firmenableger und fallen dementsprechend unter den Patriot Act und andere einschlĂ€gige Gesetze.

Verleger beschweren sich ĂŒbers Internet, aber schon Btx konnte Paid Content

Warum beschweren sich Zeitungs- und Zeitschriftenverleger auf der einen Seite ĂŒber „Enteignung“ durch Google, stellen aber ihre kompletten Inhalte hochsuchmaschinenoptimiert kostenlos zur VerfĂŒgung? Es gibt wirklich bald inen Grund mehr, eine Tageszeitung zu kaufen. HĂ€tten die Inhalteproduzenten ein bisschen frĂŒher auf einige Technologien gesetzt, hĂ€tte vielleicht die „Kostenlos-Kultur“ wie es gerne so schön heißt, nicht so drastisch durchgeschlagen. Selbst das altehrwĂŒrdige Btx/Datex-J kannte Bezahlmöglichkeiten fĂŒr Inhalte im Micropaymentbereich von einigen Pfennigen (damals gab es noch die D-Mark) pro Seite. Eine Btx-Seite konnte 0,01 bis 9,99 DM kosten. Pro Abruf! Und die Telekom (damals Deutsche Bundespost) kĂŒmmerte sich um die Bezahlprozesse, nĂ€mlich per Telefonrechnung, notfalls sogar ums Inkasso. Ist es wirklich so schwer, Paid Content auf die Reihe zu kriegen?

Microsoft hat auch mal wieder was Neues

Ich war von Windows Vista schon enttĂ€uscht. Ein wenig mehr Optik, aber sonst nichts Neues. Seit heute gibts den Internet Explorer 8 und er soll ja sehr schnell sein, was ich gerade austeste. Schön, dass Microsoft sich nun an alle Standards hĂ€lt. Paradoxerweise gibt einen RĂŒckwĂ€rtskompatibilitĂ€tsmodus. Webseiten bauen sich wiklich sehr schnell auf. Mit Faccebook und allen gĂ€ngigen Seiten funktioniert das eigentlich sehr gut. Komischerweise laden meine privaten Webseiten eher langsamer. Das kann aber auch gerade am Hoster oder der Internetverbindung liegen. Das Laden großer Bilder scheint lĂ€nger zu dauern.. ob das Bild durch einen Zwangsfilter von Microsoft muss, um potentiell schĂ€dlichn Code zu entdecken?

Ich bin sehr gespannt, wie die Webslices funktionieren, eine Art aufgebohrtes RSS? Ein grĂŒner Button auf Websites soll darauf hinweisen. Bisher habe ich noch nirgendwo einen gefunden.

Ich verwende den IE 8 auf einem betagten Notebook mit einem Pentium M 725 Prozessor und habe den Eindruck, mit ihm Àhnlich schnellen Seitenaufbau zu erleben wie mit Google Chrome, den ich nur hin und wieder mal verwende, da mich Googles Datensammelwut grundstzlich nervt. Safari finde ich eigentlich auch nicht schlecht, nutze ich aber eher nur auf dem iphone.

Eigentlich könnte Outlook Express bzw. das ultralahme Livemail auch mal ein Update gebrauchen.