Go to the top

Valeur des statistiques Web : méfiez-vous des contrefaçons!

Nicolas / Blog, Mesures et analyses / 1 Comment

statistiques webDerrière ce titre fortement racoleur digne d’un “Ardisson numérique”, je souhaite aborder les bonnes pratiques ou définitions des outils de mesure de site Internet. Un combat qui oppose 2 ténors web en 3 lettres LOG versus TAG.
Les différents outils de mesure du marché n’ont pas le même référentiel. Certains calculent du côté de votre serveur d’hébergement de site internet par des données enregistrées par les machines (LOG), et d’autres calculent par l’affichage de la page chez l’internaute (TAG).

# Un LOG est un fichier contenant diverses informations hiérarchisées (heure de connexion, page, url, temps de visites…). Les outils statistiques basés sur des LOG consolident tout ces différents fichiers pour les rendre compréhensibles par l’utilisateur.

# Un TAG est un bout de code que l’on rajoute à ses pages internet. Ce bout de code va transmettre, au service tiers, les données statistiques pour être consolidées sous forme de tableaux ou graphiques.

J’ai retrouvé un document de XITI, qui certes date un peu mais est toujours valable, présentant les différences notables et la précision des calculs entre les LOG et les TAG. Le voici :
Comparatif de la mesure statistique par LOG versus TAG

Globalement le TAG est plus précis que le LOG qui lui est sujet à des contraintes (chargements, requêtes) autres que celles demandées par des robots internautes.

Ce comparatif, édité par Xiti, relève de bonnes choses et présente le TAG sous son meilleur jour : normal me direz-vous le TAG est la base technologique de XITI. Cette mesure via la page affichée par l’utilisateur (aussi appelée USERS CENTRICS) est pour moi la bonne solution. Maintenant il y a certains pièges/données à ne pas ignorer :

  • Le TAG ralenti votre site internet : que ce soit Xiti ou Google Analytics (service de statistique gratuit de Google) ces éléments chargés vont prendre quelques millisecondes supplémentaires pour effectuer le chargement complet de la page. Et ceci sur chaque page!. Si les services tiers utilisés sont chargés cela peut se transformer en seconde,
  • Le TAG fonctionne par langage Javascript, et donc s’il n’y a pas d’alternative au javascript (code noscript) les visiteurs n’utilisant pas un navigateur équipé ne seront pas comptabilisés,
  • Il est quasi impossible de comparer les résultats d’outils différents entre eux pour un même site. Cela vient du référentiel. Exemple l’outils de statistique WordPress calcul en page vues, Google Analytics et Xiti ont sensiblement la même manière de calculer (visites/visiteurs/pages vues) mais pourtant pour avoir fait le test j’ai souvent plus de visites sous Google que Xiti,
  • Les LOG ont un avantage il sont directement connectés sur le serveur et donc peuvent remonter des données supplémentaires : exemple les pages d’erreurs 404 (générées par quelles pages depuis quelle URL), Certes d’autres outils comme Google Webmaster Tool peuvent vous donner des informations mais c’est au bon vouloir de Google au moment où il est passé sur votre site,
  • Les récentes versions d’outils statistique utilisant les TAG permettent, de part le langage Javascript utilisé, d’avoir des data (données) supplémentaires : exemple zones les plus cliquées sur votre site, le nombre de visiteurs ayant scrollés en bas de vos pages…,
  • Les LOG sont souvents en temps réels tandis que les TAG sont avec un décalage du au traitement de la consolidation des données (sauf des produits tel que Xiti Analyser 2 et NX).

Alors j’en reviens à mon titre d’article “mode racolage actif”, personnellement je ne crois pas que baser sa mesure sur un seul et unique outil soit la meilleure solution et même pire ne croire qu’en un seul référentiel peut être dangereux.
En effet supposons qu’un service soit indisponible vous pouvez toujours remonter des donnés par un autre, encore faut-il que vous l’ayez prévu, installé et configuré. Même s’il y a un décalage entre les deux outils de mesure (de part le référentiel de mesure) cela vous donnera une tendance en comparaison avec des dates clés de votre communication on-line passée.

De plus, comme sur un ordinateur personnel il n’y a pas de logiciel miracle, toutes les solutions ont leurs avantages et inconvénients. L’objectif de posséder plusieurs outils de mesure pour un même site est d’utiliser au quotidien la solution la plus customisable sur la remontée de données (gain de productivité et d’actions techniques ou éditoriales pro-active), d’utiliser le ou les autre(s) pour combler les lacunes de la solution statistique principale (exemple 404, redirection, sites référents etc.).

So What? une reco….
Personnellement j’utilise au quotidien Google Analytics pour les petits sites, la mise en place des tag est un simple copier coller, la configuration de rapport personnalisé est très simple et ont peut vite monter en compétence sur cet outils. Je me souviens en 2008 à l’EBG lors d’une session que PizzaHut france déclarait ouvertement suivre toutes ses stats sur cet outil gratuit.
Ensuite suivant les projets et les ambitions j’utilise en complément PIWIK qui a la fonctionnalité Zone de clics Chaleur et Crawltrack, logiciel dont les statistiques ne sont pas (à l’origine) la fonction première mais qui remonte aussi des informations sur les passage des moteurs de recherche (d’où le nom crawltrack), des pages d’erreur ou même les tentatives de piratage.

Nota: parlons Flux quand même sur ce blog (!) pour les mesures de flus RSS, c’est via feedburner que je consolide mes données en général.

Enfin sur les Grand-Compte je conseille XITI. Car les capacités de mesure sont haut de gamme (mesure des éléments vidéo, rss, flash…) dommage que XITI FREE oblige d’afficher un logo mais c’est en tout cas un complément idéal d’un Google analytics ou PIWIK pour une solution 100% gratuite.

Du liens en veux tu en voilà!
J’ai retrouvé sur Webrankinfo une belle série de services que voilà :
123loganalyzer ( http://www.123loganalyzer.com/ )
Analog ( http://www.analog.cx )
Awstats ( http://www.awstats.org )
Click Tracks ( http://www.clicktracks.com )
directstat ( http://www.direct-stats.com )
edatis ( http://www.edatis.com )
estat ( http://www.estat.com/ )
Extreme tracking ( http://extremetracking.com/open;unique?login=alexucho )
ezboo ( http://www.ezboo.com/softs/ – http://www.beloop.com/softs/ezwebstats)
Flashstats ( http://www.maximized.com/products/flashstats/ )
futurstat ( http://www.futurstat.com )
Google Analytics ( http://www.google.com/analytics/ )
hitbox ( http://www.hitbox.com – http://www.hbxondemand.com/highlights.html )
Kietu? ( http://www.kietu.net/ )
loganalizer ( http://www.hobbesworld.com/loganalizer/index.php )
MesStatistiques ( http://www.mes-statistiques.com/demo.asp )
Modlogan ( http://www.modlogan.org/ )
Nedstats gratuit ( http://www.nedstatbasic.net )
Nedstats payant ( http://www.nedstat.com/fr/f80336e120563_index.htm )
NetTracket 7.5 ( http://www.sane.com/ )
Nielsen // Netrating ( http://www.nielsen-netratings.com )
phpmyvisites ( http://www.phpmyvisites.net )
pilote software ( http://www.pilotsoftware.com/pilotworks/ )
rkrt_stats ( http://rkrt.redkernel-softwares.com/ )
SAS Web analytics ( http://www.sas.com )
Stats reports ( http://www.stats-reports.fr )
titag ( http://www.titag.com )
UcatchIt ( http://www.ucatchit.com )
Urchin ( http://www.urchin.com/products/demo/ )
webalizer ( http://www.mrunix.net/webalizer/ )
Webandstats ( http://www.audientia.com/new/fr/new/WaSasp.html )
weborama ( http://www.weborama.fr )
webtrends ( http://www.webtrends.com/ )
wysistat ( http://www.wysistat.com )
Xiti ( http://www.xiti.com )

Il ne vous reste plus qu’à définir de vrais bons objectifs pour tester leurs mesures!

NB: je prévois un futur billet sur l’optimisation du code Google analytics car des solutions pour rendre son chargement plus rapide existent donc à suivre…

Leave a Comment