Categories

Accueil > Archives AK-Dev > [Archive AK-Dev] Statistiques serveurs et statistiques par marqueurs : (...)

13 août 2009
Eric Bernard

[Archive AK-Dev] Statistiques serveurs et statistiques par marqueurs : pourquoi de telles différences ?

Disposer des statistiques de son site est indispensable, pour évaluer son impact et pour le faire évoluer. On souhaite tous que les statistiques soient les meilleures possibles, montrent une progression continu, une fidélité accru de la part des visiteurs, une plus grande répartition géographique etc. La question qui se pose cependant est « quelles statistiques utiliser ? ». Si l’on dispose à la fois des statistiques serveurs et d’un suivi statistique assuré par exemple par Google Analytics, on constate en effet des variations pour le moins énormes. De manière générale, aucun outil ne donne exactement les mêmes résultats.

On ne compare pas l’incomparable

Un outil de statistiques serveurs (tels que Webalizer, AWstats...) analyse un fichier texte (le log) où est enregistré l’historique de tout les échanges entre le serveur et les postes clients, qu’il s’agisse des requêtes d’affichages de pages, les erreurs renvoyées...

Un outil de type marqueur (tels que Google Analytics, Xiti et le plus récent mais Open Source, Piwik) va analyser un élément (le marqueur aussi appelé tag) qui est placé dans le code source de chacune des pages à mesurer.

Ces deux types d’outils n’utilisent donc pas la même technologie et il est donc inutile de comparer les résultats (et encore moins de faire des moyennes entre les deux).

Comment expliquer ces écarts ?

Puisqu’ils n’utilisent pas la même technologie, ils ne comptent pas les mêmes choses. Sans être forcément exhaustif voici quelques exemples :
- les robots des moteurs de recherche parcourent sans arrêt le web pour indexer son contenu. Il y a énormément de moteurs de recherche différents (j’ai lu "76000 moteurs et annuaires" chez un référenceur). Les visites effectuées par les moteurs sont en partie exclues par les statistiques serveurs, mais en partie seulement car certains outils sont ancients et ne sont plus mis à jour (cas de Webalizer) et des moteurs apparaissent régulièrement. Ces visites sont par contre totalement exclues des outils à base de marqueurs.
- de la même manière, certaines techniques comme les pop-ups, ou les iframes sont exclus des tags et non des logs. Un exemple : une bannière de publicité insérées dans un iframe et se rafraichissant toutes les 30 secondes est comptée comme une nouvelle page... toutes les 30 secondes de visites de la part de l’utilisateur.
- les outils de logs appellent pages vues les pages HTML mais aussi les pdf, les fichiers textes... ce qui n’est pas le cas des tags qui ne peuvent être que dans du code HTML.
- si une image ou une vidéo est affichée sur un site A mais qu’elle est physiquement issue d’un site B (hotlinking), le site B se voit crédité d’autant de visites qu’en reçoit le site A sur cette page.
- sur un outil de logs, un groupe de personne se connectant avec une même adresse IP est considérée comme un visiteur unique. Avec les tags, l’utilisation de cookies installés sur chaque machine permet à chaque poste d’être un visiteur distinct.
- les outils par tags nécessitent la lecture de Javascript. Certains utilisateurs (rares il est vrai) n’autorisent pas le Javascript sur leur navigateur. Même si c’est encore minime, le fait que les navigateurs de téléphones portables le javascript n’est pas activé peut peser contre les outils par tags, qui éludent ces visites.
- il est possible sur les outils par tags d’exclure certaines machines ou certains domaines (les administrateurs du site par exemple).
- la provenance des visiteurs est souvent calculée de manière différente (par consultation de listes, par l’URL...)
- enfin, même pour les outils par tags, les méthodes de calcul ne sont pas exactement les mêmes.

Et donc ?

Bien qu’il y ait des défenseurs des deux types d’outils, une chose est sûre : ils ne mesurent pas la même chose et il est assez vain de chercher à savoir quel est la "vraie" mesure.

L’idéal est de disposer des deux outils pour répondre à des objectifs différents :
- les outils serveurs proposent des données techniques, permettent de suivre la bande passante, de traquer les erreurs...
- les outils par tags proposent des données de mesure d’audience. Outre les informations sur les visites, ils offrent en effet des données sur l’environnement matériel et logiciel de l’utilisateur, ils permettent des calculs et des rapports...

En guise de conclusion, et même si cela doit flétrir un peu l’égo du webmaster, un outil de statistiques doit permettre de dégager des tendances plutôt que des valeurs absolues. Ce sont ces tendances qui permettent de mettre en valeur le dynamisme du site. De plus il doit permettre d’affiner l’analyse sur les types de visiteurs désirés. Un site ne doit pas faire le plus de visites possibles de manière abstraite, il doit touché précisément le public pour lequel il a été conçu.

Autrement dit, et à mon humble avis, il vaut mieux se baser sur des outils de suivi de communication (les outils par marqueurs) que des outils de suivi technique (les outils serveurs).

Naviguer

[Archive AK-Dev] Lancement du nouveau site A Semana [Archive AK-Dev] Longue traîne et référencement

Partager