Lexique

Accès

Chaque accès correspond à une ligne du fichier de logs. En anglais, on parlera de hit.

Le nombre total d'accès est toujours, évidemment, le chiffre le plus important dans l'analyse statistique d'une période, mais il a en soit très peu de signification pour l'analyse du trafic d'un site.

Il est en effet tributaire de la façon dont les pages sont aménagées : il suffit d'ajouter deux images à une page (un élément) pour tripler le nombre d'accès.

On s'en servira donc pour analyser l'évolution d'un site, tant en termes de trafic qu'en termes de modifications au site lui-même.

 

Araignée ou crawler

Programme qui effectue des recherches automatisées sur l'Internet. Les moteurs de recherche, par exemple, utilisent des crawlers pour « lire » les sites qu'ils indexent. Certains programmes permettent d'effectuer des requêtes sur le serveur et d'aviser les responsables en cas de panne.

Il s'agit donc de visites effectuées par des machines.

 

Bande passante

Mesure (en octets de données transférées) du trafic sur un site.

L'utilisation de la bande passante tient compte du poids de chacun des fichiers (pages, documents, images, etc.).

L'analyse permet de constater que les journées les plus achalandées en termes de visites ne sont pas nécessairement celles où la bande passante est la plus sollicitée.

 

Connecteurs

Les connecteurs sont des fournisseurs d'accès Internet. En anglais, on verra l'acronyme ISP pour Internet Service Provider. Au Québec, on reconnaîtra par exemple Bell Canada, Vidéotron, Telus, etc.

 

Durée moyenne

Ensemble des activités réalisées par un même visiteur ou, plus précisément, par une même adresse IP. Une interruption de 30 minutes met fin à une visite.

Certaines visites sont très courtes, de l'ordre de quelques secondes. Elles sont susceptibles d'avoir été réalisées par des araignées, des crawlers, soit des machines.

Quant aux très longues visites - on rencontre parfois des visites de plus de 4 heures ! - elles sont souvent le fait d'utilisateurs d'une même organisation. Puisque tous ces utilisateurs utilisent la même adresse IP, ils sont considérés comme une seule « visite ». Voir l'explication de « visiteur unique ».

 

Ergonomie

L'ergonomie web vise à la fois une meilleure efficacité et un plus grand confort d'utilisation. L’ergonomie Web est la recherche d'une meilleure adaptation entre les fonctionnalités d'un site Internet et ses utilisateurs. Par exemple, l'internaute est habitué à ce qu'un clic sur le logo ou la bannière d'un site lui fasse atteindre la page d'accueil du site; un site qui ne proposerait pas cette fonctionnalité perdrait en ergonomie). 

 

Fichiers

Les rapports distinguent les pages et les fichiers. On entend par fichier un document complet en lui-même, d'un format spécifique. Les formats sont les suivants : PDF, XLS, DOC, SWF. Une configuration des logiciels d'analyse est requise pour reconnaître les fichiers.

 

Hit

Un hit ou un accès est une action au serveur, tel que l'affichage d'une page ou d'une image, le téléchargement d'un fichier.

Chaque accès correspond à une ligne du fichier de logs.

Le nombre total d'accès est toujours, évidemment, le chiffre le plus important dans l'analyse statistique d'une période, mais il a en soit très peu de signification pour l'analyse du trafic d'un site.

Il est en effet tributaire de la façon dont les pages sont aménagées : il suffit d'ajouter deux images à une page (un élément) pour tripler le nombre d'accès.

On s'en servira donc pour analyser l'évolution d'un site, tant en termes de trafic qu'en termes de modifications au site lui-même.

 

Impression

Dans le langage de l'analyse statistique d'un site Internet, on lira souvent « impression » du nombre de pages. Ce terme est trompeur puisque la page n'est pas nécessairement « imprimée », mais plutôt affichée. Il s'agit d'accès aux pages uniquement (les accès aux graphiques, ou autres documents ne sont pas comptés). Dans ses rapports, Prospection parlera plutôt de « pages vues ».

Une configuration des logiciels d'analyse est requise pour que soit tenu en compte les pages selon l'extension de fichier. Tous les logiciels d'analyse n'incluent pas par défaut l'ensemble des extensions possibles.

 

IP

Adresse Internet Protocol qui identifie une machine connectée à l'Internet. L'adresse IP est le seul élément des fichiers de logs qui permet « d'identifier » un visiteur. Dans les faits, l'adresse IP identifie une organisation ou un connecteur.

 

Lien brisé

Référence à un élément (une page HTML ou ASP, une image, un document PDF, etc.) qui n'a pu être trouvé à l'adresse inscrite dans le code. Un lien est brisé si l'élément a été déplacé, renommé ou supprimé. Un lien peut également être brisé si, au moment d'y accéder, le serveur n'était pas disponible.

 

Log

Fichier généré par un serveur et qui contient l'information sur l'activité d'un site. Une configuration est requise pour obtenir toutes les informations nécessaires à une analyse exhaustive d'un site (dans le paramétrage par défaut des serveurs, toutes les informations ne sont pas enregistrées).

 

Pages

Les rapports d'analyse statistique font une distinction entre « pages » et « fichiers ». Les pages identifient les éléments avec les extensions de fichiers HTML, HTM, ASP, JSP, PHP. Notez qu'une configuration des logiciels d'analyse est requise pour tenir en compte tous les formats.

 

Prospecteur

Prospecteur est un gestionnaire de contenu communément appelé CMS qui sert à faire les modifications d'un site sans avoir recours à des spécialistes. Le Prospecteur développé par Prospection soutient plusieurs langues, permet la correction des textes et l'insertion de nouvelles images. Le Prospecteur rend le client autonome pour gérer son site rapidement de manière optimale. 

 

Provenance des visiteurs

L'adresse IP est utilisée pour déterminer la provenance des visiteurs. En interrogeant différentes bases de données, il est ainsi possible de connaître le nom de l'organisme ainsi que l'adresse.

Le niveau de précision dépend évidemment de l'information contenue dans les bases de données qui ne sont pas systématiquement mises à jour. Ainsi, les fusions ou acquisitions d'entreprises ne sont pas toujours traduites dans ces bases de données.

Il faut aussi noter que la définition des territoires ne correspond pas toujours au découpage géo-politique. Ainsi, Hong-Kong est considéré comme un territoire distinct de la Chine, tout comme Taïwan. On retrouve en fait beaucoup plus de territoires différents que de nombre de pays. Dans nos rapports, on parlera tout de même de « pays ».

Certaines régions sont sur représentées. C'est le cas, par exemple pour la Californie, Washington et la Virginie, aux États-Unis. La Californie et Washington sont les états hôtes de nombreux moteurs de recherche. Chaque visite d'araignée, aussi courte soit-elle (de l'ordre de quelques secondes) est donc ainsi comptabilisée. Quant à la Virginie, c'est un pôle important du développement d'Internet et l'état hôte de très nombreux connecteurs intercontinentaux et même internationaux comme AmericaOnline.

 

Référents

Un référent est un site Internet qui contient un hyperlien menant vers une page de votre site.

 

Référents non identifiés

Les référents non identifiés - généralement la catégorie la plus importante - peuvent provenir de plusieurs sources :

1.  L'internaute accède à un site après l'avoir mis en signet (bookmarks)
2.  La page est utilisée comme page de démarrage du navigateur
3.  L'internaute saisit directement l'adresse URL (ou fait un copier / coller) de l'adresse
4.  L'internaute ouvre une nouvelle fenêtre à partir d'un hyperlien, en utilisant le bouton droit de la souris
5.  Les liens faits depuis des documents qui n'ont pas d'adresse URL : les courriers électroniques, certains fichiers PDF, Word, etc.

 

Référents sites jumeaux

Dans les rapports de Prospection, les référents de type « Sites jumeaux » sont des sites qui représentent des organismes ou des entreprises dont les activités sont similaires à celles du site analysé.

 

Le site lui-même

Il peut sembler étrange que le site lui-même apparaisse dans la liste des référents et ce phénomène est attribuable à au moins deux contraintes techniques. Dans un premier temps, les sites hébergés en équilibrage de charge (load balancing), produisent un plus grand nombre de référents de ce type : le passage d'un serveur à l'autre génére un référent par le site lui-même. L'autre élément technique tient du « IP Switching », une technique des connecteurs qui attribuent des adresses IP différentes à des utilisateurs, même au cours de la même visite. La poursuite d'une visite sur un même site, avec deux adresses IP différentes, génèrerait ainsi un référent qui est le site lui-même.

 

Tableau de bord

Résumé synoptique des principales données d’achalandage établi à partir des indicateurs de performance spécifique au site.

 

Tag

Il s’agit d’un code en javascript inséré à un endroit précis dans chacune des pages d’un site Internet. (C'est notamment la technique utilisée par Google Analytics.)
Les informations récoltées deviennent ainsi la propriété du serveur tiers qui pourra utiliser ces renseignements à sa guise par la suite.  

 

Taux de rebond

Le taux de rebond définit la visite d’une internaute composée d’une seule page. En anglais, on parle de Bounce Rate.

 

Visites

Ensemble d'activités (tous les accès) consécutives d'un utilisateur du site. Chaque utilisateur est identifié par son adresse IP ou sa carte de visite. Une visite se termine par défaut lorsque l'utilisateur est inactif pendant plus de 30 minutes. On parlera parfois de « session ».

 

Visiteurs uniques

Sur Internet, la notion de « visiteur unique » ne fait aucun sens.

Dans l'analyse de l'achalandage d'un site Internet, lorsqu'on parle de visiteurs, on parle en fait « d'adresse IP ». Ce que les logs présentent, c'est l'adresse 24.122.104.129. Une requête de type Whois permet de savoir qu'il s'agit d'une adresse appartenant à COGECO Cable Canada Inc., un connecteur (ou fournisseur d'accès à Internet). Cependant, aucune information ne nous permet de déterminer de façon plus précise le « visiteur ».

Dans le cas des fournisseurs d'accès, comme dans l'exemple précédent, les adresses IP sont attribuées selon leur disponibilité. Dès qu'une adresse IP se libère parce que le client se déconnecte, elle est attribuée à un autre client. Si ce deuxième client visite le même site au cours de la période d'analyse, il sera vu comme le même visiteur.

Dans une autre situation, l'adresse IP 142.179.230.109 appartient au ministère des Ressources naturelles et de la Faune et est utilisée par plus d'une personne. En fait, elle pourrait très bien être utilisée par un service complet. Si trois personnes du même service visitent le même site, même à des jours différents, elles seraient considérées comme un seul visiteur.

Il est donc faux de croire que les fichiers de logs permettent d'identifier des « visiteurs uniques » et c'est pourquoi c'est une notion que nous n'utilisons jamais.

 

Web 2.0

Le Web 2.0 désigne les interfaces permettant aux internautes d’interagir simplement à la fois avec le contenu des pages mais aussi entre eux, créant ainsi le Web social 2.

Cette expression lancée par Tim O'Reilly en 2004 s’est imposée à partir de 2007. Source Wikipedia

 

Pour en savoir plus :

En plus de proposer une définition (en anglais) pour chacun des termes, Smashing Magazine nous offre en plus des liens vers des ressources ou d'autres acticles sur le concept.