Statistiques de Juin 2019
Quelques chiffres sur nos débuts
Bonjour,
Conformément à nos mentions légales, nous ne stockons pas les données de nos visiteurs pendant plus de 6 mois et nous nous autorisons à les consulter uniquement à des fins statistiques ou de maintenance technique.
Le site ayant été mis en ligne vers fin janvier (deux mois avant son ouverture officielle), nous estimons qu’il s’agit donc du moment idéal pour générer quelques statistiques sur notre plateforme.
Nous utilisons le logiciel libre GoAccess pour analyser les journaux hors-ligne après les avoir téléchargés depuis le serveur.
🔗Site web
Nous commencerons par les statistiques sur notre site principal (42l.fr
) ; nos journaux sont séparés par services.
Depuis la mise en ligne du site le 28 janvier 2019 jusqu’au 12 juin 2019, nous avons reçu 123 309 requêtes envoyés par 14 597 visiteurs uniques.
Cela représente 3.44 Go de bande passante et 21.78 Mo de logs.
Voici un graphique représentant le nombre de visites (bleu) avec le nombre de visiteurs uniques (rouge). Notez que les deux courbes ne sont pas à la même échelle.
🔗Nombre de visiteurs
Du 28 janvier au 6 mars, le site étant en construction, l’activité est principalement due à des robots.
Voilà à quoi correspondent chacun des pics d’activité sur ce graphique :
- 7 mars : Publication de l’annonce de l’ouverture de notre site web sur Mastodon !
- 10 mai : Ouverture des adhésions et du service mail
- 11 mai : Mise en place du proxy DoH
- 16 mai : Mise en place du raccourcisseur de liens
- 23 mai : Article sur la mise en place des deux services ci-dessus
- 25 mai : On tient un premier stand à l’école 42 !
- 8 juin : Mise en place du service Schémas
Il est très encourageant de remarquer une augmentation progressive de la courbe rouge (visiteurs uniques) sur le long terme.
🔗Navigateurs utilisés
Voici cette fois un graphique en barres présentant les navigateurs utilisés pour parcourir notre site web :
Ces données sont intriguantes : les utilisateurs de Chrome (versions 58, 38 et 47) sont les plus nombreux, mais ceux de Firefox (versions 66.0, 45.0 et 68.0) visitent beaucoup plus de pages (12 % de plus).
Cela voudrait dire que les utilisateurs de Firefox sont plus intéressés par le contenu sur notre site web que ceux de Chrome ?
🔗Systèmes d’exploitation utilisés
Le système d’exploitation le plus utilisé reste Windows (versions 7, 10 et… XP ?!!?!) suivi par GNU/Linux.
Nous avons quand même un public particulièrement Linuxien, il semblerait… :)
🔗Codes HTTP
Nous renvoyons principalement (51 % des visites) des redirections (301), notamment pour rediriger les utilisateurs de 42l.fr
à 42l.fr/Accueil
, par exemple.
À part ça, 6 % des visites aboutissent sur un code 4xx (erreur client), dont une majorité (3 %) de codes 400, indiquant que le client a mal formé sa requête. Il s’agit de requêtes bizarrement formées par des bots qui cherchent des vulnérabilités sur notre infrastructure.
Enfin, sur ces 6 mois, nous relèverons 0.43 % de codes 5xx (erreur serveur), dont une majorité (0.36%) de codes 503 dûes à un trop grand nombre de requêtes envoyées par un seul client : il s’agit d’une mesure de protection.
Donc on peut dire que ça tourne bien pour le moment :)
🔗Service DoH
Enfin, il nous semblait pertinent de publier des statistiques sur l’un de nos services libres les mieux accueillis : notre proxy DNS-over-HTTPS, que nous appelons “Service DoH”.
Ce service permet de transmettre toutes les requêtes DNS de nos utilisateurs vers les résolveurs DNS de FDN, un fournisseur d’accès à Internet associatif neutre.
Donc, pour chaque requête DNS de chaque utilisateur, nous recevons une requête HTTP… Et avec ces fichus sysadmins qui se disent que c’est une bonne idée de définir le TTL de leur enregistrement DNS à 0, les requêtes ne sont pas cachées dans le navigateur de nos utilisateurs… Ce qui génère beaucoup de trafic inutile.
Nous n’enregistrons pas le contenu des requêtes, mais les métadonnées de ces requêtes (principalement le User-Agent) peuvent révéler quelques informations.
En retirant les crawlers, instances Mastodon et autres bots de nos logs, nous avons un total de 1 060 955 requêtes du 11 mai 2019 au 12 juin 2019 par seulement 530 visiteurs uniques, ce qui a généré 169.37 Mo de logs et seulement 130.16 Mo de bande passante (le contenu des requêtes est toujours très léger).
Parmi ces 530 visiteurs uniques, nous avons environ 20 utilisateurs constants pour le moment.
Il est intéressant de remarquer que la quasi-totalité de ces 530 utilisateurs utilisent Firefox. C’est normal : Chrome ne propose pas la fonctionnalité DoH ;)
Enfin, nous répondons un code d’erreur 503 pour 0.17 % des requêtes que nous recevons, essentiellement lorsqu’un visiteur envoie beaucoup trop de requêtes à la seconde, ce qui arrive assez rarement.
Pour respecter la vie privée de nos utilisateurs, nous ne publierons pas plus de statistiques sur ce service.
🔗Remarques
Il est facile de faire fausse route en étudiant les journaux : un serveur web est sollicité en permanence par de nombreux bots à partir du moment où il est connecté à Internet.
Les instances Mastodon ne facilitent vraiment pas l’analyse : lorsqu’un toot est posté avec une adresse vers notre site web, des centaines d’instances nous envoient une requête chacune. C’est un peu comme une attaque par déni de service distribuée… Donc ça fausse nos statistiques et il faut le prendre en compte lors de notre évaluation.
La publication régulière de statistiques s’ancre dans une démarche de transparence et fait aussi partie des critères demandés dans la charte CHATONS.
~ N&B