Quelques statistiques du blog
Suite au commentaire de Xate dans un récent billet, quelques statistiques sur les billets (blogmas ou pas) sur la première quinzaine de décembre. Pour cela, je me suis servi de mes one-liners en awk décrits ici et là.
Les billets les plus vus
Commençons par les billets les plus visités :
root@vhost2:~/tmp# grep "GET /post/" ./access.log | awk '{frequencies[$7]++;} END {for (field in frequencies) printf "%s\\t%d" , field , frequencies[field];}' | sort -nr -k 2,2 | head -20
/post/python-3-outils-anaylser-code 1527
/post/make-automatiser-quelques-taches-avec-un-makefile 260
/post/livre-apprendre-a-programmer-avec-python 243
/post/xz-pour-une-meilleure-compression-de-ses-fichiers 224
/post/centos-7-desactiver-firewalld-reactiver-iptables 209
/post/2016/12/29/Vous-naviguez-toujours-sur-un-site-HTTPS 192
/post/livre-introduction-au-langage-c 168
/post/logrotate-exemple-vite-fait 165
/post/paris-open-source-summit-2017-jour-2 161
/post/en-retard 152
/post/paris-open-source-summit-2017 143
/post/centos-7-desactiver-firewalld-reactiver-iptables/ 124
/post/Trouver-des-fichiers-doublons-avec-fdupes 123
/post/raspberry-pi-attention-alimentation 112
/post/2009/11/09/Utilisation-transparente-d-une-passerelle-SSH 83
/post/2011/10/03/Installation-de-phpMyAdmin-sur-CentOS-6 76
/post/pbulk-aller-plus-loin-sur-les-parametres 72
/post/systemd-reconfigurer-unite-service 71
/post/2017/02/13/clamav-installation-et-scan-antivirus-sur-macos 69
/post/2016/12/29/Vous-naviguez-toujours-sur-un-site-HTTPS&fromurl=redirect.asp 67
Le billet le plus populaire est donc celui sur les outils d'analyse de code Python, et de loin ! Je note que j'ai mal écrit "analyser" dans l'URL, il faudra vraiment que je fasse attention à cela à l'avenir ! Il m'arriver d'ailleurs régulièrement de dépublier puis republier un billet en m'apercevant que l'URL ne me convient pas. J'en profite pour remercier Dashie pour notre conversation sur Mastodon, sans ça je n'aurais pas eu l'idée d'écrire ce billet.
Les tag les plus vus
Quels tags sont les plus populaires ?
root@vhost2:~/tmp# grep "GET /tag/" ./access.log | awk '{frequencies[$7]++;} END {for (field in frequencies) printf "%s\\t%d" , field , frequencies[field];}' | sort -nr -k 2,2 | head -20
/tag/NetBSD 73
/tag/Apache 55
/tag/CentOS 50
/tag/PHP 47
/tag/Linux/page/3 46
/tag/Linux 41
/tag/Perl 40
/tag/ssl 38
/tag/blogmas 34
/tag/Awstats 32
/tag/Mac%20OS%20X 31
/tag/RHEL 31
/tag/mp3 29
/tag/pkgsrc 29
/tag/RPM 29
/tag/macOS 28
/tag/Xen 27
/tag/ssh 27
/tag/tls 27
/tag/https 25
Visiblement, je commence à devenir populaire pour NetBSD, Apache, CentOS et PHP ! Dommage que pkgsrc soit un peu bas à mon goût. Le tag blogmas n'est pas non plus super populaire.
Les referers
D'où viennent les visites ?
root@vhost2:~/tmp# grep "GET /post/" ./access.log | awk '{frequencies[$11]++;} END {for (field in frequencies) printf "%s\\t%d" , field , frequencies[field];}' | sort -nr -k 2,2 | head -20
"-" 5077
"http://www.google.co.uk/url?sa=t&source=web&cd=1" 468
"https://blog.anotherhomepage.org/" 203
"https://www.google.fr/" 196
"https://www.journalduhacker.net/" 193
"http://blog.anotherhomepage.org/" 124
"https://blog.anotherhomepage.org/post/centos-7-desactiver-firewalld-reactiver-iptables/" 66
"http://blog.anotherhomepage.org/post/centos-7-desactiver-firewalld-reactiver-iptables/" 58
"https://blog.anotherhomepage.org/post/centos-7-desactiver-firewalld-reactiver-iptables" 52
"https://blog.anotherhomepage.org/post/python-3-outils-anaylser-code" 45
"https://www.google.com/" 31
"https://blog.anotherhomepage.org/category/Humour" 29
"" 28
"https://socialmediascanner.eset.com" 24
"https://blog.anotherhomepage.org/page/2" 22
"https://blog.anotherhomepage.org/post/2009/11/09/Utilisation-transparente-d-une-passerelle-SSH" 19
"https://www.google.fr" 19
"https://www.journalduhacker.net/s/asxn1a/python_3_outils_pour_analyser_son_code" 16
"https://blog.anotherhomepage.org" 15
"https://blog.anotherhomepage.org/feed/tag/Linux/atom" 15
Pas grand-chose à dire de ce côté, si ce n'est que beaucoup n'ont pas de referer, et en creusant un peu, le lien vers Google UK est utilisé par la même IP, et toutes les visites vont sur le billet sur les outils d'analyse de code Python. J'ai par contre été cité par le Journal du Hacker, ce qui fait bien plaisir !
Des erreurs ?
Quelques trucs étranges :
root@vhost2:~/tmp# awk '{frequencies[$9]++;} END {for (field in frequencies) printf "%s\\t%d" , field , frequencies[field];}' < ./access.log | sort -nr -k 2,2 | head -10
200 48038
301 17578
304 10958
404 834
"-" 716
503 464
302 229
400 143
206 22
403 17
Voyons voir les erreurs 404 :
root@vhost2:~/tmp# grep -w "404" access.log | awk '{frequencies[$7]++;} END {for (field in frequencies) printf "%s\\t%d" , field , frequencies[field];}' | sort -nr -k 2,2 | head -10
/post/centos-7-desactiver-firewalld-reactiver-iptables/ 66
/pages/Welcomerobots.txt 64
/wp-login.php 45
/ads.txt 20
/tag/Apachepage/2 12
/pages/Welcomelicense.txt 12
/a2billing/common/javascript/misc.js 11
/post/2017/01/21/macOS-installer-pkgsrc-pour-beneficier-de-plus-de-logiciels 11
/apple-app-site-association 11
/post/ 11
Résultat : sans doute des tentatives de bruteforce du blog, pensant qu'il s'agit d'un Wordpress ou d'autre chose. Par contre, il faudra que je regarde plus attentivement les billets à propos de firewalld et de pkgsrc sur macOS.
Vous avez aimé cet article ? Alors partagez-le sur les réseaux sociaux !
Crédit photo : Bernard Spragg. NZ - Passing Time 2010 ).
Commentaires
Le 19/12/2017 19:27 par utux
Essaie goaccess pour tes stats :) (il parse les logs exactement comme tu as fait)
Le 19/12/2017 21:30 par Nils
Il est dans ma TODO. A la base, et comme certains billets en attestent, j'utilisais surtout Awstats, mais j'ai eu la flemme de le configurer lors de la dernière réinstallation du serveur web qui héberge ce blog.