Statistiques de versions de PHP - janvier 2012
24 janvier 2012 —Il y a quelques mois, j’avais publié un article présentant des statistiques de déploiement des différentes versions de PHP : Statistiques de versions de PHP - septembre 2011.
Aujourd’hui, alors qu’environ quatre mois se sont écoulés et que la sortie de PHP 5.4 est imminente (les données présentées dans cet articles ont été collectées entre vendredi 20 et dimanche 22 janvier 2011 – après la sortie de la Release Candidate 6, qui est censée être la dernière pour PHP 5.4), voici une mise à jour de ces statistiques.
Sommaire :
- Quelques mots sur la méthode
- Quelques chiffres
- Réponses PHP
- Serveurs Web
- Versions majeures de PHP
- Versions mineures de PHP
- Versions releases de PHP 5.x
- Evolution
## Quelques mots sur la méthode ## {#methode}
Pour faire simple, j’ai récupéré une liste de plus de 7.7 millions de noms de domaines, issus principalement :
- Du top 1 million d’Alexa (chargé plusieurs fois à quelques semaines d’écart, ce qui donne plus de 1 million de noms de domaines),
- Du top 1 million de Quantcast,
- Des liens externes de wikipedia de plusieurs langues (environ 3 millions de noms de domaines),
- De l’export mis à disposition par l’Export Open Directory (environ 2 millions de noms de domaines – dont beaucoup de vieux sites, pour autant que je puisse en juger),
- Et de quelques résultats de recherche google (quelques milliers de noms de domaines).
Ensuite, pour chacun de ces noms de domaines, j’ai effectué une requête HTTP HEAD
sur domaine.tld
, en me rabattant sur www.domaine.tld
si la première requête échouait.
Après cela, je me suis généralement1 basé sur l’en-tête HTTP X-Powered-By
renvoyée par le serveur, pour en extraire le nom de logiciel ayant servir à générer la page, ainsi que sa version.
Et dans le cas où cette en-tête n’existe pas, ou ne contient pas d’information exploitable, je me suis rabattu sur l’en-tête Server
.
Pour rappel, et en ne prenant que quelques exemples relativement typiques, les en-têtes HTTP renvoyées par le serveur, dans le cas de pages générées par PHP et sur un serveur exposant la version de PHP utilisée, ressemblent souvent à quelque chose de ce type (pour www.php.net) :
Server: Apache/1.3.41 (Unix) PHP/5.2.17
X-Powered-By: PHP/5.2.17
ou (pour www.mozilla.org) :
Server: Apache
X-Powered-By: PHP/5.2.9
A partir de là, extraire le numéro de la version de PHP utilisée est une opération relativement aisée…
## Quelques chiffres## {#quelques-chiffres}
Réponses PHP
Sur les 7.4 millions de requêtes HTTP effectuées sur les noms de domaines que j’ai testé, environ 26% des réponses ont été identifiées comme générées par du PHP.
Plus précisément, j’ai identifié 1,947,849 réponses comme correspondant à du PHP.
Avec ce nombre relativement conséquent de réponses, les statistiques présentées plus bas devraient avoir des chances d’être à peu près correctes, ou, tout au moins, de donner des résultats et chiffres relativement proches de la réalité des versions de PHP installées…
### Serveurs Web ### {#serveurs-web}
Cela dit, avant d’entrer dans le détail des versions de PHP, et même si ce n’est pas vraiment le but premier de cet article ou de la collecte de données effectuée, voici la liste des Serveurs Web les plus fréquemment identifiés lors de ma collecte de données :
- Apache : 4,491,135 – 67.80%
- IIS : 1,233,729 – 18.63%
- nginx : 366,639 – 5.54%
- Autres : 261,484 – 3.95%
- GSE : 155,842 – 2.35%
- YTS : 47,748 – 0.72%
- LiteSpeed : 39,865 – 0.60%
- lighttpd : 27,163 – 0.41%
Ou, sous forme d’un graphe :
On notera :
- Apache, toutes versions confondues, est toujours premier, loin devant les autres,
- nginx est dans le top 3, pour les données collectées ici – depuis le début de l’année, il est annoncé comme ayant dépassé IIS et atteint la seconde place pour les sites « actifs », notion qui ne se retrouve pas dans les données utilisées pour rédiger cet article.
## Versions majeures de PHP ## {#versions-majeures}
Commençons par les versions majeures de PHP, en prenant en compte les résultats qui ont été identifiés comme correspondant à une version supérieure ou égale à 3, et inférieure ou égale à 62.
Mes tests ont remonté le nombre suivant de domaines sur chaque version majeure de PHP :
- PHP 3 : 851 – 0.04%
- PHP 4 : 274,442 – 14.09%
- PHP 5 : 1,672,456 – 85.86%
- PHP 6 : 38 – 0.00%
Sous forme d’un graphe, qui peut être plus parlant pour certains et permet de voir en un clin d’oeil quelle est la version majeure de PHP la plus répandue, cela donne :
On notera :
- Que, fort heureusement, PHP 5 est la version majeure la plus répandue,
- Mais que, seconde moitié 2011, on a encore quelques centaines de sites, sur 7.4 millions, qui tournent encore sur du PHP 3,
- Et aussi que PHP 4 est encore trop répandue, alors que cela fait des années que cette version n’est plus du tout maintenue (PHP 4.4.9, publiée en Août 2008, était annoncée comme étant la dernière version de PHP 4.x),
- Et enfin que, plus d’un an après la mise à mort de la branche PHP 6 (qui, pour rappel, n’a jamais vu une version ne serait-ce qu’alpha être publiée), on rencontre (encore) des sites qui utilisent PHP 6 en production ??? Très peu, certes, mais suffisamment pour attirer l’attention : cela signifie que, un jour, quelqu’un a installé sur un serveur « public » une version de développement de PHP, et n’a ensuite pas pris la peine de le mettre à jour…
## Versions mineures de PHP ## {#versions-mineures}
Si on passe aux versions mineures de PHP, toujours pour PHP >= 3.x
et PHP <= 6.x
, et en ne conservant que les versions qui sont remontées 10 fois ou plus, on obtient les données suivantes :
- PHP 3.0 : 849 – 0.04%
- PHP 4.0 : 1,945 – 0.10%
- PHP 4.1 : 4,638 – 0.24%
- PHP 4.2 : 4,262 – 0.22%
- PHP 4.3 : 62,552 – 3.21%
- PHP 4.4 : 201,042 – 10.32%
- PHP 5.0 : 8,212 – 0.42%
- PHP 5.1 : 95,439 – 4.90%
- PHP 5.2 : 1,214,416 – 62.35%
- PHP 5.3 : 354,182 – 18.18%
- PHP 5.4 : 198 – 0.01%
- PHP 6.0 : 38 – 0.00%
Et sous forme graphique :
Pour résumer :
- PHP 5.2, qui a atteint sa fin de vie en décembre 2010, il y a déjà plus d’un an, est toujours, et de loin, la version de PHP qui semble aujourd’hui la plus utilisée / répandue,
- PHP 5.3, stable depuis juin 2009, soit plus de deux ans et demi, n’arrive qu’en seconde place – et loin derrière PHP 5.2,
- Et PHP 5.1 et 4.3/4.4 sont relativement proches l’un de l’autre.
- Enfin, PHP 5.4, qui n’est pas encore sortie en version stable (les données utilisées utilisées ici ont été collectées après la sortie de la RC6, et avant la sortie de la première version stable), est déjà utilisée sur un nombre non-négligeale de serveurs publics ; et on trouve un peu de tout :
beta1
,RC2
,RC3
,RC4
,RC5
,RC6
, … Donc il ne semble pas s’agir d’une volonté de tester/valider la toute dernière version3.
## Versions releases de PHP ## {#versions-releases}
Et enfin, si on descend au niveau des versions release de PHP 5.x
4, en ne conservant que les versions qui remontées 100 fois ou plus, on obtient les données suivantes :
- Pour PHP 5.0 :
- 5.0.1 : 143 – 0.01%
- 5.0.2 : 305 – 0.02%
- 5.0.3 : 851 – 0.05%
- 5.0.4 : 5,723 – 0.34%
- 5.0.5 : 1,135 – 0.07%
- Pour PHP 5.1 :
- 5.1.1 : 415 – 0.02%
- 5.1.2 : 7,163 – 0.43%
- 5.1.3 : 1,540 – 0.09%
- 5.1.4 : 2,588 – 0.15%
- 5.1.5 : 289 – 0.02%
- 5.1.6 : 83,424 – 4.99%
- Pour PHP 5.2 :
- 5.2.0 : 27,968 – 1.67%
- 5.2.1 : 5,823 – 0.35%
- 5.2.2 : 2,026 – 0.12%
- 5.2.3 : 9,349 – 0.56%
- 5.2.4 : 45,958 – 2.75%
- 5.2.5 : 34,122 – 2.04%
- 5.2.6 : 192,326 – 11.50%
- 5.2.7 : 159 – 0.01%
- 5.2.8 : 22,939 – 1.37%
- 5.2.9 : 84,735 – 5.07%
- 5.2.10 : 43,988 – 2.63%
- 5.2.11 : 32,939 – 1.97%
- 5.2.12 : 42,008 – 2.51%
- 5.2.13 : 64,110 – 3.83%
- 5.2.14 : 64,124 – 3.83%
- 5.2.15 : 5,507 – 0.33%
- 5.2.16 : 28,964 – 1.73%
- 5.2.17 : 507,259 – 30.33%
- Pour PHP 5.3 :
- 5.3.0 : 3,076 – 0.18%
- 5.3.1 : 4,575 – 0.27%
- 5.3.2 : 47,836 – 2.86%
- 5.3.3 : 79,910 – 4.78%
- 5.3.4 : 6,723 – 0.40%
- 5.3.5 : 37,700 – 2.25%
- 5.3.6 : 60,296 – 3.61%
- 5.3.7 : 861 – 0.05%
- 5.3.8 : 90,884 – 5.43%
- 5.3.9 : 22,282 – 1.33%
- Pour PHP 5.4 :
- 5.4.0 : 197 – 0.01%
Et sous forme graphique :
Pour résumer :
- Une quantité non-négligeable de sites sous PHP 5.1.6 (qui a été publiée en Août 2006) ; la version fournie par défaut sous certaines distributions, il me semble, genre Redhat Enterprise.
- Beaucoup de PHP 5.2.6 (publiée en Mai 2008) ; la version fournie par défaut sous Debian Lenny, par exemple.
- La version de PHP la plus répandue est PHP 5.2.17 (publiée en Janvier 2011) ; ça reste du 5.2, qui a atteint sa fin de vie, mais positivons, en se disant que c’est la dernière version, la plus à jour…
- Et enfin, plusieurs sous versions de PHP 5.3.x, sans qu’aucune ne s’impose réellement ; notons que la version 5.3.7, avec son bug de sécurité, et qui n’a été disponible que quelques jours, n’est heureusement pas la plus répandue5.
## Evolution ## {#evolution}
Je ne ferai pas une longue analyse sur le pourquoi du comment des chiffres que j’ai présenté ici : libre à vous de commenter sur le trop grand usage de versions complètement obsolètes, et le manque de mise à jour que l’on peut, malheureusement, trop souvent constater…
Cela dit, puisque ce n’est pas la première fois que j’effectue ce processus de collecte de statistiques à propos des versions de PHP utilisées, je me suis dit qu’il pouvait être intéressant de tracer un graphe représentant l’évolution de ces utilisations.
Le graphe reproduit ci-dessous présente donc l’évolution de l’utilisation des versions mineures de PHP, depuis septembre 20116, date à laquelle j’ai effectué ce type d’analyse pour la première fois (avec un point en décembre 2011, où j’avais effectué une collecte partielle de données, pour tester les améliorations que j’étais en train d’effectuer sur mes scripts) :
J’ai essayé de mettre en évidence les versions les plus à même de nous concerner en ce moment (à savoir, PHP 5.2, 5.3, et 5.4), ainsi que, dans une moindre mesure les deux autres versions les plus utilisées (autrement dit, PHP 4.4 et 5.1).
**Notes importantes : la liste des sites analysés a énormément évolué entre septembre 2011 et janvier 2012 !**
- Entre septembre et décembre 2011, plus de 3 million de noms de domaines ont été ajoutés à ma liste ; dont une portion non-négligeable correspondant à de vieux sites (liste provenant principalement de l’export ODP). Ceci explique l’augmentation du pourcentage de sites utilisant PHP 4 et la diminution du pourcentage de sites utilisant PHP 5.2, entre septembre et décembre 2011 : selon toute logique, plus d’anciens sites signifie plus d’anciens serveurs, pour certains non mis à jour.
- Les noms de domaines ajoutés ensuite, entre décembre 2011 et janvier 2012, correspondent principalement à des sites actifs, selon toute logique plus récents et/ou plus récemment mis à jour, et on retrouve la progression à laquelle on s’attendrait : augmentation du nombre de serveurs en PHP 5.3, au détriment de PHP 5.2 et 4.x.
Autrement dit : ce graphique n’est pas à considérer comme réfletant la réalité des évolutions des versions de PHP entre septembre et décembre 2011 !
Il deviendra probablement plus utile si je continue à publier ce type d’analyse dans le futur – c’est pourquoi je l’affiche tout de même ici.
-
Pour certains types de serveurs ou de logiciels, j’ai mis en place un bout de code qui va chercher les informations de version dans d’autres en-têtes que
X-Powered-By
. Par exemple, pour les sites développés en ASP.NET, les informations de version figurent généralement dans une en-tête nomméeX-AspNet-Version
. ↩︎ -
Pour ne pas prendre en compte les quelques résultats abherrant qu’on aurait pu relever – du genre
overworld.su
qui renvoiX-Powered-By: PHP/10.0.0
??? ↩︎ -
Et ce type de validation, de toute manière, n’est normalement pas le genre de chose qui se fait sur un serveur de production, public… ↩︎
-
PHP 4 correspondant à des versions tellement dépassées que je préfére ne pas prendre la peine de rentrer au niveau des versions release. ↩︎
-
On pourrait souhaiter qu’une version connue pour un problème de sécurité comme ne soit celui qui avait fait tant de bruit au moment de PHP 5.3.7 ne soit absolument pas utilisée… Mais, malheureusement… ↩︎
-
Les chiffres présentés sur le graphique d’évolution sont en pourcentages, afin d’être indépendants du nombre d’hôtes interrogés, qui varie à chaque série de collectes. ↩︎