Ce mois-ci sur internals@php - Janvier 2014

10 février 2014php, internals@
 Cet article a été rédigé il y a plusieurs années et peut ne plus être tout à fait à jour…

This post is also available in english.

L’année 2014 a commencé par un mois de janvier bien rempli, avec 963 messages, soit le double du mois précédent !

Sous forme d’un graphique représentant le nombre de mails par mois sur les trois dernières années, on obtient (l’historique depuis 1998 est disponible ici) :

Nombres de mails sur internals@ ces trois dernières années


Le 15 janvier, Ferenc Kovacs a annoncé qu’il allait tagger PHP 5.6-alpha1 – cette version a été publiée quelques jours après, le 24 janvier.

La sortie de cette première version alpha signifie que (en théorie) plus aucune nouvelle RFC ne peut être proposée pour PHP 5.6. Julien Pauli a répondu en souligant qu’aucune RFC ne sera mergée (inclue à PHP 5.6) une fois la phase de versions beta commencée – la première version beta pouvant arriver aux environs de mi-mars.

Adam Harvey a quant à lui commencé à travailler sur la page de documentation Migrating from PHP 5.5.x to PHP 5.6.x.


Certaines fonctionnalités ont été marquées comme obsolètes lors de la sortie de PHP 5.5 : le modificateur /e pour preg_replace(), l’extension ext/mysql, … En suivant le cycle de releases, ces fonctionnalités obsolètes devraient être supprimées de PHP 5.6 (et/ou déplacées vers PECL lorsqu’il s’agit d’extensions comme ext/mysql).

Comme l’a rapidement fait remarquer Andrea Faulds, on trouve encore beaucoup de code utilisant les fonctions mysql_*(), et déplacer l’extension correspondante vers PECL risque de poser quelques problèmes – ceci dit, libre aux distributions de continuer à fournir cette extension. De plus, ce n’est pas parce que nombre de tutoriaux (et quelques logiciels répandus) continuent d’utiliser des fonctions déconseillées depuis des années qu’il faut arrêter de faire évoluer PHP.


Alors que plusieurs idées en cours de discussion apporteraient des modifications plus impactantes que celles vues sur PHP 5.3/4/5, Adam Harvey a demandé s’il ne serait pas temps de commencer à réfléchir à une prochaine version majeure de PHP – c’est une idée qui a déjà été évoquée quelque fois ces derniers mois, d’ailleurs.

Comme l’a fait remarquer Julien Pauli, au-delà des modifications cassant la compatibilité antérieure, une nouvelle version majeure serait aussi l’occasion de faire une passe de ménage – après tout, PHP 5.0 avait bien introduit une nouvelle version du Zend Engine. Ferenc Kovacs a alors noté, comme il l’avait déjà dit il y a quelques mois, qu’aucun processus n’a été jusqu’à présent défini quant à la sortie d’une nouvelle version majeure.

Pour faciliter le passage à cette prochaine version et éviter qu’il ne s’étale sur plus de 5 ans comme ce fût le cas pour PHP 5, une piste serait de profiter de l’existence du FIG pour synchroniser une montée de version au niveau des frameworks les plus utilisés.

Rasmus Lerdorf a rappelé que, selon lui, PHP devrait rester un langage pragmatique, tourné vers le web (les besoins correspondant ont évolué), faiblement typé, et qui prend en compte les besoins et capacités d’un large registre de développeurs. Le support d’Unicode serait indispensable, les performances ne sont pas à oublier, et PDO gagnerait à ce qu’on s’en occupe un peu plus. Tout ceci est moins sexy que de nouvelles fonctionnalités, mais il ne faut pas oublier que ces points répondent aussi à des besoins réels. Julien Pauli a répondu avec quelques idées qu’il avait, comme une VM threadée ou des améliorations et optimisations au niveau de celle-ci.

Andrea Faulds a continué avec un sujet à propos de la sensibilité à la casse en PHP : est-ce qu’une prochaine version majeure ne serait pas l’occasion d’uniformiser un peu, à ce niveau ?

En parallèle, Rasmus Lerdorf a répondu sur un fil de discussion à propos de ce que certains appellent inconsistance dans les noms de fonctions de PHP et les paramètres qu’elles attendent (et l’ordre de ceux-ci) : depuis toujours, PHP a été une sur-couche à des dizaines (des centaines, maintenant) de bibliothèques. Ces fonctions ne sont pas spécifiques à PHP : elles sont inscrites dans la mémoire d’un nombre de développeurs, pas parce que nous écrivons du PHP, mais parce que nous vivons toujours dans un monde écrit en C – et dès que nous nous aventurons hors de PHP et des langages de script, nous rejoignons celui-ci. Ceci dit, comme l’a répondu Larry Garfield, aujourd’hui, seul un petit nombre de développeurs PHP ont connaissance de C ou de POSIX… En fait, C ne doit être la seconde langue que d’un nombre très réduit de développeurs PHP. Suite à ces échanges, un tout début de RFC a été mis en place : RFC: Use alias to provide both legacy and consistent names.

De son côté, Pierre Joye a lancé un troisième sujet de conversation à propos de PHP 6, où il a noté qu’il est important de réfléchir aux impacts que diverses modifications pourraient avoir en termes d’adoption d’une future version du langage (l’idée évoquée plusieurs fois étant d’éviter de se trouver dans une situation équivalente à celle de Python 2 et Python 3).


Alors que HHVM fait de plus en plus souvent parler de lui, zhifeng hu a demandé s’il serait possible de l’introduire dans le code de PHP.

Pierre Joye n’a pas tardé à répondre que, bien qu’intéressante sur de nombreux points, cette idée ne lui semblait pas envisageable pour l’instant, notamment parce que HHVM est contrôlé par une unique entreprise, parce que signer un CLA est nécessaire pour y participer, ou parce qu’il est peu portable (requiert le compilateur GCC). De plus, comme remarqué par Andrea Faulds, HHVM ne correspond pas à une implémentation complète des fonctionnalités de PHP – surtout, comme l’a noté Sara Golemon, pour ce qui est des extensions intégrées ou fournies via PECL.

En somme, cette proposition serait peut-être en avance d’un an ou deux, en l’état actuel de PHP et de HHVM.


Sara Golemon a rédigé la RFC: __debugInfo(), qui vise à exposer à l’espace utilisateur des informations de debuggage déjà connues en interne – en ajoutant une nouvelle méthode magique __debugInfo(). Cette proposition permettrait de personnaliser les sorties de debug.

Parmi les retours, certains ont noté qu’un nom comme __dump() pourrait être plus parlant pour les développeurs PHP ne connaissant pas le fonctionnement interne du moteur, d’autres ont noté que cette fonctionnalité devrait aussi être intégrée à l’API de Reflection. Il a aussi été noté qu’avec une telle fonctionnalité, var_dump() pourrait ne plus toujours afficher la vérité.


Kevin Ingwersen a relancé un sujet à propos de la RFC: Named Parameters, rédigée en septembre 2013, mais qui n’avait plus fait l’objet de discussion depuis quelques temps.

Nombreux sont ceux qui aimeraient voir ce type de fonctionnalité arriver dans PHP – même si d’autres ont fait remarquer que cela demanderait d’écrire plus de code pour les appels de fonctions. En fait, les paramètres nommés aideraient surtout pour les appels de fonctions acceptant un nombre conséquent de paramètres.

Nikita Popov, auteur de la RFC en question, a dressé un rapide résumé de la situation : dans l’ensemble, les principales questions en suspend ont toutes une réponse, et l’implémentation de la fonctionnalité est prête. Par contre, il est nécessaire de passer sur l’ensemble des fonctions exposées par PHP pour s’assurer que leurs définitions de paramètres soient acceptables (qu’ils aient des noms cohérents, en particulier), et de vérifier que la lecture de paramètres fonctionne, partout, pour ces mêmes fonctions internes. Ces deux points demandent énormément de travail et il est peu probable que ce soit terminé d’ici le feature freeze de PHP 5.6.


Philip Sturgeon a rédigé la RFC: Array Of, dont l’idée est d’améliorer le type-hinting de PHP de manière à pouvoir indiquer qu’un tableau d’éléments d’un type donné est attendu. Par exemple :

function test(SplFileObject[] $files) {
  var_dump($files);
}

Les premiers retours ont semblé indiquer que l’idée en intéressait plus d’un – et le sujet, avec pas loin de 100 mails sur environ une semaine, a été un des plus discutés ce mois-ci sur internals@ ! Notons que cela n’a pas empêché quelques retours assez durs ou soulignant que ce type de fonctionnalité (contrairement à d’autres RFC passées ces derniers mois) peut déjà être implémentée en PHP ou ne colle pas forcément à une partie de la philosophie souple du langage. Une réponse à quelques uns de ces retours a été apportée ici.

Une question qui s’est rapidement posée est de savoir s’il était possible d’indiquer si des éléments du tableau pouvaient être NULL (ce qui pourrait mener à des erreurs lors de parcours), et avec quel type de syntaxe. Bien sûr, l’impact sur les performances est aussi à prendre en compte – mais le serait aussi si les vérifications de types étaient réalisées en espace utilisateur.

En fait, comme l’a souligné Julien Pauli un peu plus loin dans la discussion, cette RFC illustre le fait qu’il manque à PHP une notion de “tableau typé” – qui irait plus loin que la vérification de types lors du passage de paramètres. Au passage, même si cette RFC n’a rien à voir avec ces deux points, quelques uns ont reparlé de type-hinting sur types scalaires et de Generics.

En parallèle, Sara Golemon a posté un récapitulatif de ce que permet et accepte HHVM pour les tableaux typés et les Generics – à la fois en visant à arriver à une syntaxe commune et pour résumer les cas tordus identifiés de leur côté.

Suite à cela, Philip Sturgeon a demandé s’il y avait un intérêt pour les Generics – ce qui pourrait avoir une influence sur la syntaxe de Array Of.

Au passage, notons que ce fil de discussion a encore une fois illustré le fait que le type-hinting et ses éventuelles extensions est toujours un sujet chaud !


Yasuo Ohgaki a rédigé la RFC: Multibyte Char Handling, où il propose d’ajouter de nouvelles fonctions pour gérer des chaînes de caractères en encodages sur plusieurs octets.

Plusieurs approches seraient possible, en fait : ajouter de nouvelles fonctions, se baser sur la locale courante (ce qui semble être une mauvaise solution), ou même ajouter un paramètre supplémentaire encodage comme cela a par exemple été fait pour htmlspecialchars().

Comme l’a souligné Derick Rethans, au lieu d’ajouter encore et encore de nouvelles fonctions (que les développeurs PHP doivent ensuite choisir d’utiliser lorsque c’est nécessaire), une meilleure approche serait sans doute un réel support d’Unicode par PHP – comme visait à le faire PHP 6 il y a quelques années !

Et suite à cette discussion, la RFC: Alternative implementation of mbstring using ICU a aussi été mise à jour.


Anatol Belski a annoncé que les choses avaient suffisamment avancées sur la RFC: 64 bit platform improvements for string length and integer in zval pour que les discussions puissent commencer (il y a eu environ 200 mails échangés sur le sujet ce mois-ci, tout de même !).

Pour essayer de résumer les échanges en quelques mots : l’objectif ici est d’améliorer le support des plate-formes 64 bits par PHP (notamment sous Windows), sans que cela n’ait d’impact sur les plate-formes 32 bits.

Une conséquence non-négligeable est qu’il faudrait repasser sur toutes les extensions existantes pour modifier quelques appels de fonctions (comme zend_parse_parameters() et *printf()) et quelques utilisations de macros. Ceci demanderait quelques heures à quelques jours de travail pour chaque extension. Mais cela représente un risque réel, puisque toutes les extensions, y compris celles développées par des entreprises pour leur besoins internes1 et non rendues publiques, devront être modifiées – et que toutes ne le seront certainement pas au moment de la sortie de PHP 5.6. De ce fait, il pourrait s’agir d’une modification trop importante pour PHP 5.6.

Les votes ont été ouverts en fin de mois ; les résultats seront donc pour le mois prochain. Quelques premières explications sur des votes négatifs ont d’ailleurs insisté sur le trop grand impact de cette modification pour PHP 5.6, et le fait qu’elle trouverait mieux sa place vers une future version majeure.

En parallèle de cette discussion sur les améliorations 64 bits, Anatol Belski a créé la RFC: Removal of dead SAPIs. Comme l’a noté Julien Pauli, ces vieilles SAPI qui datent pour certaines des années 90 et ne sont plus utilisées/maintenues pourraient être supprimées.


Tout juste le premier jour du mois, Daniel Lowrey a annoncé la fin des votes sur la RFC: TLS Peer Verification. Avec 25 votes “pour” et aucun vote “contre”, voici une amélioration de sécurité qui arrivera avec PHP 5.6. Quelques jours après, il a continué sur le sujet, avec la RFC: Improved TLS Defaults qui vient en complément de la précédente.

Dans la foulée, Ondřej Hošek a ouvert les votes sur la RFC: ldap_modify_batch, qui visait à ajouter une nouvelle fonction à l’extension ldap. Avec 5 votes “pour” et 0 vote “contre”, elle est passée et la nouvelle fonction pourrait donc faire partie de PHP 5.4 et versions supérieures.

Sara Golemon a rédigé la RFC: GMP Floating Point Support en extrayant une portion de la RFC: GMP number as PHP number qui a quant à elle été retirée.

La RFC: Argument Unpacking avait été ouverte aux votes à la fin du mois dernier. Avec 32 votes “pour” et 2 votes “contre”, elle est passée. Cette nouveauté, qui arrivera pour PHP 5.6, complémente la RFC: Syntax for variadic functions qui était passée il y a quelques mois.

Daniel Lowrey a commencé à travailler sur une série de modifications visant à permettre un fonctionnement non-bloquant pour ext/pgsql. En parallèle, Yasuo Ohgaki a implémenté le support d’objets de plus de 2 Go (arrivé avec PostgreSQL 9.3).

Yasuo Ohgaki a annoncé la fin des votes sur la RFC: Use default_charset As Default Character Encoding : avec 8 votes “pour” et 1 vote “contre”, elle est passée. Dans la foulée, il a indiqué avoir travaillé sur la RFC: Multibyte Char Handling et souhaiter des commentaires sur le sujet.

Dmitry Stogov a annoncé avoir commencé à travailler sur un possible nouveau gestionnaire de mémoire pour PHP. En l’état, ce prototype ne fonctionne que sous Linux (sur un build de PHP sans information de debug), et semblerait apporter dans les 3% de gain de performances sous Drupal et entre 12% et 15% sur une portion de code très gourmande en construction d’objets.

Sara Golemon a rédigé la RFC: Module API Inspection, qui ajouterait deux options à PHP en ligne de commande, permettant de déterminer la version de modules zend gérée par PHP, ainsi que celle contre laquelle une extension a été compilée. Toutefois, la solution mise en place n’est pas parfaite, et il n’est donc pas certain qu’elle soit validée.

Andrea Faulds a annoncé l’ouverture des votes sur la RFC: Alphanumeric Decrement. Avec 21 votes “contre” et aucun vote “pour”, elle a été rejetée à l’unanimité.

Les votes ont été ouverts sur la RFC: Introduce session options - read_only, unsafe_lock, lazy_write and lazy_destroy. Suite à cela, les discussions sur le sujet sont reparties, et les votes ont été arrêtés, le temps d’apporter quelques mises à jour la RFC.

En toute fin de mois, Gordon Oheim a annoncé l’ouverture des votes sur la RFC: Automatic Property Initialization, qui vise à faciliter l’initialisation de propriétés lors de l’écriture d’un constructeur, à l’aide d’une syntaxe de ce type :

// would assign properties and provide $z as a local variable
public function __construct($this->x, $this->y, $z)
{
    // do something with $z locally
}

À suivre le mois prochain, donc ;-)



internals@lists.php.net est la mailing-list des développeurs de PHP ; elle est utilisée pour discuter des prochaines évolutions du langage, ainsi que pour échanger autour de suggestions d’améliorations ou de rapports de bugs.
Elle est publique, et tout le monde peut s’y inscrire depuis la page Mailing Lists, ou consulter ses archives en HTTP depuis php.internals ou depuis le serveur de news news://news.php.net/php.internals.



  1. Yahoo aurait de l’ordre de 500 extensions PHP en interne, selon ce mail↩︎