Bonjour,


Vous trouverez dans cet archive :
data/
    rss.xml : extraction du flux RSS de blog.pascal-martin.fr, utilisée pour avoir une liste de mots, découpée en plusieurs articles, un minimum réaliste
    rss2txt.php : script transformant ce fichier XML en une série de fichiers texte, à raison de un mot par ligne
    textes-articles/ : les fichiers en question
        article-0.txt
        article-1.txt
        ...
compare-get-array.php : les fonctions de comparaison, et les tests - version retournant des listes de mots en commun
compare-get-count.php : même chose, en version retournant uniquement des nombres de mots en commun
compare-utils.php : une paire de fonctions utilitaires, utilisées par les deux tests au-dessus
lisez-moi.txt : ce fichier


Licence : 
    - Les fichiers sous PHP sont sous licence MIT ; Cf bloc d'en-tête en haut de chaque fichier.
    - Les articles (fichier .xml et fichiers .txt) sont placés sous licence Creative Commons by-nc-nd ; Cf http://creativecommons.org/licenses/by-nc-nd/2.0/fr/
        Note : ces fichiers sont utilisés uniquement comme liste de mots ; au besoin, il vous sera facile d'en générer de nouvelles à partir de, par exemple... le flux RSS de votre blog ;-)



Cordialement,

Pascal MARTIN
http://blog.pascal-martin.fr/
