Tout Wikipedia dans un livre électronique
Publié par David Feugey le | Mis à jour le
Grâce à un nouveau logiciel, le lecteur de livres électroniques Iliad peut embarquer toute l'encyclopédie Wikipedia. L'archive de la version anglaise comprend 3,6 Go de données
L'iRex Iliad est sans aucun doute le lecteur de livres électroniques le plus populaire du marché. Il embarque un écran de type « papier électronique », pour un prix encore élevé (malgré une promotion en cours) de 499 euros.
Les 256 Mo de mémoire Flash se répartissent entre un système d'exploitation basé sur Linux et 128 Mo d'espace de stockage. L'adjonction d'une carte externe permet cependant d'ajouter un maximum de 8 Go de mémoire. Amir Shimoni utilise cette caractéristique pour embarquer l'encyclopédie en ligne Wikipedia au sein de l'iRex.
À cet effet, il offre un logiciel capable de lire le contenu de l'encyclopédie, stocké dans une archive. Toute l'astuce consiste à pouvoir retrouver un article précis, sans décompresser le fichier dans sa totalité. Le logiciel utilise le langage de programmation Python et un navigateur Internet qui permettra d'afficher les pages (Dillo, Midori ou l'outil intégré à l'Iliad).
L'auteur propose d'installer les 22,3 Mo de la version anglaise simplifiée de Wikipedia. Au besoin, vous pourrez également installer la version complète de l'encyclopédie en langue anglaise, qui pèse plus de 3,6 Go (avec compression !). Il convient alors de formater la carte mémoire en ext2, le format fat32 n'acceptant pas les fichiers de plus de 2 Go.
Amir Shimoni signale toutefois que cette version « hors-ligne » de Wikipedia ne comprend aucune image. En les incluant, la taille de l'archive dépasserait en effet les 400 Go !
Vous pouvez télécharger ce projet sur cette page. Des index existent également pour le dictionnaire anglais et la version allemande de Wikipedia. L'auteur travaille maintenant à la mise au point d'une solution d'indexation qui permettra - nous l'espérons - d'adapter cet outil à d'autres versions localisées de l'encyclopédie.