Talend 5.4 : de grosses améliorations dans le secteur du Big Data
L'offre d'intégration open source Talend passe aujourd'hui en version 5.4. Fabrice Bonan, directeur technique de la société, explique quelques unes des avancées : améliorations sur le volet Big Data, unification sous la licence Apache, simplification du déploiement dans le Cloud.
Talend est un éditeur connu pour sa plate-forme d'intégration open source, laquelle passe aujourd'hui en version 5.4.
L'occasion pour nous de faire un point sur le développement de l'offre avec Fabrice Bonan, CTO et cofondateur de Talend.
Silicon.fr : Que couvre ce lancement d'octobre ?
Fabrice Bonan : Nous effectuons deux releases chaque année, lesquelles concernent tous nos produits : intégration de données, qualité de données, master data management (MDM), enterprise service bus (ESB) et notre offre dédiée au Big Data.
Tous les produits sont synchronisés, pour la simple et bonne raison qu'ils partagent un même socle technique, la Talend Unified Platform. C'est un gros différenciateur par rapport à la concurrence. Par exemple, IBM, dont les produits sont issus de rachats successifs, affiche très peu de cohérence technologique entre ses différentes briques.
Chez Talend, l'unification se fait sur cinq niveaux : l'environnement de développement (Studio, sur base Eclipse), le référentiel de données (données comme métadonnées), l'interface de déploiement (unique pour les processus, services et applications), le runtime (partagé par tous les produits et sur une base Java) et le monitoring, unifié là encore.
Quid de cette mouture 5.4 ?
La 5.4 apporte de grosses améliorations dans le secteur du Big Data, en particulier en termes de monitoring des Map et Reduce.
Nous avons également beaucoup travaillé sur la capacité de montée en charge de la partie administration, afin de répondre aux demandes de grands clients comme Citygroup, eBay, Sony et Verizon, ou encore EDF, Orange et la SNCF en France.
Enfin, nous avons revu le déploiement vers le cloud, Amazon par exemple. Il est possible de provisionner une instance Amazon, de lancer le job, puis de l'arrêter, le tout très simplement, y compris sur des centaines de nouds. Le déploiement sur Amazon est aujourd'hui identique à celui sur des serveurs on premise.
Vous avez basculé vers la licence Apache. Pourquoi ?
Trois composants précédemment placés sous licence GPL sont touchés par cette annonce : l'intégration de données, la qualité de données et le MDM. L'ESB et l'offre Big Data étaient déjà sous licence Apache. Enfin, l'offre BPM n'est pas concernée, car c'est un produit Bonitasoft redistribué en OEM.
L'objectif est d'unifier les licences, de simplifier les débats et de lever les barrières à l'adoption, en particulier chez les éditeurs tiers qui ne veulent pas être 'contaminés' par la licence GPL. C'est un élément important, car la licence Apache rend possible l'intégration de nos produits dans des offres tierces, y compris celles de nos concurrents. Ce changement de licence devrait également permettre de renforcer les synergies dans la communauté, au sein de Talend et avec d'autres solutions Apache.
Nous sommes aujourd'hui dans le top 5 des contributeurs Apache. Sur les 150 développeurs dont nous disposons, 100 environ travaillent sur des composants open source.
Et la suite ?
Nous livrons aujourd'hui la version open source de notre offre. Elle sera suivie d'une déclinaison commerciale d'ici un mois.
La release est le début d'un processus d'amélioration. 10.000 personnes téléchargent une version dans la semaine de sa sortie, ce qui nous permet de bénéficier de nombreux retours. Nous pouvons alors proposer une offre commerciale qui colle au mieux aux besoins de nos clients.
Voir aussi
Quiz Silicon.fr - Connaissez-vous les logiciels open source ?
Sur le même thème
Voir tous les articles Data & IA