Pour gérer vos consentements :

Big Data : Airbnb place son outil de requête en Open Source

Airbnb, le célèbre site de location d’appartements, place en Open Source (sur Github) son application Airpal, permettant à ses employés sans compétences techniques d’explorer ses données. Associé à l’outil de requête PrestoDB de Facebook, Airpal offre une alternative à bas coût pour exploiter de larges sources de données, notamment celles stockées dans des clusters Hadoop. Alors que PrestoDB est conçu pour les data scientist et requiert des compétences pointues, l’application de Airbnb est pensée pour tous types de salariés. En production depuis un an au sein de la société, Airpal est utilisé par environ un tiers de ses employés, explique James Mayfield, de Airbnb, dans un billet de blog.

Un remplaçant au Redshift d’Amazon

Au sein de la start-up, les données, environ 0,5 Po, sont stockées dans un cluster Hadoop, géré par Apache Hive. PrestoDB fournit la capacité de recherche via des requêtes SQL, Airpal offrant une méthode alternative – et plus accessible à des non informaticiens – pour explorer les données. Les utilisateurs peuvent utiliser un simple navigateur pour soumettre leurs questions et reçoivent en retour des fichiers CSV (facilement exploitables par un tableur).

Avant l’utilisation de cette combinaison, Airbnb exploitait le service Redshift d’Amazon Web Service. « Redshift nécessite un ensemble d’outils d’ETL pour préparer les données. Et l’outil est limité en termes de nombre de requêtes pouvant être exécutées simultanément, ce qui peut freiner l’usage des données, explique Andy Kramolisch, un ingénieur logiciel au sein de la start-up. De plus, nos développeurs trouvaient les messages d’erreur de Redshift peu clairs, rendant le débugage difficile. » Airbnb dit s’être appuyé sur l’expertise des équipes de Facebook pour mettre au point Airpal.

A lire aussi :

Big Data : Accor valorise ses recommandations clients avec la BI
Big Data : eBay lance Pulsar, outil d’analyse de données en temps réel
Big Data : IBM, GE, SAS, Hortonworks… forment une alliance autour de Hadoop

Crédit photo : agsandrew / Shutterstock

Recent Posts

Le Réseau interministériel de l’État, sujet à dépendance

La Cour des comptes appelle à formaliser et à professionnaliser certains aspects du RIE, tout…

13 heures ago

Etalab en position de faiblesse au sein de la Dinum

La Cour des comptes attire l'attention sur le risque d'affaiblissement d'Etalab, privé, ces dernières années,…

15 heures ago

Une Dinum « balbutiante » sur l’open data et les logiciels libres

Missions historiques de la Dinum, l'ouverture des données publiques et la promotion des logiciels libres…

17 heures ago

Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative

Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…

2 jours ago

Microsoft x Inflection AI : l’autorité de la concurrence britannique lance son enquête

L’Autorité de la concurrence et des marchés (CMA) britannique ouvre une enquête sur les conditions…

2 jours ago

Thomas Gourand, nouveau Directeur Général de Snowflake en France

Thomas Gourand est nommé Directeur Général pour la France. Il est chargé du développement de…

2 jours ago