Big Data : Cassandra 1.2, base de données NoSQL open source
Cassandra 1.2 s'annonce comme une version majeure de cette base de données NoSQL open source. Cette seconde génération de la base apporte son lot de nouvelles fonctionnalités validées par l'ASF (Apache Software Foundation).
Cassandra 1.2 est tout d'abord une base de données haute performance, capable de traiter simultanément des milliers de requêtes, destinée au Big Data, NoSQL pour traiter la diversité des informations non structurées - par opposition aux données SQL structurées -, scalable pour évoluer sans interruption et à tolérance de panne.
Cette nouvelle version a densifié le support des clusters avec le clustering au travers de nouds virtuels (vnode), chaque noud pouvant supporter plusieurs téraoctets de données, la virtualisation des nodes simplifiant la gestion des clusters et réduisant la charge des machines virtuelles Java. Elle apporte la communication inter nouds, et un mapping plus puisant ; la simplification du modeling ; et la capacité de représenter l'information de manière plus naturelle.
Lire aussi : Comment Uber a optimisé son déploiement Cassandra
Atomic batches et CQL3
Autre nouveauté, les 'atomic batches', un mécanisme de protection de l'intégrité transactionnelle des processus professionnels destiné aux développeurs. Un 'batch' permet de regrouper plusieurs mises à jour dans un seul état. Précédemment il était nécessaire de reproduire manuellement une seule mise à jour. À noter que l'atomic batches peut afficher une surconsommation d'environ 30%.
Enfin Cassandra 1.2 intègre la version 3 de CQL (Cassandra Query Language). Apache Cassandra étant une base de données distribuée, il est souvent nécessaire de réunir des données qui ne sont pas stockées sur un même support physique. Or le langage de requête n'offrait pas la commande JOIN.
C'est pourquoi le support de la 'collection' des données est probablement le principal apport de cette nouvelle version CQL3, ce qui devrait aider à simplifier la modélisation de la donnée, de manière naturelle.
Une communauté enrichie
Dans son communiqué, l'ASF a donné une indication sur les acteurs du marché qui exploitent Cassandra : Adobe, Appscale, Appssavvy, Backupify, Cisco, Clearspring, Cloudtalk, Constant Contact, DataStax, Digg, Digital River, Disney, eBay, Easou, Formspring, Hailo, Hobsons, IBM, Mahalo.com, Morningstar, Netflix, Openwave, OpenX, Palantir, PBS, Plaxo, Rackspace, Reddit, RockYou, Shazam, SimpleGeo, Spotify, Thomson-Reuters, Twitter, Urban Airship, US Government, Walmart Labs, Williams-Sonoma, Inc., et Yakaz.
Voir aussi
Quiz Silicon.fr - Le vocabulaire du cloud
Silicon.fr étend son site dédié à l'emploi IT
Silicon.fr en direct sur les smartphones et tablettes
Sur le même thème
Voir tous les articles Data & IA