Big Data Hadoop : MapR M7 est sur AWS

Amazon Web Services rend disponible la plateforme big data Hadoop MapR M7 sur Amazon Elastic MapReduce.

Publié par La rédaction le 19 juil. 2013 | Mis à jour le 28 déc. 2021 à 12:07

Lecture
2 min

Imprimer

Les applications Apache Hadoop et NoSQL sont les bienvenues sur la plateforme analytique EMR (Elastic MapReduce) du cloud Amazon, depuis que AWS (Amazon Web Services) a annoncé la disponibilité de MapR M7, la dernière version de l'une des trois distributions historiques de Hadoop (avec Hortonworks et Cloudera).

Des clusters Hadoop sur AWS

Concrètement, pour stocker, traiter et analyser de gros volumes de données, les utilisateurs d'Amazon Elastic MapReduce vont pouvoir déployer et dimensionner des clusters M7 sur des instances de stockage hs1.8xlarge.

Celles-ci sont destinées aux applications nécessitant un accès séquentiel à des jeux de données particulièrement volumineux. Elles offrent 48 To de capacité de stockage sur 24 disques durs, 16 cours virtuels qui peuvent fournir 35 unités de calcul EC2 (ECU) en termes de performances CPU, 117 Go de RAM et 10 Gbits/s en mise en réseau.

La plateforme Hadoop de MapR rend plus accessibles les technologies Hadoop et le déploiement de HBase, avec toutes les fonctionnalités attendues. Amazon décrit HBase comme un magasin de données distribué et basé sur des colonnes, qui fournit des écritures et lectures cohérentes, le partage automatique des tables et un stockage efficace de volumes importants de données dispersées.

Il est conçu pour fonctionner en transparence avec Hadoop, via le partage de son système de fichiers et en assurant les entrées et sorties pour l'exécution des opérations MapReduce dans Hadoop.

Amazon a choisi sa distribution Hadoop

L'architecture MapR M7 sur EMR offre aux utilisateurs de HBase jusqu'à 100 Kops/s par noud sur les instances HS1, l'absence de compactions, la division par région, la restauration instantanée après échec, la faible latence consolidée, le full HA, la cohérence des snapshots et la récupération point-in-time, et la reprise après sinistre (mirroring).

Cette annonce vient confirmer le choix d'Amazon de déployer sa stratégie Big Data Hadoop en partenariat avec MapR. Ce choix repose en particulier sur la capacité de la distribution Hadoop d'offrir aux applications Linux un accès direct aux données dans le cluster via l'interface NFS développée par MapR.

Voir aussi

Silicon.fr étend son site dédié à l'emploi IT
Silicon.fr en direct sur les smartphones et tablettes

Publié par :
La rédaction

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Big Data Hadoop : MapR M7 est sur AWS

Des clusters Hadoop sur AWS

Amazon a choisi sa distribution Hadoop

De France Travail à la RATP, les leçons du "bac à sable" IA de la CNIL

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

Gouvernance des communications : qui se distingue sur ce marché [...]

AWS Summit : le RAG, au carrefour des stratégies GenAI

{ Tribune Expert } - La voie vers une véritable IA open source

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Cybersécurité et digitalisation Comment protéger les [...]

Leader des services de réponse à incident de cybersécurité

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Des clusters Hadoop sur AWS

Amazon a choisi sa distribution Hadoop

S’abonner

Partager l'épisode