Big Data : récolte et analyse de données volumineuses - Hbase

Module autonome non conventionné

Durée moyenne : 14 h
logo DK

MOD_42276

Niveau d'entrée : Bac, Bac pro, BP, Bac +2, Bac +3/4, Bac +5 et plus
Niveau de sortie : Sans Niveau Spécifique
Validation partielle :
  • - BIG DATA : Récolte et analyse de données volumineuses
    - Attestation d'acquis ou de compétences
Public(s) visé(s) :Agent de la fonction publique, Artisan, Commerçant, Demandeur d'emploi, Formateur, Licencié pour motif économique, Maître d'apprentissage, Public en emploi, Salarié, Tout public
Code(s) France Compétences : RS_2234
Code(s) CertifInfo : CertifInfo_93835

Organisation pédagogique :

en savoir plus...

Information sur le(s) public(s) visé(s) :

Agent de la fonction publique, Artisan, Commerçant, Demandeur d'emploi, Formateur, Licencié pour motif économique, Maître d'apprentissage, Public en emploi, Salarié, Tout public

Pré-requis :

Posséder des connaissances de base des commandes Unix/Linux.

Objectifs :

Comprendre le fonctionnement de hbase.
Maîtriser les outils de hadoop pour explorer les données stockées sur un entrepôt big data.

Description :

Hbase est un système de gestion de base de données non relationnelles distribué, il est écrit en Java et permet de gérer un volume de données très important. Il est nativement intégré avec hadoop.
Il fournit en temps réel un accès en lecture, en écriture à ces grands ensembles de données.


Comprendre hbase et sa mise en place .

Introduction
Présentation de hbase et son lien avec hdfs.
Fonctionnalités : failover automatique, sharding.
Interfaçage avec les job mapreduce.

Architecture hadoop hbase
Les démons ( hmaster, hregionserver, zookeeper).
Questionnaire de validation.
Conclusion.

Installation de hadoop hbase
Les packages à installer.
Installation et configuration.
Démarrage en standalone.
Test de connexions.
Conclusion.
Découvrir les techniques avancées de hbase.

Hbase shell :
Les commandes de bases.
Manipulation des données.
Désactiver ou effacer des tables.

Hbase en cluster :
Le mode distribué.
Premier jet, fonctionnement sans démons.
Mise en oeuvre de hdfs, dans un environnement distribué.

Organisation de la formation :

FOAD

Périodicité de la formation :

tous les deux mois

Nombre de sessions par an :

5

Spécialité de formation :

Informatique, traitement, réseau (326)

Domaine(s) :

administration base de données (31036), Data Warehouse (31052), informatique décisionnelle (31014)

Métiers :

Conseil et maîtrise d'ouvrage en systèmes d'information (M1802), Études et développement informatique (M1805)
  • Session du 01/01/2020 au 31/12/2022

    Lieu de session :
    Buro club
    120 Rue Jean Jaurès
    92300 Levallois-Perret
    SE_334931

    Durée moyenne de la formation :

    • 14 h en FOAD
    14 heure(s) par semaine

    Places disponibles : Oui

    Etat de recrutement : Ouvert

    Entrée/sortie :  Permanente

    Lieu d'inscription :
    Cegefos
    2 Avenue Pierre Piffault
    72100 Le Mans

    Afficher la carte

    02 43 52 36 45

    cegefos@orange.fr

    Modalités d’inscription : Dossier, Entretien