Formation Spark – développement des Applications pour le Big Data

Description

La Big Data et le traitement des données massives sont aujourd’hui indispensable pour les entreprises, faisant de la Big Data et du traitement des données massives des outils incontournables. Cette formation Spark permet de maîtriser le framework Apache Spark pour développer des applications Big Data performantes et évolutives. Les participants seront formés à la manipulation de données avec Spark SQL, les RDD, les DataFrames et le streaming en temps réel, tout en étant initiés aux fondamentaux du Machine Learning via Spark MLlib.

Public visé

  • Cette formation s’adresse aux développeurs, chefs de projet, architectes, ingénieurs data et passionnés du Big Data souhaitant développer des applications distribuées avec Spark.

Prérequis

  • Bases en Java ou Python
  • Connaissances en développement informatique
  • Notions de bases de données
  • Culture générale Big Data appréciée

Objectifs pédagogique

  • Comprendre la structure d’Apache Spark
  • Utiliser Spark SQL pour la manipulation des données.
  • Développer des applications distribuées de Big Data
  • Explorer Spark Streaming et Spark MLlib

Programme de la formation

Maîtriser Apache Spark pour développer et déployer des applications Big Data performantes.

Formation Spark – Programmation Big Data Distribuée

Contenu

  1. Introduction à Hadoop et son écosystème
  • Introduction générale à hadoop
  • La place de mapreduce
  • Le traitement de données avec Hadoop
  • Les composants d’un cluster Hadoop
  • Un système de fichiers distribué (HDFS)
  • Traitement distribué sur un cluster Hadoop (mapreduce)
  • Travailler avec Yarn
  • En quoi Spark complète-t-il Hadoop ?
  1. Architecture de Spark
  • Un framework offrant de nombreux services…
  • … mais pas de stockage (Hadoop, AWS S3, Cassandra, MongoDB, etc.)
  • Rôle du coeur de Spark (moteur)
  • RDD, la couche d’abstraction des données (Resilient Distributed Datasets)
  • Accéder aux données avec Spark SQL
  • Traiter les données en pseudo temps réel avec Spark Streaming
  • Développer des applications distribuées de machine learning (Spark MLib)
  • Quels liens entre Spark et les langages de programmation (Java, Python, R, …) ?
  • Manipuler les graphes avec GraphX
  • Limites de Spark
  1. Les RDD, structures fondamentales de Spark
  • Introduction aux RDD
  • Les sources de données de RDD
  • Créer et sauvegarder des RDD
  • Les opérations sur les RDD
  • Écrire et passer des fonctions de transformation
  • Fonctionnement des transformations de Spark
  • Les RDD clé-valeur
  • Map-Reduce : principe et usage dans Spark
  • Autres opérations sur les RDD de paires
  • Exécuter des requêtes SQL (Spark SQL)
  • Interopérabilité avec les RDD
  1. Manipuler les données avec les Dataframe et Datasets
  • Créer des DataFrames depuis diverses sources de données
  • Les schémas des DataFrames
  • Afficher le Dataframe en mode texte (take)
  • Visualiser graphiquement le DataFrame (display)
  • Sauvegarder des DataFrames
  • Requêter des DataFrames avec des expressions sur les colonnes nommées
  • Les requêtes de groupement et d’aggrégation
  • Les jointures
  • Les différences entre Datasets et DataFrames
  • Créer des Datasets
  • Charger et sauvegarder des Datasets
  • Les opérations sur les Datasets
  • Conversion entre RDD et DataFrames
  1. Machine learning avec Spark
  • Introduction au machine learning.
  • Les différentes classes d’algorithmes.
  • Présentation de SparkML et MLlib.
  • Implémentations des différents algorithmes dans MLlib.
  1. Analyser en temps réel avec Spark Streaming
  • Comprendre l’architecture du streaming.
  • Présentation des Discretized Streams (DStreams).
  • Les différents types de sources.
  • Manipulation de l’API (agrégations, watermarking…).
  • Machine Learning en temps réel.
  1. Écriture d’une application compilée
  • Écrire, configurer et lancer des applications spark
  • Écrire une application Spark
  • Compiler et lancer une application
  • Le mode de déploiement d’une application L’interface utilisateur web des applications Spark
  • Configurer les propriétés d’une application

Cette formation Spark représente une opportunité précieuse pour acquérir des compétences prisées dans les domaines de la data et du traitement distribué. Découvrez également nos formations spécialisées en Machine Learning, Data Science, Big Data, Internet of Things et Artificial Intelligence pour renforcer votre expertise dans les technologies innovantes.

Formation Spark

Réference: NTE15

Niveau: Fondamental

Certificat : De participation

Durée: 5 Jours

Lieu: En présentiel ou à distance

Financement CNFCPP

Partager

Les points forts de la formation

  • Formation 100% pratique
  • Cas réels Big Data
  • Introduction au Machine Learning
  • Manipulation des données en temps réel

SOFTWAY TUNISIE

Moyens Pédagogiques

  • Cours interactifs
  • Pratique guidée
  • Projets réels
  • Support continu

Offre Speciale

Formation Intelligence Artificielle: Enjeux et Outils

Cette formation en Intelligence Artificielle vise à donner une compréhension globale des enjeux, des concepts clés et des usages actuels de l’IA

 Autres formations à découvrir

Formation Rédaction Web – Approche éditoriale d’un site web

Réference: DG01

Niveau: Fondamental

Durée: 3 Jours

Lieu: En présentiel ou à distance

Certification: De participation

Financement CNFCPP: Oui

ISTQB Foundation

Réference: PR03

Niveau: Fondamental

Durée: 3 Jours

Lieu: En présentiel ou à distance

Certification: De participation

Financement CNFCPP: Oui

Formation Sage Paie 100

Réference: SA05

Niveau: Fondamental

Durée: 3 Jours

Lieu: En présentiel ou à distance

Certification: De participation

Financement CNFCPP: Oui

Partenaire sage en Tunisie & Centre de formation professionnelle​

Revendeur et intégrateur Sage, SOFTWAY TUNISIE, vous fait bénéficier de son expertise et du savoir-faire de son personnel hautement qualifié en accompagnant votre entreprise dans la conception de vos projets informatiques.

Demande de devis

Softway

Inscription à une Formation

Rejoignez-nous !​

Dans le cadre de notre activité de formation professionnelle, nous sommes constamment à la recherche de nouveaux consultants formateurs.
Softway

Demande de demo

Softway