Data Integration with Cloud Data Fusion (DICDF) – Outline

Detailed Course Outline

Module 00 - Introduction

(en anglais)

Module 01 - Introduction à l'intégration de données et au Cloud Data Fusion
  • Intégration de données : quoi, pourquoi, défis
  • Outils d'intégration de données utilisés dans l'industrie
  • Personnages d'utilisateurs
  • Introduction à la fusion de données en nuage
  • Capacités critiques de l'intégration de données
  • Composants de l'interface utilisateur de Cloud Data Fusion
Module 02 - Construire des pipelines
  • Architecture de Cloud Data Fusion
  • Concepts de base
  • Pipelines de données et graphes acycliques dirigés (DAG)
  • Cycle de vie des pipelines
  • Concevoir des pipelines dans Pipeline Studio
Module 03 - Concevoir des pipelines complexes
  • Branchements, fusions et jointures
  • Actions et Notifications
  • Gestion des erreurs et macros Configurations de pipelines, ordonnancement, importation et exportation
Module 04 - Environnement d'exécution des pipelines
  • Planifications et déclencheurs
  • Environnement d'exécution : Profil de calcul et provisionneurs
  • Surveillance des pipelines
Module 05 - Construire des transformations et préparer les données avec Wrangler
  • Wrangler
  • Directives
  • Directives définies par l'utilisateur
Module 06 - Connecteurs et pipelines de streaming
  • Comprendre l'architecture d'intégration de données.
  • Lister les différents connecteurs.
  • Utiliser l'API de prévention des pertes de données (DLP) du Cloud.
  • Comprendre l'architecture de référence des pipelines de streaming.
  • Construire et exécuter un pipeline de streaming.
Module 07 - Métadonnées et lignage des données
  • Métadonnées
  • Lignage des données
Module 08 - Synthèse
  • Résumé du cours