From Data to Insights with Google Cloud Platform

Obtenez des informations via l'analyse et la visualisation de données grâce à Google Cloud Platform

Description du cours

Vous vous demandez comment interroger et traiter des pétaoctets de données en quelques secondes ? Vous aimeriez savoir comment l'analyse des données peut évoluer automatiquement à mesure que vos volumes de données augmentent ? Bienvenue dans le cours sur l'analyse de données !

Dispensé par un formateur, ce cours de trois jours explique comment obtenir des insights grâce à l'analyse et à la visualisation de données à l'aide de Google Cloud Platform. À travers des scénarios interactifs et des ateliers pratiques, les participants explorent, exploitent, chargent, visualisent et extraient des informations à partir de divers ensembles de données Google BigQuery. Ce cours aborde différents sujets : le chargement et l'interrogation des données, la modélisation des schémas, l'optimisation des performances, la tarification des requêtes, la visualisation des données et le machine learning.

Ce cours permet aux participants d'acquérir les compétences suivantes

  • Tirer des informations à partir de données à l'aide des outils d'analyse et de visualisation de Google Cloud Platform
  • Charger, nettoyer et transformer les données à grande échelle à l'aide de Google Cloud Dataprep
  • Explorer et visualiser les données à l'aide de Google Data Studio
  • Optimiser et écrire des requêtes hautes performances et résoudre les problèmes associés
  • S'exercer avec des API de ML prédéfinies pour analyser les images et le texte
  • Entraîner des modèles de ML de classification et de prévision à l'aide de SQL avec BQML

Prix: 2190€ HT
Durée: 3 jours
Modalité: Inter en présentiel (demander une formation en intra-entreprise)

Prochaines dates :

PROGRAMME DE LA FORMATION

Module 1

Présentation des données dans Google Cloud Platform

D'hier à aujourd'hui : analyse de données évolutive dans le cloud

  • Mettre en avant les difficultés auxquelles font face les analystes de données
  • Comparer le big data sur site et dans le cloud
  • Étudier des cas d'utilisation concrets d'entreprises qui se sont transformées grâce à l'analyse dans le cloud
  • Découvrir les principes de base des projets Google Cloud Platform
  • Atelier : Premiers pas avec Google Cloud Platform
Module 2

Présentation des outils de Big Data

Optimiser les outils de votre kit d'analyste de données

  • Découvrir les tâches des analystes de données et les défis auxquels ils font face, ainsi que les outils de données Google Cloud Platform
  • Démonstration : Analyser 10 milliards d'enregistrements avec Google BigQuery
  • Découvrir 9 fonctionnalités essentielles de Google BigQuery
  • Comparer les outils GCP pour les analystes, les data scientists et les ingénieurs de données
  • Atelier : Explorer les ensembles de données avec Google BigQuery
Module 3

Exploration de vos données avec SQL

En savoir plus sur Google BigQuery et les bonnes pratiques SQL

  • Comparer les techniques courantes d'exploration des données
  • Apprendre à coder le langage SQL standard de haute qualité
  • Explorer les ensembles de données publics Google BigQuery
  • Aperçu de visualisation : Google Data Studio
  • Atelier : Résoudre les erreurs SQL courantes
Module 4

Tarifs de Google BigQuery

Calculer les coûts du stockage et des requêtes Google BigQuery

  • Présentation complète d'une tâche BigQuery
  • Calculer les tarifs de BigQuery : coûts du stockage, des requêtes et des flux
  • Optimiser les coûts des requêtes
  • Atelier : Calculer les tarifs de Google BigQuery
Module 5

Nettoyage et transformation de vos données

Superposer vos données brutes dans un ensemble de données plus simple et plus riche

  • Étudier les 5 principes de l'intégrité d'un ensemble de données
  • Caractériser la forme et l'asymétrie des ensembles de données
  • Nettoyer et transformer les données à l'aide de SQL
  • Nettoyer et transformer les données à l'aide d'une nouvelle interface utilisateur : présentation de Cloud Dataprep
  • Atelier : Explorer et mettre en forme les données avec Cloud Dataprep
Module 6

Stockage et exportation de données

Créer des tables et exporter les résultats

  • Comparer les tables permanentes aux tables temporaires
  • Enregistrer et exporter les résultats de requêtes
  • Aperçu des performances : cache des requêtes
  • Atelier : Créer des tables permanentes
Module 7

Ingestion de nouveaux ensembles de données dans Google BigQuery

Transférer vos données dans le cloud

  • Interroger à partir de sources de données externes
  • Éviter les pièges liés à l'ingestion de données
  • Ingérer de nouvelles données dans des tables permanentes
  • Discuter des insertions en flux continu
  • Atelier : Ingérer et interroger de nouveaux ensembles de données
Module 8

Visualisation de données

Explorer et expliquer vos données de manière efficace grâce à la visualisation

  • Présentation des principes de visualisation des données
  • Comparer l'analyse exploratoire à l'analyse explicative
  • Démonstration : Interface utilisateur de Google Data Studio
  • Connecter Google Data Studio à Google BigQuery
  • Atelier : Explorer un ensemble de données dans Google Data Studio
Module 9

Regroupement et fusion des ensembles de données

Plus de données pour combiner et enrichir vos ensembles de données

  • Fusionner des tables de données historiques avec UNION
  • Intégrer des caractères génériques de table pour faciliter la fusion
  • Étudier les schémas de données : associer les données dans plusieurs tables
  • Présentation complète d'exemples JOIN et des pièges associés
  • Atelier : Associer des données provenant de plusieurs tables
Module 10

Fonctions avancées et clauses

En savoir plus sur l'écriture des requêtes avancées avec Google BigQuery

  • Étudier les instructions CASE SQL
  • Présentation des fonctions de fenêtre d'analyse
  • Sauvegarder les données avec le chiffrement de champ unidirectionnel
  • Discuter de la conception efficace de sous-requête et de CTE
  • Comparer les fonctions définies par l'utilisateur dans SQL et JavaScript
  • Atelier : Obtenir des informations grâce aux fonctions SQL avancées
Module 11

Conception de schémas et structures de données imbriquées

Modéliser vos ensembles de données à grande échelle avec Google BigQuery

  • Comparer Google BigQuery à l'architecture de données SGBDR traditionnelle
  • Normalisation et dénormalisation : compromis de performance
  • Étude du schéma : Le Bon, la Brute et le Truand
  • Tableaux et données imbriquées dans Google BigQuery
  • Atelier : Interroger les données imbriquées et répétées
Module 12

Visualisation améliorée avec Google Data Studio

Créer des tableaux de bord Pixel-Perfect

  • Créer des instructions CASE et des champs calculés
  • Éviter les problèmes de performance grâce au cache
  • Partager les tableaux de bord et discuter de l'accès aux données
Module 13

Optimisation des performances

Résoudre les problèmes de performances de requêtes

  • Éviter les problèmes de performance de Google BigQuery
  • Empêcher le hotspotting dans vos données
  • Effectuer un diagnostic des problèmes de performances grâce au mappage Query Explanation
  • Atelier : Optimisation et résolution des problèmes de performances
Module 14

Accès aux données

La sécurité des données dans le cloud au cœur des préoccupations

  • Comparer les rôles des ensembles de données IAM et BigQuery
  • Éviter les pièges liés à l'accès
  • Vérifier les membres, les rôles, les organisations, l'administration des comptes et les comptes de service
Module 15

Notebooks dans le cloud

Collaborer sur des insights et les partager à l'aide de notebooks

  • Cloud Datalab
  • Compute Engine et Cloud Storage
  • Atelier : Louer une VM pour traiter des données sur des séismes
  • Analyse de données avec BigQuery

Module 16

Google et le machine learning

Exploiter des API de ML prédéfinies pour vos projets

  • Présentation du machine learning pour les analystes
  • S'exercer avec des API de ML prédéfinies pour analyser les images et le texte
  • Atelier : API de ML pré-entraînées

Module 17

Application du machine learning à vos ensembles de données (BQML)

Créer et faire des prévisions avec des modèles de machine learning à l'aide de SQL dans BigQuery

Formations suggérées

Google Cloud Platform Fundamentals: Big Data & Machine Learning (GCP100B)

1 jours

Data Engineering on Google Cloud Platform (GCP200DE)

4 jours

Preparing for the Professional Data Engineer Examination (GCPCERT-DE)

1 jours

Nous contacter

Paris

48 Rue Jacques Dulud

92200 Neuilly-sur-Seine

+33 1 41 38 52 00

Lille

74 rue des Arts

59800 Lille

+33 3 66 72 61 32

Strasbourg

Crystal Park, 1 Avenue de l'Europe

67300 Schiltigheim

+33 3 88 47 04 38

Luxembourg

2, rue Drosbach

L-3372 Leudelange, Luxembourg

+352 26 54 47 1

Bordeaux

c/o Mama Works, 51 quai Lawton

33300 Bordeaux

Nantes

Zero Newton, 3 Rue Albert Camus

44000 Nantes

+33 2 55 59 07 00