SQL pour l'analyse BI et Data Science

Au cours de cette formation, vous apprendrez à utiliser SQL pour analyser des données. On sera surpris d'apprendre que l'analyse de données "in-database" se fait plutôt exceptionnellement: le plus souvent, on copie les données (de production) d'abord vers une plate-forme d'analyse ou vers un outil BI pour faire le "data science" là-bas. Pour de larges volumes de données, ou pour des données "dans le cloud", ceci n'est pas le meilleur choix parce qu'on perd du temps précieux pendent le copiage des données. Ce cours vous apprendra comment faire le "data analytics" directement dans la base de données. Les techniques apprises peuvent bien sûr aussi être utilisées sur des données qui ont été copiées dans un environnement qui supporte l'SQL, p.ex. un data warehouse (DW), ou un environnement Big Data comme Hadoop (avec Hive) ou Spark.

Après une courte discussion des concepts relatifs au data warehouses, data lakes, business intelligence (BI) et Data Science, nous abordons immédiatement la discussion des facilités syntactiques offertes par SQL dans ce contexte. Fonctions statistiques, analytiques, et OLAP sont traitées, ainsi que l'utilisation de SQL pour ETL et pour MapReduce. Les fonctions les plus importantes sont introduites en détail; et appliquées durant les exercices dans des situations réalistes.

La syntaxe SQL traitée est indépendante de la plate-forme RDBMS utilisée par le participant. Si nécessaire, on indiquera les spécificités de chaque RDBMS durant le cours, spécifiquement pour Oracle, Db2, SQL Serveur et Hive/Spark.

À la fin de ce cours, le participant:

  • comprendra comment utiliser l'SQL (spécifiquement l'instruction SELECT) afin de développer des 'business reports' ou d'explorer de nouvelles données;
  • peut construire des instructions SQL pratiques dans le contexte Data Warehouse, BI, Big Data et Data Science;
  • est capable de formuler et d'évaluer des requêtes complexes en fonction du rapport à développer, et peut évaluer l'efficacité et la performance d'instructions SQL alternatives.

Calendrier

dateduréelang.lieuprix 
01 déc2web based 1000 EUR (exempte de TVA)
INFO SESSION ET INSCRIPTION

Participants

Ce cours concerne toute personne qui veut en savoir plus sur le développement des 'business reports' utilisant de l'SQL manuellement composé sur des systèmes relationnels ou sur Hadoop (Hive ou Spark SQL).

Connaissances préalables

Pour vraiment profiter de ce cours, les participants doivent avoir une connaissance appprofondie des bases de données relationnelles et d'SQL (niveau SQL workshop et expérience avec des requêtes complexes; avoir suivi le cours SQL pour utilisateurs avancés constitue également un avantage). En plus on doit avoir une idée des concepts relatifs au data warehousing (cf. notre cours Le data warehouse d'aujourd'hui et la business intelligence) ou bien Big Data (cf. notre cours L'architecture et l'infrastructure Big Data) ainsi qu'avoir des notions de statistique (cf. le cours Statistique: cours de base).

Contenu

  • Data warehouse et business intelligence - concepts et positionnement
  • Extract / Transform / Load (ETL)
  • le modèle dimensionnel
  • Statistique et analyse - possibilités offertes par SQL
  • Contexte et utilité - support multi plate-forme.
  • AVG, CORRELATION, COUNT, COVARIANCE, MAX, MIN, RAND, STDDEV, SUM, VARIANCE, ...
  • Online analytical processing et SQL
  • Contexte et utilité - support multi plate-forme.
  • RANK, DENSE_RANK, ROW_NUMBER, PARTITION BY, ORDER BY, ROWS, RANGE, GROUP BY, GROUPING SETS, ROLLUP, CUBE, OVER
  • fonctions WINDOWING: SUM ... OVER ..., LEAD, LAG et d'autres fonctions d'agrégation, avec des applications dans le contexte de p.ex. l'analyse de tendance
  • Modèles statistiques: régression linéaire; teste de normalité; trend analysis; intervalles de confidence; ...
  • Analyse textuelle; expressions régulières

Pédagogie

Une grande partie du cours est consacrée aux exercices et à la discussion des solutions. Les exercices se feront sur Db2, Oracle, SQL Serveur, Hive our Spark. (Veuillez indiquer votre choix sur le formulaire d'inscription.)

Durée

2 jours.

Formateur

Peter Vanroose, Arnout Veugelen.

Reviews

très bon

 
  (, )

excellente

 
  (, )

goede verdieping op onderwerp SQL

 
  (, )

goed cursus met fijne afwisseling tussen theorie en praktijk

 
  (, )

Prima!

 
  (, )

Uitstekend. Goed.

 
  (, )

omdat ik persoonlijk wat minder goed de basis beheers, vond ik het bijtijden bijzonder pittig

 
  (, )

Goede cursus, veel theorie, misschien iets meer met praktijk voorbeelden en dan bedoel ik ook visueel tonen van uitkomst, niet alleen de query

 
  (, )

Aussi intéressant

Participants de ce cours ont aussi suivi les formations suivantes:


INFO SESSION ET INSCRIPTION