SQL pour l'analyse BI et Data Science
Au cours de cette formation, vous apprendrez à utiliser SQL pour analyser des données. On sera surpris d'apprendre que l'analyse de données "in-database" se fait plutôt exceptionnellement: le plus souvent, on copie les données (de production) d'abord vers une plate-forme d'analyse ou vers un outil BI pour faire le "data science" là-bas. Pour de larges volumes de données, ou pour des données "dans le cloud", ceci n'est pas le meilleur choix parce qu'on perd du temps précieux pendent le copiage des données. Ce cours vous apprendra comment faire le "data analytics" directement dans la base de données. Les techniques apprises peuvent bien sûr aussi être utilisées sur des données qui ont été copiées dans un environnement qui supporte l'SQL, p.ex. un data warehouse (DW), ou un environnement Big Data comme Hadoop (avec Hive) ou Spark.
Après une courte discussion des concepts relatifs au data warehouses, data lakes, business intelligence (BI) et Data Science, nous abordons immédiatement la discussion des facilités syntactiques offertes par SQL dans ce contexte. Fonctions statistiques, analytiques, et OLAP sont traitées, ainsi que l'utilisation de SQL pour ETL et pour MapReduce. Les fonctions les plus importantes sont introduites en détail; et appliquées durant les exercices dans des situations réalistes.
La syntaxe SQL traitée est indépendante de la plate-forme RDBMS utilisée par le participant. Si nécessaire, on indiquera les spécificités de chaque RDBMS durant le cours, spécifiquement pour Oracle, Db2, SQL Serveur et Hive/Spark.
À la fin de ce cours, le participant:
- comprendra comment utiliser l'SQL (spécifiquement l'instruction SELECT) afin de développer des 'business reports' ou d'explorer de nouvelles données;
- peut construire des instructions SQL pratiques dans le contexte Data Warehouse, BI, Big Data et Data Science;
- est capable de formuler et d'évaluer des requêtes complexes en fonction du rapport à développer, et peut évaluer l'efficacité et la performance d'instructions SQL alternatives.
Calendrier
date | durée | lang. | lieu | prix | |
10 mar | 2 | web based | 1260 EUR (excl. TVA) | ||
10 mar | 2 | Leuven | 1260 EUR (excl. TVA) | ||
16 juin | 2 | Leuven | 1260 EUR (excl. TVA) | ||
16 juin | 2 | web based | 1260 EUR (excl. TVA) | ||
INFO SESSION ET INSCRIPTION |
Participants
Ce cours concerne toute personne qui veut en savoir plus sur le développement des 'business reports' utilisant de l'SQL manuellement composé sur des systèmes relationnels ou sur Hadoop (Hive ou Spark SQL).
Connaissances préalables
Pour vraiment profiter de ce cours, les participants doivent avoir une connaissance appprofondie des bases de données relationnelles et d'SQL (niveau SQL workshop et expérience avec des requêtes complexes; avoir suivi le cours SQL pour utilisateurs avancés constitue également un avantage). En plus on doit avoir des notions de statistique (cf. le cours Statistique: cours de base).
Contenu
- Data warehouse et business intelligence - concepts et positionnement
- Extract / Transform / Load (ETL)
- le modèle dimensionnel
- Statistique et analyse - possibilités offertes par SQL
- Contexte et utilité - support multi plate-forme.
- AVG, CORRELATION, COUNT, COVARIANCE, MAX, MIN, RAND, STDDEV, SUM, VARIANCE, ...
- Online analytical processing et SQL
- Contexte et utilité - support multi plate-forme.
- RANK, DENSE_RANK, ROW_NUMBER, PARTITION BY, ORDER BY, ROWS, RANGE, GROUP BY, GROUPING SETS, ROLLUP, CUBE, OVER
- fonctions WINDOWING: SUM ... OVER ..., LEAD, LAG et d'autres fonctions d'agrégation, avec des applications dans le contexte de p.ex. l'analyse de tendance
- Modèles statistiques: régression linéaire; teste de normalité; trend analysis; intervalles de confidence; ...
- Analyse textuelle; expressions régulières
Pédagogie
Une grande partie du cours est consacrée aux exercices et à la discussion des solutions. Les exercices se feront sur Db2, Oracle, SQL Server, MariaDB, Hive ou Spark. (Veuillez indiquer votre choix sur le formulaire d'inscription.)
Durée
2 jours.
Formateur
Peter Vanroose, Arnout Veugelen.
Reviews
4.5/5 (basé sur 19 évaluations; les plus récentes sont montrées ci-dessous)
|
très bon
| (Sébastien De Geynst, Apside Belgium, ) |
excellente
| (Perrine, ) |
The course content was so clear, the instructor (Peter) was incredibly knowledgeable and he made this session very interesting.
| (Jeevithaa, ) |
zeer veel extra's geleerd
| (Johan van den Hurk, KPN, ) |
Prima cursus, zoals gewend bij ABIS
| (Bob, ) |
Zeer fijne instructeur/docent Neemt de tijd en weet de stof helder over te brengen.
| (Marc, ) |
Ik ben zeer tevreden
| (Dirk, ) |
Het was een erg interessante cursus en Peter was een kundige docent.
| (Niels, ) |
Aussi intéressant
Participants de ce cours ont aussi suivi les formations suivantes:
- SQL pour utilisateurs avancés
- SQL et RDBMS: cours de base
- La programmation en Python: cours de base
- Python pour l'analyse des données
INFO SESSION ET INSCRIPTION |