SQL voor BI en Data Science
Tijdens deze cursus leert u hoe u aan data-analyse kan doen met behulp van SQL. Verrassend genoeg worden "in-database" analytics relatief weinig toegepast: meestal kopieert men de (productie-) data eerst naar een analyse-platform of BI-tool om daar de "data science" te doen, maar voor grote datavolumes, of voor data "in de cloud", wordt dat echter steeds minder haalbaar omdat kostbare tijd verloren gaat met het kopiëren van de data. De aangeleerde technieken kunnen toegepast worden binnen een SQL-database, maar uiteraard ook op data die toch gekopieerd zijn, naar een omgeving die SQL ondersteunt, bijvoorbeeld naar een data warehouse (DW), of naar een Big Data-omgeving zoals Hadoop (met Hive) of Spark.
We gaan tijdens de training interactief aan de slag met de geavanceerde mogelijkheden die SQL biedt op dit vlak. Statistische, analytische en OLAP-functies komen aan bod, evenals het gebruik van SQL voor ETL en (indien van toepassing) voor MapReduce. De belangrijkste functionaliteiten worden aangehaald en besproken, en in realistische labs toegepast.
De hier gehanteerde SQL-syntax wordt op een platform-onafhankelijke manier besproken. Waar relevant worden extensies aangekaart voor wat betreft Oracle, Db2, SQL Server, Hive en Spark.
Aan het eind van deze opleiding:
- begrijpen de deelnemers hoe SQL (i.h.b. het SELECT statement) gebruikt kan worden voor rapportering en data-exploratie voor DW, BI, Big Data en Data Science;
- kunnen deelnemers praktisch omgaan met SQL vanuit de Data Warehouse / Data Lake / BI / Data Science optiek;
- is men in staat te beoordelen welke SQL-formulering het meest geschikt is voor een specifieke vraagstelling; en kan men de voor- en nadelen van alternatieve formuleringen evalueren.
Kalender
Momenteel zijn er voor deze cursus geen publieke sessies gepland. Graag organiseren we een bedrijfssessie voor u of een extra publieke sessie (bij voldoende belangstelling). Geïnteresseerd? Laat het ons weten.
Doelgroep
Deze cursus is bestemd voor iedereen die met business reporting of data-exploratie in aanraking komt, en daarbij --aan de hand van eigen geschreven SQL-- relationele databases of Hadoop (Hive) of Spark SQL dient te benaderen.
Voorkennis
Om deze cursus ten volle te laten renderen, dienen de deelnemers over een vlotte parate kennis van SQL te beschikken (niveau cursus SQL workshop plus ervaring met relatief complexe queries; het kan nuttig zijn, vooraf de cursus SQL voor gevorderden te volgen). Verder dient u vertrouwd zijn met elementaire statistische terminologie (zie b.v. Statistiek basiskennis).
Nuttig maar niet noodzakelijk: enig inzicht in de principes van data warehouses (zie b.v. onze cursus Moderne data warehousing en business intelligence) of Big Data (zie b.v. Big data architectuur en infrastructuur) en
Inhoud
- Data warehouse, business intelligence, Data Science -- concepten en positionering
- Extract / Transform / Load (ETL)
- het dimensionele model
- Statistiek en analyse -- mogelijkheden in SQL
- Nut en context -- multi-platform ondersteuning.
- AVG, CORRELATION, COUNT, COVARIANCE, MAX, MIN, RAND, STDDEV, SUM, VARIANCE, MEDIAN, ...
- Online analytical processing in SQL
- Nut en context -- multi-platform ondersteuning.
- RANK, DENSE_RANK, ROW_NUMBER, PARTITION BY, ORDER BY, ROWS, RANGE, GROUP BY, GROUPING SETS, ROLLUP, CUBE, OVER
- WINDOWING functies: SUM ... OVER ..., LEAD, LAG en gelijkaardige aggregate-functies en hun toepassing in o.a. trend-analyse.
- Modellering: histogrammen; lineaire regressie; normality test; trend-analyse; betrouwbaarheidsintervallen; ...
- Tekst-analyse; reguliere expressies
Verloop van de cursus
Klassikale opleiding met veel aandacht voor labs en oefeningen. Deze kunnen naar keuze gebeuren op Db2, Oracle, SQL Server, MariaDB, Hive of Spark. (Gelieve uw voorkeur aan te geven op het inschrijvingsformulier.)
Duur
2 dagen.
Docent
Peter Vanroose, Arnout Veugelen.
Reviews
4.5/5 (gebaseerd op 19 evaluaties; de meest recente worden hieronder getoond)
|
Prima cursus, zoals gewend bij ABIS
| (Bob, ) |
Zeer fijne instructeur/docent Neemt de tijd en weet de stof helder over te brengen.
| (Marc, ) |
Ik ben zeer tevreden
| (Dirk, ) |
Het was een erg interessante cursus en Peter was een kundige docent.
| (Niels, ) |
The course content was so clear, the instructor (Peter) was incredibly knowledgeable and he made this session very interesting.
| (Jeevithaa, ) |
très bon
| (Sébastien De Geynst, Apside Belgium, ) |
excellente
| (Perrine, ) |
Ook interessant
Cursisten van deze training hebben ook volgende cursussen gevolgd:
SESSIE-INFO EN INSCHRIJVEN |