SQL voor BI en Data Science

Tijdens deze cursus leert u hoe u aan data-analyse kan doen met behulp van SQL. Verrassend genoeg worden "in-database" analytics relatief weinig toegepast: meestal kopieert men de (productie-) data eerst naar een analyse-platform of BI-tool om daar de "data science" te doen, maar voor grote datavolumes, of voor data "in de cloud", wordt dat echter steeds minder haalbaar omdat kostbare tijd verloren gaat met het kopiëren van de data. De aangeleerde technieken kunnen toegepast worden binnen een SQL-database, maar uiteraard ook op data die toch gekopieerd zijn, naar een omgeving die SQL ondersteunt, bijvoorbeeld naar een data warehouse (DW), of naar een Big Data-omgeving zoals Hadoop (met Hive) of Spark.

We gaan tijdens de training interactief aan de slag met de geavanceerde mogelijkheden die SQL biedt op dit vlak. Statistische, analytische en OLAP-functies komen aan bod, evenals het gebruik van SQL voor ETL en (indien van toepassing) voor MapReduce. De belangrijkste functionaliteiten worden aangehaald en besproken, en in realistische labs toegepast.

De hier gehanteerde SQL-syntax wordt op een platform-onafhankelijke manier besproken. Waar relevant worden extensies aangekaart voor wat betreft Oracle, Db2, SQL Server, Hive en Spark.

Aan het eind van deze opleiding:

  • begrijpen de deelnemers hoe SQL (i.h.b. het SELECT statement) gebruikt kan worden voor rapportering en data-exploratie voor DW, BI, Big Data en Data Science;
  • kunnen deelnemers praktisch omgaan met SQL vanuit de Data Warehouse / Data Lake / BI / Data Science optiek;
  • is men in staat te beoordelen welke SQL-formulering het meest geschikt is voor een specifieke vraagstelling; en kan men de voor- en nadelen van alternatieve formuleringen evalueren.

Kalender

datumduurtaalplaatsprijs 
01 dec2web based 1000 EUR (BTW-vrij)
SESSIE-INFO EN INSCHRIJVEN

Doelgroep

Deze cursus is bestemd voor iedereen die met business reporting of data-exploratie in aanraking komt, en daarbij --aan de hand van eigen geschreven SQL-- relationele databases of Hadoop (Hive) of Spark SQL dient te benaderen.

Voorkennis

Om deze cursus ten volle te laten renderen, dienen de deelnemers over een vlotte parate kennis van SQL te beschikken (niveau cursus SQL workshop plus ervaring met relatief complexe queries; het kan nuttig zijn, vooraf de cursus SQL voor gevorderden te volgen). Verder dient u vertrouwd zijn met elementaire statistische terminologie (zie b.v. Statistiek basiskennis).

Nuttig maar niet noodzakelijk: enig inzicht in de principes van data warehouses (zie b.v. onze cursus Moderne data warehousing en business intelligence) of Big Data (zie b.v. Big data architectuur en infrastructuur) en

Inhoud

  • Data warehouse, business intelligence, Data Science -- concepten en positionering
  • Extract / Transform / Load (ETL)
  • het dimensionele model
  • Statistiek en analyse -- mogelijkheden in SQL
  • Nut en context -- multi-platform ondersteuning.
  • AVG, CORRELATION, COUNT, COVARIANCE, MAX, MIN, RAND, STDDEV, SUM, VARIANCE, MEDIAN, ...
  • Online analytical processing in SQL
  • Nut en context -- multi-platform ondersteuning.
  • RANK, DENSE_RANK, ROW_NUMBER, PARTITION BY, ORDER BY, ROWS, RANGE, GROUP BY, GROUPING SETS, ROLLUP, CUBE, OVER
  • WINDOWING functies: SUM ... OVER ..., LEAD, LAG en gelijkaardige aggregate-functies en hun toepassing in o.a. trend-analyse.
  • Modellering: histogrammen; lineaire regressie; normality test; trend-analyse; betrouwbaarheidsintervallen; ...
  • Tekst-analyse; reguliere expressies

Verloop van de cursus

Klassikale opleiding met veel aandacht voor labs en oefeningen. Deze kunnen naar keuze gebeuren op Db2, Oracle, SQL Server, Hive of Spark. (Gelieve uw voorkeur aan te geven op het inschrijvingsformulier.)

Duur

2 dagen.

Docent

Peter Vanroose, Arnout Veugelen.

Reviews

goede verdieping op onderwerp SQL

 
  (, )

goed cursus met fijne afwisseling tussen theorie en praktijk

 
  (, )

Prima!

 
  (, )

Uitstekend. Goed.

 
  (, )

omdat ik persoonlijk wat minder goed de basis beheers, vond ik het bijtijden bijzonder pittig

 
  (, )

Goede cursus, veel theorie, misschien iets meer met praktijk voorbeelden en dan bedoel ik ook visueel tonen van uitkomst, niet alleen de query

 
  (, )

très bon

 
  (, )

excellente

 
  (, )

Ook interessant

Cursisten van deze training hebben ook volgende cursussen gevolgd:


SESSIE-INFO EN INSCHRIJVEN