SQL voor BI en Data Science

Tijdens deze cursus leert u hoe u aan data-analyse kan doen met behulp van SQL. Verrassend genoeg worden "in-database" analytics relatief weinig toegepast: meestal kopieert men de (productie-) data eerst naar een analyse-platform of BI-tool om daar de "data science" te doen, maar voor grote datavolumes, of voor data "in de cloud", wordt dat echter steeds minder haalbaar omdat kostbare tijd verloren gaat met het kopiëren van de data. De aangeleerde technieken kunnen toegepast worden binnen een SQL-database, maar uiteraard ook op data die toch gekopieerd zijn, naar een omgeving die SQL ondersteunt, bijvoorbeeld naar een data warehouse (DW), of naar een Big Data-omgeving zoals Hadoop (met Hive) of Spark.

We gaan tijdens de training interactief aan de slag met de geavanceerde mogelijkheden die SQL biedt op dit vlak. Statistische, analytische en OLAP-functies komen aan bod, evenals het gebruik van SQL voor ETL en (indien van toepassing) voor MapReduce. De belangrijkste functionaliteiten worden aangehaald en besproken, en in realistische labs toegepast.

De hier gehanteerde SQL-syntax wordt op een platform-onafhankelijke manier besproken. Waar relevant worden extensies aangekaart voor wat betreft Oracle, Db2, SQL Server, Hive en Spark.

Aan het eind van deze opleiding:

  • begrijpen de deelnemers hoe SQL (i.h.b. het SELECT statement) gebruikt kan worden voor rapportering en data-exploratie voor DW, BI, Big Data en Data Science;
  • kunnen deelnemers praktisch omgaan met SQL vanuit de Data Warehouse / Data Lake / BI / Data Science optiek;
  • is men in staat te beoordelen welke SQL-formulering het meest geschikt is voor een specifieke vraagstelling; en kan men de voor- en nadelen van alternatieve formuleringen evalueren.

Kalender

datumduurtaalplaatsprijs 
03 jun2Leuven 1200 EUR (excl. BTW)
03 jun2web based 1200 EUR (excl. BTW)
SESSIE-INFO EN INSCHRIJVEN

Doelgroep

Deze cursus is bestemd voor iedereen die met business reporting of data-exploratie in aanraking komt, en daarbij --aan de hand van eigen geschreven SQL-- relationele databases of Hadoop (Hive) of Spark SQL dient te benaderen.

Voorkennis

Om deze cursus ten volle te laten renderen, dienen de deelnemers over een vlotte parate kennis van SQL te beschikken (niveau cursus SQL workshop plus ervaring met relatief complexe queries; het kan nuttig zijn, vooraf de cursus SQL voor gevorderden te volgen). Verder dient u vertrouwd zijn met elementaire statistische terminologie (zie b.v. Statistiek basiskennis).

Nuttig maar niet noodzakelijk: enig inzicht in de principes van data warehouses (zie b.v. onze cursus Moderne data warehousing en business intelligence) of Big Data (zie b.v. Big data architectuur en infrastructuur) en

Inhoud

  • Data warehouse, business intelligence, Data Science -- concepten en positionering
  • Extract / Transform / Load (ETL)
  • het dimensionele model
  • Statistiek en analyse -- mogelijkheden in SQL
  • Nut en context -- multi-platform ondersteuning.
  • AVG, CORRELATION, COUNT, COVARIANCE, MAX, MIN, RAND, STDDEV, SUM, VARIANCE, MEDIAN, ...
  • Online analytical processing in SQL
  • Nut en context -- multi-platform ondersteuning.
  • RANK, DENSE_RANK, ROW_NUMBER, PARTITION BY, ORDER BY, ROWS, RANGE, GROUP BY, GROUPING SETS, ROLLUP, CUBE, OVER
  • WINDOWING functies: SUM ... OVER ..., LEAD, LAG en gelijkaardige aggregate-functies en hun toepassing in o.a. trend-analyse.
  • Modellering: histogrammen; lineaire regressie; normality test; trend-analyse; betrouwbaarheidsintervallen; ...
  • Tekst-analyse; reguliere expressies

Verloop van de cursus

Klassikale opleiding met veel aandacht voor labs en oefeningen. Deze kunnen naar keuze gebeuren op Db2, Oracle, SQL Server, MariaDB, Hive of Spark. (Gelieve uw voorkeur aan te geven op het inschrijvingsformulier.)

Duur

2 dagen.

Docent

Peter Vanroose, Arnout Veugelen.

Reviews

Zeer fijne instructeur/docent Neemt de tijd en weet de stof helder over te brengen.

 
  (, )

Ik ben zeer tevreden

 
  (, )

Het was een erg interessante cursus en Peter was een kundige docent.

 
  (, )

très bon

 
  (, )

excellente

 
  (, )

Ook interessant

Cursisten van deze training hebben ook volgende cursussen gevolgd:


SESSIE-INFO EN INSCHRIJVEN