Big data architectuur en infrastructuur

Iedereen is tegenwoordig aan de slag met "big data". Maar wat houdt dat precies in? Over welke data gaat het precies? Welke infrastructuur hebt u ervoor nodig? En wat levert het u op? Tijdens deze training gaan we op zoek naar antwoorden op deze vragen.

Data wordt hoe langer hoe crucialer voor om het even welke onderneming. Het analyseren van grote hoeveelheden data, met als doel het optimaliseren van bedrijfsprocessen, van marketing, van belangrijke beslissingen, ... is niet nieuw. Maar door de steeds toenemende data-volumes, de steeds grotere verscheidenheid aan databronnen, en de bredere beschikbaarheid van data, stelt zo'n analyse steeds grotere eisen aan de infrastructuur, de software, en de datamodellen. In zoverre zelfs dat een nieuw raamwerk nodig lijkt. Het klassieke, beproefde relationele datamodel lijkt niet meer te volstaan om de nieuwe uitdagingen van "data-analyse voor business-intelligence" te beschrijven en te sturen.

"Big data analytics" is de naam van dit overkoepelende raamwerk, waarin zowel oude modellen en technieken (zoals data warehousing, online analytic processing, Hadoop, clusteranalyse, ...) als nieuwere inzichten (data in motion, emotional text analytics, ...) elkaar gevonden hebben. De mogelijkheid om uit meer diverse, grotere, en sneller wijzigende data, toch nog relevante inzichten, tendenzen en voorspellingen te condenseren kan managers of andere decision makers helpen hun beslissingen beter te onderbouwen.

In deze cursus geven we een algemeen beeld van waar big data voor staat; we geven een overzicht van de technologieën die aan de basis liggen, en plaatsen de technologische kreten in context en perspectief waar we in deze wereld vertrouwd moeten mee geraken.

Kalender

Momenteel zijn er voor deze cursus geen publieke sessies gepland. Graag organiseren we een bedrijfssessie voor u of een extra publieke sessie (bij voldoende belangstelling). Geïnteresseerd? Laat het ons weten.

Doelgroep

Deze training is bedoeld voor iedereen die kennis wil maken met het onderwerp big data: IT-personeel, personen die met big data technologieën in aanraking komen. Ook voor niet IT-technische medewerkers.

Voorkennis

Elementaire kennis van database management systemen is een pluspunt.

Inhoud

  • Inleiding: over data, data bases, en data warehouses - en nu big data
  • Wat is big data?
  • Uitgangspunten: problematiek - waarom big data?
  • data-centrische bedrijfsvoering
  • de 4 V's: volume, variety, velocity, variability - types van data - voorbeelden
  • data-kwaliteit, consistentie, en betrouwbaarheid
  • Big data architectuur - componenten - technologieën - naar een geïntegreerde data architectuur
  • Opsomming van nieuwe databronnen: webstatistieken ("clickstreams"); sociale media; Twitter feeds; Google Maps; sensor-data (b.v. bewakingscamera's) en het "Internet of Things" (IoT); ...
  • NoSQL databases versus relationele databases - types en gebruik - en populair vandaag: MongoDB, Cassandra, ...
  • Big Data Frameworks
  • Het "divide & conquer" model: Hadoop en MapReduce - data distribueren en m.b.v. massief parallelle algoritmen analyseren
  • Spark : in memory dus hoge snelheid - en gevoed vanuit een verscheidenheid aan databronnen
  • Machine learning
  • Performance-overwegingen
  • Big data analytics - ken uw data -- of: de rol van de data scientist!
  • Hoe een goede inschatting maken van de datakwaliteit; risico-analyse - en het belang van statistiek
  • Gebruik van programeertalen: Python, R, Scala, ...
  • Gebruik van visualisatie-tools om het overzicht te behouden en het relatieve belang van verschillende data-bronnen in te schatten
  • Overzicht van veel gebruikte (open source) producten/technologieën op de markt

Verloop van de cursus

Klassikale opleiding.

Duur

1 dag.

Docent

Peter Vanroose, Kris Van Thillo.

Ook interessant

Cursisten van deze training hebben ook volgende cursussen gevolgd:


SESSIE-INFO EN INSCHRIJVEN