home 
 
 
 
enfr
 
Home
Over ABIS
Diensten
Cursussen
Resources
Contact
MyABIS
C
Alle CursussenbalkjeAlgemeen » Introductie HW & SW » Soft skills » TrajectenOperating Systems » MVS - z/OS » UNIX - Linux - AIX » Mac OS X » iPad en iPhone iOSDatabases en middleware » Relationele databases & SQL » DB2 for z/OS » DB2 for LUW » Oracle » SQL Server » MySQL & MariaDB » IMS » CICS » IBM MQ » WebSphere » Big data en analyticsApplicatieontwikkeling » Methoden en technieken » TOGAF » PRINCE2 » Agile en Scrum » Programmeertalen » Internet development » Object Oriented systems » Java » Development tools » SAS » XML » SOA & web servicesSysteembeheer » ITIL » SecuritybalkjePraktischInschrijven 
R voor data-analyse

Doel

Data-analyse voor "business intelligence" begint met het verzamelen, opslaan, en zinvol samenvatten van enterprise data, die tegenwoordig gegenereerd worden door een diversiteit aan databronnen (click streams, sociale media, relationele data, sensor-data, ...)

Een populair tool voor dit soort analyse is R. Z'n populariteit wordt deels verklaard doordat R vrije open source software is, maar vooral eigenlijk doordat een groeiend aantal extensie-packages beschikbaar gesteld worden die zich richten op praktische "use cases" in dit breed BI en Big Data universum.

Deze cursus geeft u hands-on praktijk met R, zowel als een data-analyse en grafisch tool, en als een programmeer- en scripting-omgeving waarmee het systeem kan gevraagd worden, u elk mogelijk inzicht in uw data te verschaffen.

Inhoud

Deel I - R fundamentals

  • Getting started
  • installeren van R (Linux / Windows / MAC)
  • leren gebruiken van de command-line interface en de Rstudio GUI
  • eerste stappen met R: interactieve commando's; opvragen van on-line hulp
  • basisconcepten: expressies (numeriek, tekstueel); commando's & functies; variabelen & toekennen van waarde
  • R basics
  • "atomaire" datatypes en hoe constanten te noteren: double (numeric), character, integer, logical
  • operatoren voor numerieke en logische data
  • de speciale waarden Inf, NaN, NA
  • het "vector"-type; operator "c()"; zgn. coercing; vector-operatoren
  • het "package"-concept in R
  • CRAN en www.r-project.org
  • Meer "gestructureerde" datatypes
  • lijsten (hiërarchische data) en matrices
  • Functies en attributen
  • positionele parameters en naam-parameters
  • creëer uw eigen functies
  • R-scripts; het opstartscript; scope van variabelen; commentaar schrijven
  • dump, load, source en verwante commando's
  • dir, ls, getwd en setwd
  • package loading, of het gebruik van de "::" notatie
  • control flow: if, while, for
  • de expliciete "print"-functie; de "cat"-functie
  • andere nuttige functies: length, names, dimnames, unlist, cbind, rbind, c, as.<type>, is.<type>, order(vector), ...

Deel II -- Data analytics met R

  • Structuur-data
  • Objecten en attributen
  • lists, names(), dimnames(), factors
  • lezen / schrijven van (structuur)data van/naar bestanden: read.table; read.csv; readLines, write.csv, ...
  • hoe geheugen-efficiënt werken bij grote volumes aan gegevens
  • data-frames
  • hoe een database gebruiken als "back store"
  • Packages
  • hoe een (third party) R package installeren
  • voorbeelden: het "stats"-package en het "ggplot2"-package
  • andere nuttige packages: foreign (lezen/schrijven van data uit o.a. SAS, SPSS, dBase); XML; AER; tm; vcd; DBI
  • Statistische technieken
  • Random Number Generators
  • sampling, resumeren: basis statistische terminologie & technieken
  • voorbeelden van het "stats"-package; de lm-functies
  • plotten van statistische grafieken (spreidingsdiagrammen, histogrammen, trendlijnen, ...)
 

Doelgroep

Eenieder die praktisch aan de slag wil met data-analyse in een "big data"-context: ontwikkelaars, data-architecten, marketeers, en iedereen die z'n bedrijfsdata wil manipuleren, visualiseren, of samenvatten. Deze cursus is terzelfdertijd een eerste introductie tot de programmeertaal R, dus is ook iedereen welkom die met R wil beginnen of één van z'n packages wil gebruiken.

Voorkennis

Dit is een beginnerscursus, er is dus geen technische voorkennis vereist. Vertrouwdheid met de concepten van data stores en i.h.b. "big data" is uiteraard aangewezen (zie b.v. Big data concepten), net zoals enige notie van statistiek (cf. Statistiek basiskennis). Verder verwachten we dat u vertrouwd bent met de concepten van een programmeertaal (zie b.v. Programmeren: basiscursus).

Verloop van de cursus

Klassikaal onderricht, waarbij de nadruk ligt op praktische voorbeelden, en ondersteund door uitgebreide oefeningen en individuele praktijk.

Docenten

Peter Vanroose.

Duur

3 dagen.

Kalender

U kunt zich inschrijven door te klikken op een datum
datumduurtaal  plaats  prijs
23 Oct3NWoerden  (NL)1425 EUR  (BTW-vrij) 
15 Nov3?Leuven  (BE)1425 EUR  (excl. BTW)