AI en Machine Learning met Python: basiskennis
Tijdens deze driedaagse praktische ABIS-opleiding leert u data analyseren en AI-datamodellen bouwen m.b.v. ML-tools in Python zoals scikit-learn.
Artificiële intelligentie (AI) belooft ons dat, als we over grote hoeveelheden relevante data beschikken (tekst, afbeeldingen, verkoopgegevens, website-clicks, ...), er een model van kan worden gebouwd. Een model is een vereenvoudigde weergave van de werkelijkheid, en we kunnen er verschijnselen mee beschrijven, verklaren en zelfs voorspellen. Het model detecteert terugkerende "patronen" in de data, of meer specifiek: relaties tussen de "features" van de data. Daardoor kan het nu output-features (volgend woord, pixel, verkoopprognose per product, poging tot inbraak, ...) "raden" (of voorspellen) op basis van de rest van de data, bijvoorbeeld nieuwe teksten en afbeeldingen genereren of alarmen activeren.
Het semi-geautomatiseerde proces van het trainen (d.w.z. leren) en beschikbaar stellen van AI-modellen wordt Machine Learning (ML) genoemd:
- Eerst moeten relevante data worden verzameld en georganiseerd in zogenaamde DataFrames.
- Vervolgens wordt de data door een reeks state-of-the-art ML-algoritmen gestuurd om een eerste versie van het datamodel te bouwen.
- Dan moet het model worden geëvalueerd, om te garanderen dat het goed presteert op ongeziene validatie-data, d.w.z. om voorspellingsfouten te minimaliseren.
- Een suboptimaal model moet worden verbeterd door te herbeginnen: nieuwe gegevensbronnen toevoegen, andere machine learning-algoritmen toepassen, algoritmeparameters wijzigen, ...
Dit kan natuurlijk een zeer tijdrovend (maar grotendeels automatisch) proces zijn, afhankelijk van de omvang van uw trainingsdata. - Het kan nuttig zijn om de data te visualiseren om dit proces te helpen (zoals het selecteren van features, algoritmen of parameters).
- Wanneer het model klaar is (en veelbelovend), kan het buiten de machine learning-opstelling worden ingezet voor voorspelling, begrip of besluitvorming.
(Een "draaiend" model is relatief licht en kan continu voorspellingen genereren op basis van nieuwe binnenkomende data.)
Dit proces kan toegepast worden in alle disciplines, van fysica en economie tot beeldverwerking en taal.
In de afgelopen decennia werden meerdere machine learning-algoritmen ontwikkeld en in verschillende talen geïmplementeerd. Tegenwoordig zijn Python, en meer specifiek pakketten zoals scikit-learn en PyTorch, zeer populaire en gebruiksvriendelijke front-ends voor deze grote verzameling beschikbare software. Data in elk (bestands)formaat kan eenvoudig worden geladen in een Python (Pandas) Data Frame, opgesplitst in trainings- en validatie-data, en vervolgens door het leer- en evaluatieproces worden geleid. Python laat ook eenvoudig toe, een Data Frame te visualiseren.
Een van de eenvoudigste en meest fundamentele machine learning-modellen is lineaire regressie. Dit model gaat ervan uit dat een doel-feature kan worden uitgedrukt als een gewogen som van de invoer-features. Het trainen van een lineair regressiemodel betekent: het vinden van gewichten die de voorspellingsfout minimaliseren. Hoewel lineaire regressie op zichzelf vaak te simplistisch is, is het cruciaal als bouwsteen: geavanceerdere modellen gebruiken het vaak intern omdat de modellering snel is; bovendien wordt overfitting vermeden (waardoor modellen meer voorspellend vermogen hebben voor nieuwe, ongeziene data).
Artificiële neurale netwerken breiden de logica van lineaire regressie uit tot een veel flexibeler en krachtiger framework. Geïnspireerd door biologische neuronen bestaan deze modellen uit lagen van onderling verbonden knooppunten, die elk input verwerken via een gewogen som en een niet-lineaire activeringsfunctie. Verborgen lagen transformeren de input naar steeds abstractere representaties, waardoor het netwerk complexe, niet-lineaire relaties kan vastleggen. Neurale netwerken voeren zogenaamde deep learning uit en vormen de basis voor een groot deel van moderne artificiële intelligentie.
Neurale netwerken kunnen in Python worden gebouwd, bijvoorbeeld met het PyTorch-pakket. Het bouwen en evalueren ervan kost uiteraard meer tijd en geheugen, maar belooft opmerkelijk goede resultaten, vooral op het gebied van beeldverwerking (bijvoorbeeld bewakingscamera-beelden) en natuurlijke taalverwerking (NLP), met zogenaamde large language models (LLM''s).
- We starten deze opleiding met de eerste praktische aspecten van gaan stap voor stap aan de slag met de basisprincipes van Artificiële Intelligentie (AI) en Machine Learning (ML).
- De essentiële stappen in het ML-proces worden in detail behandeld: data verkrijgen en organiseren, een model-familie selecteren, het model trainen, de kwaliteit ervan valideren, optimale model-parameters vinden, en dan eventueel herbeginnen (met nieuwe data toe te voegen).
- Deze kennis wordt dan in de praktijk gebracht door zelf Machine Learning-modellen te trainen (en te gebruiken) in Python met scikit-learn, een populaire Python-bibliotheek voor ML.
- We bekijken ook kort neurale netwerken, en het Python-pakket PyTorch.
Opleiding inplannen?
Een interactieve, live training - gegeven in een fysiek klaslokaal of online, of in een hybride vorm. De cursus kan gegeven worden in het Nederlands, Engels of Frans.
BEDRIJFSOPLEIDING AANVRAGEN |
Publieke opleidingskalender | |||||
---|---|---|---|---|---|
datum | duur | taal | plaats | prijs | |
12 nov | 3 | web based | 2055 EUR (excl. BTW) | ||
12 nov | 3 | Leuven | 2055 EUR (excl. BTW) | ||
SESSIE-INFO EN INSCHRIJVEN |
Doelgroep
Iedereen die Machine Learning hands-on nodig heeft om realistische problemen op te lossen in de praktijk.
Voorkennis
Een voldoende basiskennis van Python is een vereiste (zie Python: basiscursus). Kennis van Pandas (zie cursus Python voor data-analyse) en van Jupyter Notebook is een voordeel.
Inhoud
- Overzicht van het data-pipeline-proces voor het creëren en het gebruiken van AI-modellen.
- Basisconcepten en technieken van AI en Machine Learning:
- Supervised learning versus unsupervised learning
- Train- & test-data; cross-validatie
- Nauwkeurigheid; "confusion"-matrix
- Overfitting versus onderfitting; afweging bias/variantie
- Regularisatie
- Automatiseren van modelselectie: validatiecurves
- De verschillende soorten modellen die met behulp van Machine Learning kunnen getraind worden:
- Voorspellen van continue features: b.v. polynomiale regressie, Ridge-regressie
- Classificatie: b.v. logistische regressie, anomalie-detectie, beslissingsbomen, random forests
- Clustering: b.v. K-means
- Dimensionaliteitsreductie: PCA & LDA
- Een korte introductie tot neurale netwerken en deep learning
- Machine Learning-modellen bouwen, valideren en gebruiken met scikit-learn
Verloop van de cursus
Klassikale opleiding, met nadruk op demo's en diepgaande individuele praktische oefeningen.
Certificaat
Na afloop van de sessie ontvangt de deelnemer een “Certificaat van deelname”.
Duur
3 dagen.
Docent
Peter Vanroose (ABIS).
Reviews
4.0/5 (gebaseerd op 15 evaluaties; de meest recente worden hieronder getoond)
|
It was a good course for anyone who does want to start machine learning.
| (N.N., Rabobank Nederland, ) |
I enjoyed the course it provided a very good introduction into the different aspects of ML
| (Alastair Grant, Rabobank Nederland, ) |
Excellent trainer with in-depth knowledge and excellent interpersonal skills. Course did holistic coverage of ML life cycle, that was great.
| (Nipun Bahri, Rabobank Nederland, ) |
the explanation of the course is clear and exercise is good and handable
| (N.N., Rabobank Nederland, ) |
Peter is an amazing instructor. Course is awesome.
| (N.N., Rabobank Nederland, ) |
Coherent, focused, hands on
| (Fasihul Islam, Rabobank Nederland, ) |
Ook interessant
Cursisten van deze training hebben ook volgende cursussen gevolgd:
SESSIE-INFO EN INSCHRIJVEN |