Principes fondamentaux de AI et ML en Python
Pendent cette formation pratique ABIS de 3 jours, vous apprenez analyser des données et construire des modèles IA en utilisant des outils ML avec Python, comme scikit-learn.
l'Intelligence Artificielle (IA, AI) nous promet que, si nous disposons de grandes quantités de données pertinentes (textes, images, détails des ventes, clics sur un site web, etc.), elle peut les utiliser pour construire un modèle. Un modèle est une représentation simplifiée de la réalité qui nous permet de décrire, d'expliquer et même de prédire des phénomènes. En effet, le modèle a détecté des «patterns» récurrents dans les données, ou plus précisément des relations entre les «caractéristiques» (features) des données. Il peut ainsi «deviner» (ou prédire) une caractéristique cible (mot suivant, pixel, pronostic de ventes par produit, tentative d''effraction, etc.) basé sur les autres données: p.ex. générer de nouveaux textes et images, ou déclencher une alarme.
Le processus semi-automatisé d''apprentissage et de mise à disposition des modèles IA est appelé apprentissage automatique (Machine Learning, ML) :
- Tout d''abord, les données pertinentes doivent être collectées et organisées en ce qu''on appelle «Data Frames».
- Ensuite, les données sont soumises à un ensemble d''algorithmes ML établis, pour construire une première version du modèle.
- Puis, le modèle doit être évalué pour garantir ses performances sur des données de validation non utilisées, c''est-à-dire pour minimiser les erreurs de prédiction.
- Un modèle sous-optimal doit être amélioré en recommençant: ajouter nouvelles sources de données, appliquer d''autres algorithmes de ML, modifier des paramètres de l''algorithme, etc.
Ce processus peut bien sûr être très lent (mais largement automatique), selon la taille de vos données d''entraînement. - Il peut être utile de visualiser les données pour faciliter ce processus (p.ex. pour présélectionner des données, choisir des algorithmes, des paramètres).
- Une fois prêt (et prometteur), le modèle peut être déployé en dehors de la configuration de ML, à des fins de prédiction, d''explication ou de prise de décision.
(Un modèle «tournant» est relativement léger et peut générer en continu des prédictions sur de nouvelles données entrantes.)
Ce processus s'applique à toutes les disciplines, de la physique et de l'économie au traitement d'images et au langage naturelle.
Des algorithmes de machine learning éprouvés ont été développés au cours des dernières décennies et ont été implémentés dans plusieurs langages.
Aujourd'hui, Python, et plus particulièrement des packages comme scikit-learn et PyTorch, sont des interfaces très populaires et conviviales pour cette vaste collection d'algorithmes disponibles. Les données, quel que soit leur format (fichier), peuvent facilement être chargées dans un Data Frame Python (Pandas), divisées en données d''entraînement et de validation, puis soumises aux processus de construction et d''évaluation de modèles. Python permet également de visualiser facilement un Data Frame.
L'un des modèles d'apprentissage automatique les plus simples et les plus fondamentaux est la régression linéaire. Ce modèle suppose que la relation entre les caractéristiques d'entrée et les caractéristiques cibles peut être exprimée comme une somme pondérée des entrées. Entraîner un modèle de régression linéaire implique de trouver les pondérations qui minimisent l''erreur de prédiction. Bien que souvent trop simpliste en soi, la régression linéaire est essentielle comme élément de base: les modèles plus avancés l''utilisent souvent en interne car sa modélisation est rapide et, de plus, elle évite «overfitting» (surapprentissage) aux données d''entraînement (ce qui rendrait les modèles moins prédictifs sur des données nouvelles et inédites).
Les réseaux de neurones artificiels (neural networks) étendent la logique de la régression linéaire à un cadre beaucoup plus flexible et puissant. Inspirés des neurones biologiques, ces modèles sont constitués de couches de nœuds interconnectés, chacun traitant les entrées via une somme pondérée et une fonction d'activation non linéaire. Des couches cachées transforment les entrées en représentations de plus en plus abstraites, permettant au réseau de capturer des relations complexes et non linéaires. Les réseaux de neurones effectuent ce que l''on appelle deep learning et constituent le fondement d''une grande partie de l''intelligence artificielle moderne.
Les réseaux de neurones peuvent être construits en Python, p.ex. avec le package PyTorch. Leur construction et leur évaluation sont certes plus chronophages et gourmandes en mémoire, mais promettent des résultats remarquablement bons, notamment dans les domaines du traitement d'images (par exemple, données de caméras de surveillance) et du traitement du langage naturel (NLP), grâce aux «large language models» (LLM).
- Ce cours vous permettra de vous familiariser avec les aspects pratiques élémentaires de l''intelligence artificielle (IA) et de l''apprentissage automatique (ML).
- Les étapes essentielles du processus ML seront abordées en détail: obtenir et organiser les données, sélectinner une famille de modèles, construire le modèle, valider sa qualité, trouver les paramètres optimaux du modèle, et (éventuellement) redémarrer en sélectionnant des données supplémentaires.
- Nous mettrons ces connaissances en pratique en construisant (et en utilisant) nos propres modèles ML en Python avec scikit-learn, une bibliothèque Python populaire pour ML.
- Nous examinerons également brièvement les réseaux neuronaux et le package PyTorch.
Planifier une session?
Formation interactive en temps réel – disponible en personne ou en ligne ou dans un format hybride. La formation peut être effectuée en français, en anglais ou en néerlandais.
DEMANDER FORMATION EN ENTREPRISE |
Calendrier publique des formations | |||||
---|---|---|---|---|---|
date | durée | lang. | lieu | prix | |
12 nov | 3 | web based | 2055 EUR (excl. TVA) | ||
12 nov | 3 | Leuven | 2055 EUR (excl. TVA) | ||
INFO SESSION ET INSCRIPTION |
Participants
Toute personne souhaitant pratiquer Machine Learning pour résoudre des problèmes concrets.
Connaissances préalables
Une bonne connaissance du langage de programmation Python est un prérequis (voir Python: cours de base). De l'expérience avec Pandas (voir cours Python pour l'analyse des données) et Jupyter Notebook est un avantage.
Contenu
- Présentation du processus pour la création et le déploiement de modèles d''IA.
- Concepts et techniques de base d'' IA et de ML:
- Supervised learning versus unsupervised learning
- Les données training & testing; cross-validation
- Précision; matrice de confusion
- Underfitting versus overfitting; compromis entre biais et variance
- Régularisation
- Automatiser la sélection de modèles: courbes de validation
- Les différents sortes de modèles à créer avec ML:
- Prédiction des attributs continus: p.ex. régression polynomiale, régression Ridge
- Classification: p.ex. régression logistique, anomaly detection, decision trees, random forests
- Clustering: p.ex. K-means
- Dimensionality reduction: PCA & LDA
- Brève introduction aux réseaux neuronaux et au "deep learning"
- Construire, valider et utiliser des modèles ML avec scikit-learn
Pédagogie
Enseignement en classe, axé sur des exemples pratiques et soutenu par des exercices approfondis et une pratique individuelle.
Certificat
À la fin du cours, le participant reçoit un «Certificat de réussite».
Durée
3 jours.
Formateur
Peter Vanroose (ABIS).
Reviews
4.0/5 (basé sur 15 évaluations; les plus récentes sont montrées ci-dessous)
|
It was a good course for anyone who does want to start machine learning.
| (N.N., Rabobank Nederland, ) |
I enjoyed the course it provided a very good introduction into the different aspects of ML
| (Alastair Grant, Rabobank Nederland, ) |
Excellent trainer with in-depth knowledge and excellent interpersonal skills. Course did holistic coverage of ML life cycle, that was great.
| (Nipun Bahri, Rabobank Nederland, ) |
the explanation of the course is clear and exercise is good and handable
| (N.N., Rabobank Nederland, ) |
Peter is an amazing instructor. Course is awesome.
| (N.N., Rabobank Nederland, ) |
Coherent, focused, hands on
| (Fasihul Islam, Rabobank Nederland, ) |
Aussi intéressant
Participants de ce cours ont aussi suivi les formations suivantes:
- La programmation en Python: cours de base
- Python Intermédiaire
- SQL pour l'analyse BI et Data Science
- SQL pour utilisateurs avancés
INFO SESSION ET INSCRIPTION |