L'architecture et l'infrastructure Big Data

Tout le monde travaille maintenant avec "Big Data". Mais qu'est-ce que cela signifie exactement? Quelles sont les données exactement? De quelle infrastructure avez-vous besoin? Et qu'est-ce que cela vous rapporte? Au cours de cette formation, nous chercherons des réponses à ces questions.

Les données deviennent de plus en plus cruciales pour toute entreprise. Analyser de grandes quantités de données, dans le but d'optimiser les processus métier, le marketing, les décisions importantes, etc., n'est pas nouveau. Cependant, en raison des volumes de données toujours croissants, de la variété toujours croissante des sources de données et de la plus grande disponibilité des données, une telle analyse impose des exigences de plus en plus grandes sur l'infrastructure, les logiciels et les modèles de données. Un nouveau cadre semble donc être nécessaire: le modèle de données relationnelles classique et éprouvé n'est plus suffisant pour décrire et gérer les nouveaux défis de "l'analyse de données pour la veille économique".

"Big Data Analytics" est le nom de ce framework global, dans lequel les anciens modèles et techniques (tels que l'entreposage de données, le traitement analytique en ligne, Hadoop, l'analyse de cluster, ...) et les nouvelles informations (données en mouvement, analyse de texte émotionnel, ..) .) se sont trouvés. La possibilité d'extraire - à partir de données changeantes plus variées, plus grandes et plus rapides - des aperçus, des tendances et des prédictions, peuvent aider les gestionnaires ou d'autres décideurs à mieux justifier leurs décisions.

Dans ce cours, nous donnons une image générale de ce que signifie "Big Data"; nous fournissons un aperçu des technologies sous-jacentes et plaçons le jargon technique dans son contexte.

Calendrier

Il n'y a pas de sessions publiques à ce moment. Nous organisons volontiers un cours en entreprise ou une session publique supplémentaire (en cas d'un nombre suffisant de participants). Intéressé? Contactez-nous.

Participants

Cette formation est destinée à tous ceux qui veulent se familiariser avec big data: le personnel informatique, les personnes qui entrent en contact avec les technologies big data. Ainsi que pour le personnel technique non informatique.

Connaissances préalables

Une connaissance élémentaire des systèmes de gestion de bases de données est un plus.

Contenu

  • Introduction: à propos des données, des bases de données et des entrepôts de données - et maintenant big data
  • Qu'est-ce que c'est que big data?
  • Points de départ: problématique - pourquoi big data?
  • gestion centrée sur les données
  • les 4 Vs: volume, variété, vitesse, variabilité - types de données - exemples
  • la qualité des données, la cohérence et la fiabilité
  • L'architecture big data - composants - technologies - vers une architecture de données intégrée
  • Énumération de nouvelles sources de données: statistiques Web («clickstreams»); les médias sociaux; Twitter; Google Maps; des données capteurs (par exemple des caméras de surveillance) et l'internet des objets (IoT); ...
  • Bases de données NoSQL versus bases de données relationnelles - types et usages - populaires aujourd'hui: MongoDB, Cassandra, ...
  • Big data frameworks
  • Le modèle "divide & conquer": Hadoop et MapReduce - distribuer les données et les analyser à l'aide d'algorithmes parallèles solides
  • Spark: en mémoire (donc haute vitesse) - et alimenté à partir d'une variété de sources de données
  • Machine learning
  • Considérations de performance
  • Big data analytics - connaissez vos données - ou: le rôle du data scientist!
  • Comment faire une bonne estimation de la qualité des données; l'analyse des risques - et l'importance des statistiques
  • Utilisation de langages de programmation: Python, R, Scala, ...
  • Utilisation d'outils de visualisation pour garder une vue d'ensemble et estimer l'importance relative des différentes sources de données
  • Vue d'ensemble des produits / technologies couramment utilisés (open source) sur le marché

Pédagogie

Cours théorique agrémenté d'exemples pratiques.

Durée

1 jour.

Formateur

Peter Vanroose, Kris Van Thillo.

Reviews

Covered all the general topics

 
  (, )

I think it was a very rich and useful overview

 
  (, )

Voor een beginner op dit gebied was het perfect

 
  (, )

Aussi intéressant

Participants de ce cours ont aussi suivi les formations suivantes:


INFO SESSION ET INSCRIPTION