Le Big Data apparaît aujourd'hui comme une continuité logique et une évolution naturelle du décisionnel. Cet article se propose de faire un retour sur les fondamentaux de la Business Intelligence et ce qui a fait son succès. C'est le premier article d'une série de trois sur le thème "De la BI au Big Data", déjà publié sur le blog des Big Data Les principes de la Business Intelligence Le décisionnel est basé sur un principe simple: la nécessité de construire une architecture dédiée avec une modélisation adaptée. En effet, l'utilisation directe des bases de production pour l'analyse de données pose trois problèmes principaux: Une dégradation du fonctionnement des applications opérationnelles et de la qualité de service requise (SLA) du fait de la non prévisibilité du nombre et de la nature des requêtes Des temps de réponses aux requêtes insatisfaisants du fait d'un modèle en troisième forme normale (3FN) non adapté à des requêtes d'évolution ou de tendances s'appuyant sur un nombre important de lignes dans les tables (plusieurs millions à plusieurs milliards).
Evaluation et Certification Chaque partie se termine par un quiz validant les acquis des différentes sessions vidéos. Un quiz final faisant suite à un projet validera l'ensemble du MOOC. Vous pouvez passer vos quiz et travailler sur votre mini-projet quand vous le souhaitez. Néanmoins, il faudra patienter un peu pour obtenir votre attestation: il y aura 3 sessions d'évaluation dans l'année: le 16 mars, le 20 juillet et le 22 novembre 2018. Plan de cours Semaine 0: Introduction - Les enjeux du Big Data et de ce MOOC Semaine 1: Python Partie 1 / Algèbre Partie 1 Semaine 2: Limites des bases de données relationnelles / Python Partie 2/ Algèbre Partie 2 Semaine 3: Probabilités Partie 1 / Analyse Partie 1 Semaine 4: Probabilités Partie 2 / Analyse Partie 2 Semaine 5: Statistique Semaine 6: Le classifieur Perceptron
Jean-Guillaume Birot 07-05-2020 L'information est très générale mais utile. Cela balaie tout surement un peu trop vite pour un non informaticien. La formatrice semble suivre son script sans toutefois être à l'aise avec les notions qu'elle présente, surtout technique. Pas toujours très vivant comme façon de présenter (texte lu + slides). Les concepts techniques sont mal présentés. Un non informaticien n'y comprendra rien. La notion de Cluster et les noms comme Hadoop ou Spark apparaissent trop tôt dans le discours, alors qu'ils sont expliqués à la fin. Corriger les fautes sur les slides ("ATOUR DU BIG DATA".... le titre revient sur plusieurs slides). Ce cours a juste le mérite d'identifier les sujets à creuser. Il va générer plus de questions que de réponses mais en 32 mn, c'est pas mal d'en arriver là. Note: quand on prononce avec l'accent "anglais" autant avoir la bonne prononciation. SQL se prononce "Sequel" en anglais. JSON = Jay-zon. Hadoop = ha-doup. in
Stéphan Clémençon Professeur au département Traitement du Signal et de l'Image de Télécom ParisTech. Ses recherches portent sur la théorie statistique de l'apprentissage. Il a récemment encadré des projets de recherche nationaux théoriques et appliqués sur ce thème. Il est responsable du Mastère Spécialisé «Big data: Gestion et analyse des données massives» et du Certificat d'Etudes Spécialisées «Data Scientist». Pierre Senellart Professeur à l'École normale supérieure et responsable de l'équipe Valda d'Inria Paris, anciennement professeur à Télécom ParisTech. Ses intérêts de recherche portent sur les aspects pratiques et théoriques de la gestion de données du Web, en particulier le crawl et l'archivage du Web, l'extraction d'informations depuis le Web, la gestion de l'incertitude, la fouille du Web, et la gestion de données intensionnelles. Anne Sabourin Enseignant-chercheur au département Traitement du Signal et de l'Image de Télécom ParisTech. Ses recherches portent sur l'apprentissage statistique et les méthodes bayésiennes, en particulier pour l'analyse des valeurs extrêmes et la détection d'anomalies.
Prochaines sessions (2 jours): 9 et 10 mai 2022 à Paris 21 et 22 novembre 2022 à Paris Formation aussi disponible dans vos locaux (sur demande) A propos Cette formation comprendre les fondamentaux du big data et de la data science est basée sur des cas pratiques afin de vous familiariser avec les concepts du big data et de la data science. Vous apprendrez par des exemples à comprendre l'environnement du big data (Hadoop, Spark, Kafka…) et ses applications (open data, internet des objets…). Cette formation big data vise un public d'analystes, de chargés d'études voulant comprendre les enjeux liés au big data et ne demande aucun prérequis techniques. Inscrivez-vous!
785cq.vip, 2024