Category Archives: Big Data

Analyse des données mutlidimensionnelles

Analyse des données multidimensionnelles… par fr-universite-numerique

L’objectif de ce cours est de comprendre et appliquer les quatre méthodes fondamentales de l’analyse des données : analyse en composantes principales, analyse factorielle des correspondances, analyse des correspondances multiples et classification ascendante hiérarchique.

Il a été conçu en vue des applications : une large place est donnée aux exemples et à la mise en œuvre logicielle (logiciel FactoMineR de R). La présentation des méthodes recourt le moins possible au formalisme mathématique en privilégiant l’approche géométrique.

L’objectif est de rendre les participants autonomes dans la mise en œuvre et l’interprétation d’analyses exploratoires multidimensionnelles.

Début des cours : le 2 mars 2015.

Des Bases de Données à Big Data

Des Bases de Données à Big Data par fr-universite-numerique

Des dizaines de systèmes de données existent aujourd’hui. L’objectif premier du cours est d’avoir une grille de lecture conceptuelle des différents systèmes de données en approfondissant les principaux standards.

Une introduction pluridisciplinaire permet aux apprenants d’avoir une vision stratégique du futur des systèmes d’information autour des concepts de « mobiquité et BIG DATA ». Ensuite, sont présentés les concepts fondamentaux des bases de données et du BIG DATA avec leurs paradigmes et propriétés en support : TIPS /ACID, RICE, WHAT/BASE et CABS de Google. Les approches Top Down et Bottom Up d’intégration des données permettent ensuite d’explorer les différents paradigmes des systèmes de données.

Ce cours est un prérequis fondamental pour tous les étudiants en informatique (IUT, Licence, Master) souhaitant faire un Master en nouvelles technologies comme le MBDS (Mobiquité, Bases de Données et Intégration de Systèmes) de l’Université de Nice Sophia Antipolis. Il s’adresse aussi aux industriels de l’ informatique qui souhaitent une clarification des concepts de bases de données et de Big Data.

Il s’agit d’un cours hebdomadaire sur 10 semaines. Chaque semaine, de 7 à 10 courtes séquences vidéo de moins de 10 minutes seront proposés à participants. Ces séquences seront accompagnés des questions et des travaux pratiques, ainsi que des forums de discussion. Des QCM permettront d’évaluer les connaissances à la fin de chaque semaine. L’équipe enseignante interviendra une fois par semaine pour répondre aux questions les plus fréquentes du forum par une conférence en ligne (via l’outil Google Hangouts).

Les réponses aux QCM de chaque semaine ainsi que le rendu du travail pratique évalué par les pairs permettront la délivrance de l’attestation de suivi avec succès.

Fin des inscriptions13 Feb 2015
Début du Cours: 01 déc 2014
Fin des cours : 13 févr 2015
Effort estimé: 03:00 h/semaine

Data Mining

At completion of this Specialization in Data Mining, you will know the basic concepts in pattern discovery and clustering in data mining, information retrieval, text analytics, and visualization, understand the major algorithms for mining both structured and unstructured text data, and be able to apply the learned algorithms to solve real-world data mining problems.

prochaine Session : Février 2015
Durée: 4 weeks
Quantité de travail estimée: 4-6 hours/week

Learning from data

Commence le 25 septembre.

Introductory Machine Learning course covering theory, algorithms and applications. Our focus is on real understanding, not just “knowing.”

About this Course

This is an introductory course in machine learning (ML) that covers the basic theory, algorithms, and applications. ML is a key technology in Big Data, and in many financial, medical, commercial, and scientific applications. It enables computational systems to automatically learn how to perform a desired task based on information extracted from the data. ML has become one of the hottest fields of study today, taken up by undergraduate and graduate students from 15 different majors at Caltech. This course balances theory and practice, and covers the mathematical as well as the heuristic aspects. The lectures follow each other in a story-like fashion:

What is learning?
Can a machine learn?
How to do it?
How to do it well?
Take-home lessons.
The topics in the story line are covered by 18 lectures of about 60 minutes each plus Q&A.

Lecture 1: The Learning Problem
Lecture 2: Is Learning Feasible?
Lecture 3: The Linear Model I
Lecture 4: Error and Noise
Lecture 5: Training versus Testing
Lecture 6: Theory of Generalization
Lecture 7: The VC Dimension
Lecture 8: Bias-Variance Tradeoff
Lecture 9: The Linear Model II
Lecture 10: Neural Networks
Lecture 11: Overfitting
Lecture 12: Regularization
Lecture 13: Validation
Lecture 14: Support Vector Machines
Lecture 15: Kernel Methods
Lecture 16: Radial Basis Functions
Lecture 17: Three Learning Principles
Lecture 18: Epilogue