Introduction data science
Data science
Master 2 ISIDIS
S´ebastien Verel
verel@lisic.univ-littoral.fr
http://www-lisic.univ-littoral.fr/~verel
Universit´e du Littoral Cˆote d’Opale
Laboratoire LISIC
Equipe OSMOSE
Data science
Data scientist
Big data
Processus en data science
Information
But, ´evaluation, objectifs, support de cours, bibliographie :
cf. siteweb
Data science
Data scientist
Big data
Processus en data science
Bibliographie
Le cours et les supports reposent principalement sur ces sources
bibliographiques :
Data Science : fondamentaux et ´etudes de cas
Machine Learning avec Python et R
Eric Biernat, Michel Lutz, 2015.
Data science
Data scientist
Big data
Processus en data science
Bibliographie
Big Data et Machine Learning
Manuel du data scientist Pirmin Lemberger, Marc Batty, 2015.
Data science
Data scientist
Big data
Processus en data science
Bibliographie
Que les auteurs en soient remerci´es chaleureusement !
Data science
Data scientist
Big data
Processus en data science
Contenu G´en´eral
A Machine learning :
Bases du data scientist
regression lin´eaire, logistique, bayesien naif, etc.
Les outils avanc´es
Concepts g´en´eraux
random forest, gradient boosting, SVM, etc.
grandes dimensions, ´evaluation de mod`eles, etc.
B Hadoop avec Map-reduce :
Syst`eme HDFS
Map-reduce : exemples de bases
Map-reduce : exemples avanc´es
Framework pig
C NoSQL pour le big data :
Pr´esentation, diff´erence SQP/noSQL
Quelques impl´ementations : Hbase, Sqoop, Hive, etc.
Machine learning en big data (mahout, Mllib)
Data science
Data scientist
Big data
Processus en data science
R´esoudre des probl`emes
ah ! r´esoudre des probl`emes…
Panne d’une voiture
Connaitre l’opinion sur un sujet dans les r´eseaux sociaux
Pr´evoir la consommation ´electrique
Data science
Data scientist
Big data
Processus en data science
Une d´efinition
Data science
”D´emarche empirique qui se base sur des donn´ees
pour apporter une r´eponse `a des probl`emes”
Data science : fondamentaux et ´etudes de cas, E. Biernat, M.
Lutz, Eyrolles, 2015.