Science des données 3
Licence 3 MIASHS
Université de Lille
Semestre 2, 2024-2025
Objectifs de ce module
Ce module a pour objectif d'approfondir les UEs science des données 1 et 2.
L'un des principaux sujets qui seront abordés durant ce module est l'apprentissage non supervisé.
Outre la maîtrise d'un certain nombre de notions, l'étude de la science des données nécessite la mise en pratique via la confrontation avec des études de cas.
Aussi, une grande partie du module sera tournée vers la mise en pratique.
R et python sont deux environnements extrêmement puissants utilisés en science des données. Ils ont chacun leurs avantages et leurs inconvénients. Par cohérence avec le reste de la formation de licence MIASHS, la mise en pratique sera réalisée en python.
Une connaissance minimale de python est indispensable pour suivre ce cours. En aucun cas ce cours n'est un cours de python. En cas de besoin, lire cet ouvrage pour une présentation complète du langage.
Calendrier
Les séances se déroulent les mardis matins de 8h à 10h. La première séance se déroule le mardi 7 janvier 2025.
Mise en pratique
Quelques règles à respecter :
- Il faut travailler sous Ubuntu (ou plus généralement, Linux) : c'est le meilleur moyen d'éviter des bugs. Si vous travaillez sous Windows, vous allez rencontrer des bugs dus à Windows et je ne pourrais pas vous aider à les résoudre.
- Quand vous me rendez un TP (ou un contrôle) :
- je ne veux pas de notebook : je veux un fichier python qui, quand je l'exécute dans une console Linux en tapant une commande telle que python nom-du-fichier.py, fait ce qui est demandé dans le sujet.
- Je ne dois pas devoir modifier votre fichier. En particulier, attention si vous supposez que le fichier de données est contenu dans votre répertoire courant (ou un autre) sur votre ordinateur. Dans le programme que vous me rendez, le fichier de données est chargé via son url.
- Ce qu'affiche votre programme doit être clair et compréhensible : cet affichage doit répondre aux questions du sujet.
- Un programme python doit être commenté et correctement présenté. Il commence toujours par un commentaire indiquant le nom de la personne qui l'a écrit et le TP (ou contrôle) auquel il répond.
- On n'importe que les bibliothèques qui sont utilisées.
Contrôle de connaissances
Le contrôle de connaissances est continu. Il y aura 2 épreuves durant le semestre.
Pré-requis