Le parcours MIND était précédemment nommé parcours DAC.
Tous les secteurs industriels et économiques sont confrontés à une explosion de données générées par leurs activités et collectées par des infrastructures (capteurs, réseaux, bases de données) de plus en plus performantes. Les acteurs concernés découvrent progressivement le potentiel de ces données pour l’enrichissement et l’optimisation de leur activité grâce à des nouvelles technologies informatiques pour stocker, gérer et analyser des grandes quantités de données et des outils avancés pour extraire et visualiser de l’information utile et synthétique.
Le développement de ces nouveaux outils nécessite des expertes et experts en « science de données » (data scientists) avec des connaissances fondamentales en informatique et en statistique et une bonne maîtrise des technologies informatiques associées.
Objectifs
L’objectif pédagogique du parcours MIND est de donner des connaissances fondamentales concernant tous les domaines de l’intelligence artificielle centrée sur l’utilisation de données, la production de connaissances et l’implémentation de services intelligents :
- les bases de données pour la collecte, le stockage, la gestion et l’interrogation de grandes quantités de données complexes, la recherche d’information et la fouille de données pour le filtrage, l’analyse et l’extraction d’informations,
- l’apprentissage automatique pour extraire des modèles statistiques et symboliques à partir de données imparfaites,
- l’intelligence computationnelle pour raisonner et exploiter des connaissances extraites à partir des données.
Débouchés
Les métiers visés par le parcours MIND sont des emplois de concepteurs, de développeurs et d’utilisateurs d’outils intelligents dans tous les domaines importants nécessitant des compétences fortes en traitement, analyse, enrichissement des données. L’expertise nécessaire pour ces métiers évoluent rapidement et nécessite le suivi continu des activités et résultats scientifiques concernés. Le parcours MIND vise également des emplois dans la recherche scientifique et la R&D.
On peut citer les domaines suivants :
- Chercheur en IA, développeur d’architecture de deep-learning pour les données textuelles, image ou signal
- Gestion du Web, Web advertising, Conception de plateformes sociales
- Business Intelligence, Customer Relationship Management (CRM)
- Recherche d’informations et moteurs de recherche sur le web et dans des plateformes sociales
- Database tuning (administrateur de BD), Data analyst, Data architect, Data Engineer, Data manager on distributed architectures (cloud, data grid, data center), Scientific data manager, technology watch, Web architect
Les entreprises typiquement intéressées par le profil des étudiantes et étudiants de ce parcours sont
- des acteurs du traitement de l’information, industriels (Dassault System, Google, Amazon) ou publics (BNF, INA, Etalab, Internet memory),
- des nouveaux spécialistes de la fouille de données, des start-ups aux licornes émergentes (Exalead, BlogSpirit, Dataiku),
- des grandes entreprises exploitant des solutions complexes SAP (Renault, L’Oréal, Accenture, Total) ,
- ainsi que toutes les entreprises, grandes ou petites, qui structurent leur gestion des données et développent une politique de valorisation.
Le parcours ouvre naturellement vers des postes d’enseignant-chercheur et de chercheur à la fois dans le domaine académique et dans le privé. Le but est de conserver un taux de poursuite en thèse de l’ordre de 30 %.
Organisation de la formation
Le premier semestre du M1 est un tronc commun offrant une importante mutualisation d’enseignements avec d’autres parcours de la mention informatique. Deux cours obligatoires et deux cours fortement conseillés introduisent :
- les modèles et les langages principaux pour le stockage et l’accès aux données structurées et sémantiques (MLBDA)
- les outils fondamentaux et les bonnes pratiques en science des données et en apprentissage machine (DALAS)
- La représentation et la gestion de connaissances (LRC)
- l’usage des approches probabilistes pour l’analyse de données (MAPSI).
Ces cours sont complétés par des cours d’autres parcours qui ont pour but de fournir un ensemble d’outils mathématiques et informatiques nécessaires à la formation ainsi que quelques ouvertures (programmation linéaire, graphes, traitement d’image, analyse de la complexité des algorithmes).
À partir du deuxième semestre du M1, nous proposons dans cette formation trois profils de compétences, chacun donnant un ensemble de compétences spécifiques aux étudiantes et étudiants, via un agencement personnalisé d’UE. Ces trois profils de compétences sont :
- Le profil de compétences « Apprentissage » (APP) propose des UE en machine learning, une introduction au deep learning, et une UE dans les domaines applicatifs de la recherche d’information et du traitement automatique de la langue naturelle.
- Le profil de compétences « Bases de Données » (BD) propose des UE dans le domaine des bases de données appliquées à la gestion de données complexes et distribuées à large échelle.
- Le profil de compétences « Intelligence Artificielle » (IA) propose des UE dans les domaines de la modélisation de connaissances et de l’apprentissage symbolique appliqués aux informations complexes et incertaines (documents, web sémantique).
Les UE de chaque profil sont complémentaires aux UE des deux autres profils et permettent aux étudiantes et étudiants de personnaliser leur formation.
Le premier semestre du M2 offre des UE pointues qui donnent chacune un ensemble de compétences spécifiques par rapport aux différents profils. L’orientation des étudiantes et étudiants vers un métier se fera par leur stage au deuxième semestre de M2 qui a lieu pendant tout le second semestre et pourra être réalisé dans un laboratoire de recherche ou dans une entreprise, avec l’accent mis soit sur la recherche soit sur le développement.
Les étudiantes et étudiants inscrits en Master M2 MIND et ayant les prérequis suffisants peuvent suivre des UE abordant des aspects mathématiques avancés (optimisation convexe, non convexe, apprentissage statistique et automatique). Voir le contenu détaillé sur m2a.lip6.fr
Compétences
À l’obtention du diplôme, la ou le diplômé devra maîtriser :
- les enjeux, les problématiques et le contexte du traitement de l’information à grande échelle
- les outils de base de l’intelligence artificielle
- les technologies symboliques et numériques pour l’apprentissage automatique à partir de données
- les outils de base pour la recherche d’information
- les différents constituants d’un outil opérationnel de fouille de données
- le fonctionnement des moteurs de recherche, texte, image, parole, vidéo.
Il sera également capable de mettre en œuvre et d’apporter de l’innovation pour la conception :
- de systèmes de gestion, de collecte et d’analyse de données à grande échelle,
- d’outils de fouille de données, de recherche d’information, de veille technologique,
- d’algorithmes d’apprentissage automatique et de reconnaissance des formes.
Public visé et prérequis
Le recrutement en M1 est essentiellement réalisé au niveau L3 (ou équivalent) en Informatique ou Informatique/Mathématique. Des candidatures bien motivées provenant d’autres domaines scientifiques peuvent également être considérées.
Au niveau M2 le parcours peut accueillir quelques candidates et candidats extérieurs avec les prérequis compatibles, et en particulier des étudiantes et étudiants en dernière année d’écoles d’ingénieur (Télécom Paris, Mines de Paris, Polytechnique, etc…) qui veulent faire un double diplôme.
Les candidates et candidats doivent avoir des solides connaissances en informatique (algorithmique et programmation, bases de données, logique…). Des notions fondamentales en mathématique (probabilités, statistiques) sont fortement conseillées.
Le parcours MIND n’est pas proposé en alternance. Les sciences des données étant un sujet récent et peu enseigné en licence, nous considérons que le master requiert trop de cours fondamentaux (notamment en M1) pour permettre de proposer des conditions d’alternance satisfaisantes.