Actualités

Partager sur :
16 juin 2020
La lettre de XMP-Consult

La formation en IA, présentation du rapport OPIIEC

Vue 45 fois

Cet article donne quelques éléments et opinions sur le domaine de la formation en IA à partir du rapport OPIIEC (Branche professionnelle des métiers de l’Informatique, de l’Ingénierie, des Études et du Conseil) et mes expériences de formateur.

Genèse de la formation en IA en France.

Elle a longtemps été dominée par le domaine de l’IA « symbolique » : le langage Prolog dans les années 80/90, le langage Lisp, les systèmes experts, l’ordinateur de la 5ieme génération (Japon), etc...

Le haut de la vague sur la région parisienne, était le DEA d’Intelligence Artificielle de Paris 6 dans les années 90 suivi par de nombreux ingénieurs après ou en parallèle de leur cursus, responsables Pitrat[1], Ganascia[2].

L’Apprentissage Machine (Machine Learning) ou Apprentissage Artificiel existait mais en minorité (Toulouse, LIP6, Master Cachan-MVA) et plusieurs ingénieurs comprenant le peu de débouchés (ou pour des raisons personnelles) sont partis aux US : Yann Le Cun[3], Léon Bottou[4], Isabelle Guyon, pour ne citer que ceux passés par les Bells Lab, cela faisant peut-être parti de la légende.

La période « moderne ».

Depuis 2012 environ et l’explosion du deep learning (cf. deeplearningbook[5]), l’attention sur l’apprentissage machine est revenu.

En parallèle du mouvement Big Data, permettant d’amener et préparer les données sur un lac de données, les formations Big Data etApprentissage Machine se sont multipliés.

Très anecdotique jusqu’en 2017, l’offre explose depuis deux, trois ans à tous les niveaux L3, M1 ou M2, et doctorat.

Ce domaine de formation est largement hétérogène, mélangeant des cursus théoriques (avec un bagage mathématique de niveau L2/L3) jusqu’à des aspects managériaux, de gouvernance et gestion de la donnée (Données personnelles et IA, RGPD).

Le rapport OPIIEC.

Pour s’y retrouver l’OPIIEC[6]  a lancé une étude « Formations et compétences sur l’Intelligence Artificielle en France » réalisée par Ernst & Young en 2019.

L’offre de formation devient conséquente : « En effet, plus de 400 formations initiales et professionnelles réalisées en France ont été recensées au travers de cette étude. Cette collecte, inédite par son ampleur, a permis une analyse fine de l’adéquation du tissu de formation français spécialisé en IA/Data Science par rapport aux besoins des entreprises de la Branche. »

Les constats chiffrés :

  • En formation initiale le flux potentiel est de 4000 étudiants par au niveau Master et 2000 au niveau Licence, bien réparti sur le plan national
  • 91% des professionnels français de l’IA & Data Science ont suivi un cursus Bac + 5 et plus. Ce chiffre est une singularité au niveau international, là où 64% de ces professionnels ont suivi ce type de parcours dans d’autres « grands pays IA » (ex : 32% de niveau Licence aux États-Unis, sans qu’une corrélation significative puisse être établie entre niveau de formation initiale et niveau salarial entre les 2 pays)
  • 25% des diplômés IA/Data Science de niveau Bac+5 continueraient leur parcours par un doctorat. Car actuellement la branche est portée par des projets R&D, mais cette tendance va s’infléchir parce que de plus en plus de mises en production de l’IA démarrent.
  • Les formations professionnelles restent plus concentrées en région parisienne et répondent à 75 % à des demandes de profils débutants ou intermédiaire en IA
  • Utilisation très fréquente des cours en lignes (MOOC), anglophones et plus récemment francophones.

Parmi les MOOC classiques, j’ai pu en pratiquer plusieurs dans leurs versions initiales, principalement gratuites (Andrew Ng sur Coursera ou fastai de Jeremy Howard et son équipe). D’un point de vue contenu pédagogique théorique, 80 % de tous les contenus sont souvent des redites de quelques livres (eux même disponibles en ligne) comme Elements of Statistical Learning [7]ou Deeplearning Book cité plus haut. La valeur ajoutée réside dans les travaux pratiques, les cas d’usages, ainsi ces MOOC sont bien complémentaires d’un enseignement académique.

Sur les contenus « soft skills », l’origine vient des courants de méthodologies, Agilité, modélisation (objet ou pas), Architecture de l’information ou IT.

Le débat n’est pas ouvert dans le rapport sur la bascule des cours en présentiel vers le e-learning, mais le constat de l’adoption massive des formations en ligne est fait en p.56/57. De mon expérience, en entreprise, les formations en ligne (Open Class Rooms, Coursera, Stanford, MIT, Udemy…) sont prises en charge dans beaucoup de cas, avec si possible la suggestion de ne pas « trop » prendre sur ces heures de travail pour les suivre. Les formations en présentiel dans un centre de formation inter-entreprise restent limitées à 2/3 jours sur un logiciel ou une technique précise. En terme de budget, c’est souvent un facteur 10 minimum en faveur des MOOC, si l’on intègre la journée de cours et l’indisponibilité du collaborateur.

L’étude a aussi une approche vers l’avenir :

« L’OPIIEC a donc cherché à caractériser, pour la période 2019-2023, les propres besoins de la branche sur les plans qualitatifs et quantitatifs. L’enjeu était également de faire un état des lieux le plus exhaustif possible de l’offre de formation initiale et professionnelle en matière d’IA, pour permettre au tissu de formation, aux étudiants et futurs professionnels d’intégrer les changements générés par l’IA. »

Voici le synoptique du périmètre et de la démarche de l’étude.

A notre connaissance c’est la première étude de grande ampleur, 60 entretiens pour couvrir les secteurs du Retail, des Services Financiers, de l’Industrie et des métiers du conseil (appelés « la Branche » dans le rapport !).

Les métiers identifiés sont : Data engineer, Data scientist, Développeur IA, Architecte IA, Chef de projet data, UX/UI designer, Ingénieur computer vision.

Pour l’analyse de l’offre de formation, 25 entretiens ont été réalisés. L’étude s’appuie pour une vision internationale sur un sondage fait sur le site kaggle.com en 2017 (challenges pour Data Scientist et ressources Datas).

Le mode de montée en compétences est dominé par le couple (auto-apprentissage, cours en ligne). L’offre de formation professionnelle est concentrée en Île-de-France. Le rapport aborde aussi le sujet des formations certifiantes. Une recherche sur Google peut donner le tournis car il n’y a pas de calibrage entre les différents certificats.

Expériences de formateur.

J’ai profité du creux de formateurs pour enseigner la data science sur plusieurs Ecoles d’Ingénieurs de la région parisienne. Assez décevant, car il est difficile d’entretenir des relations sur la durée, l’idée des établissements est d’avoir un énorme volet d’intervenants extérieurs, parfois de récupérer les contenus, déroulés des cours pour pouvoir assurer le cours avec son propre personnel.

Le personnel permanent est quand même très réduit (cf. nombre de postes d’enseignants-chercheurs).

Les écoles d’été en IA / Machine Learning est un autre format de la formation professionnelle peu couvert par l’étude OPIIEC. J’ai pu assister à l’Ecole d’été donnée à Varsovie, cela permet de couvrir beaucoup de thèmes et de rencontrer des chercheurs ou pratiquants de différentes sociétés.

Ce type d’Ecoles ouvertes en priorité à des doctorants, existent aussi en France : par ex à Polytechnique, Grenoble, Lille. A mon sens, c’est un bon compromis entre les MOOCs et les cours en présentiels.

Voir le programme ici[8]

Dernière possibilité, la participation à des challenges data ou des Hackathons. Historiquement le site Kaggle[9] a été le premier à proposer ce type de challenges. En France, il reste la plate-forme Challenge data [10] qui est maintenue par l’ENS et animée par une équipe autour de Stéphane Mallat qui tient la chaire Science des données au Collège de France.

Synthèse.

En 2020, l’offre de formation est très complète. Même, s’il est possible de se ré-orienter professionnellement, les meilleurs débouchés, pour des profils R&D, resteront pour les ingénieurs ou universitaires ayant un doctorat en IA ou l’équivalent.

Des postes comme Chief Data Officer (CDO), Chief Scientist Officer (CSO), Privacy Officer (PO) resterons ouverts à des profils plus orientés management.

Bruno Seznec
consult@seznec.net
https://www.linkedin.com/in/brunoseznec/

 

 

Télécharger la Lettre de XMP-Consult n°8 (juin 2020) en .PDF

   

[1]          https://www.lip6.fr/colloquium/?guest=Pitrat

[2]    https://www.lip6.fr/actualite/personnes-fiche.php?ident=P34

[3]    https://fr.wikipedia.org/wiki/Yann_Le_Cun

[4]          https://www.lip6.fr/colloquium/?guest=Bottou

[5]          https://www.deeplearningbook.org/

[6]          Observatoire Paritaire des métiers de l’Informatique, de l’Ingénierie, des Études et du Conseil

[7]    Elements of Statistical Learning  par Trevor Hastie, Robert Tibshirani, Jerome Friedman, Seconde édition 2009 chez Springer https://web.stanford.edu/~hastie/ElemStatLearn/ https://web.stanford.edu/~hastie/Papers/ESLII.pdf

[8]    https://deeplearn2019.irdta.eu/ site plus maintenu,  https://www.irdta.eu/pastevents/

[9]    http://www.kaggle.com

[10]        https://challengedata.ens.fr/



Commentaires

Vous devez être connecté pour laisser un commentaire. Connectez-vous.