La philosophie du projet

Accompagner l'utilisation de R au sein du système statistique public d'accompagner à

Le système d'information statistique à l'Insee et dans les services statistiques ministériels (SSM) s'inscrit dans une riche histoire de pratique du logiciel SAS, longtemps au centre des travaux de traitement et d'étude de la donnée, quand les autres solutions statistiques sont restées limitées à des usages spécifiques (comme Stata ou Matlab) ou n'ont pas été retenues comme référence dans l'environnement numérique de travail (comme SPSS). Les dernières années ont toutefois vu l'émergence de suites statistiques alternatives, bénéficant d'un large soutien d'une communauté d'utilisateurs qui ont rapidement enrichi les fonctionnalités offertes. Ainsi, R et le poste de développement Rstudio occupent désormais une place de premier rang dans le paysage des logiciels et des langages de traitement du chiffre.

À l'horizon 2025, l'Insee prévoit de diversifier son socle d'outils statistiques en s'appuyant sur les solutions relevant du domaine du libre, et plus particulièrement, sur R et l'éco-système qui l'accompagne (la richesse des packages développés par la communauté des utilisateurs). Cette préoccupation est partagée par l'ensemble des services statistiques ministériels. Elle répond également aux attentes des jeunes recrues au sein du système statistique public, pour lesquelles le langage R a une place significative au sein de leur formation initiale, et qu'ils souhaitent pouvoir utiliser dans le cadre de leur activité.

Toutefois, tous les agents n'ont pas bénéficié d'une formation initiale en R, et sont légitimement en attente d'un parcours adapté. L'accompagnement des agents est ainsi la pierre angulaire de la promotion de R dans l'institut et dans le système statistique public. De multiples actions ont été engagées en ce sens. Dans le cas de l'Insee, il faut citer en particulier le projet Palettes, qui comprend notamment la construction d'un parcours de montée en compétences sur R, via la conception d'une offre de formation, la création d'un réseau de formateurs, le soutien des commmunautés locales et la mise en place d'ateliers de partages de pratique. D'autres actions ont pu prendre place, comme l'élaboration d'une documentation R à l'usage des agents de l'Insee (voir https://linogaliana.gitlab.io/documentationR/index.html) ou des formations conçues par des agents de l'institut (par exemple https://teaching.slmc.fr/r/)...

Les SSM ont également investis dans les démarches d'accompagnement des agents du système statistique public dans l'apprentissage de l'environnement R :

  • des parcours de formation dédiés ont été mis en place : exemple du parcours de formation MTES fondée sur un noyau commun (premier programme en R et préparation des données) puis des modules d'approfondissement à la carte

  • des applications facilitant la découverte de la grammaire R : exemple de Rgonomics au SSP

  • des packages pour faciliter les principaux traitements réalisés par les agents, comme "Ressources en R à la Drees" (rdress).

  • et bien d'autres initiatives, que nous ne saurions ici recenser...

Se fédérer autour d'une approche ludique, pour compléter les dispositifs existants

Tout en appartant le socle d'un accompagnement réussi de l'ensemble des agents de la statistique publique, ces différentes actions à l'Insee comme en SSM rencontrent deux limites principales :

  • la capacité à mobiliser une communauté de formateurs pouvant faire face à l'ampleur du dispositif de formation mis en place dans chaque structure, et en particulier à accompagner dans la durée les agents qui s'engagent dans un parcours d'apprentissage.

  • le niveau d'accessibilité du cursus de formation qui, même s'il s'appuie sur des modules introductifs voulus ouverts au plus grand nombre, peine à couvrir l'ensemble du public novice sur R. En particulier, deux publics peuvent être plus difficiles à toucher : (i) d'une part, des agents maîtrisant un autre logiciel de traitement du chiffre, qu'il s'agisse d'un logiciel statistique (SAS) ou d'un tableur (Calc), pour lesquels changer d'environnement est surtout perçu comme un coût (ii) d'autre part, des agents moins à l'aise avec les outils de traitement de chiffre et pouvant être confrontés à une barrière psychologique à l'idée de se former en R.

Le projet de funcamp R vise à apporter un levier d'action sur ces deux difficultés, en couvrant en priorité un public débutant en R d'une part, en visant à dégager des synergies au sein des différents réseaux de formateurs R au sein du SSP d'autre part.

S'inspirant de l'élan événementiel qu'apporte un hackathon, mais davantage axé sur la pédagogie et le jeu que sur la compétitition et l'expertise, le funcamp R se définit comme un dispositif ludique réunissant un large nombre d'acteurs dans des activités mêlant découverte, défis collectifs et transfert de connaissance. Le projet initial a visé à mettre en place des parcours initiatiques suivis en petits groupes en présentiel, avec un accompagnement apporté par des formateurs du SSP et des tuteurs mobilisés parmi les communautés d'entraide R existant dans nos réseaux. L'occasion d'avoir un temps de rencontre entre l'Insee, les SSM et/ou leurs services déconcentrés, dans un esprit d'apprentissage collectif. Dans cette idée, le funcamp R était avant tout imaginé comme un évènement à organiser sur une journée, jouant de la proximité entre des stagiaires et des tuteurs, dans des interactions originales liées au jeu icaRius.

Tout en restant une modalité d'organisation visée à moyen terme, l'arrivée du COVID19 a conduit à adapter le projet, pour proposer à court terme une expérience de formation à distance, jouable par un stagiaire en télétravail. Une approche qui nécessite un effort particulier pour guider le stagiaire, à la fois dans son parcours d'apprentissage mais aussi dans sa découverte du jeux vidéo icaRius !

Le pari est-il réussi ? A vous d'en juger, en vous rendant sur la page "Jouer (et apprendre)" !

Dernière mise à jour