Data Scientist | Passion Céréales

   © Passion Céréales

Dossier

Data Scientist

Passion Céréales

Les outils mathématiques et statistiques jouent un rôle important dans l’agriculture du 21e siècle. Particulièrement pour l’univers du végétal, dont les progrès s’appuient sur des modèles capables d’aider les cultures à s’adapter aux évolutions climatiques et à se défendre contre leurs agresseurs. En tant que spécialiste des données, le "Data Scientist" occupe une fonction clé au sein des équipes de recherche. Sa mission ? Utiliser un nombre quasi infini de données – ou « données massives » – pour faire avancer la science et créer de la valeur-ajoutée agronomique.


La science des données, ou Data Science, est une discipline apparue au début des années 2000 avec la montée en puissance du Big Data*. Afin de tirer pleinement parti des données massives et hétérogènes que les outils numériques sont désormais en mesure de collecter, le monde de la statistique a fait évoluer ses méthodes et a développé un métier spécialisé : le Data Scientist.

Cette expertise, à l’origine très liée au marketing et à la grande distribution, est aujourd’hui indispensable dans la plupart des secteurs d’activité. Y compris dans le monde agricole où la science est devenue un des principaux leviers de compétitivité économique et de progrès sociétal : climat, environnement, nutrition…

Intégré à une équipe scientifique ou de Recherche et Développement du secteur agricole ou agroalimentaire, le Data Scientist peut y exercer ses compétences dans différents contextes : au sein d’un organisme de recherche et d’expertise (Inra, …) ou d’un institut technique agricole dédié à une ou plusieurs filières de production (ARVALIS-Institut du Végétal, IDELE…) ; dans une entreprise privée de services orientée vers le monde agricole (high-tech, OAD, expertises…), chez un acteur de la collecte et du négoce engagé dans la recherche, ou encore à l’intérieur d’une grande entreprise agroalimentaire.

 

* L’expression Big Data désigne les masses de données devenues si volumineuses qu’elles dépassent les capacités de calcul et d’analyse des outils informatiques classiques de gestion de l’information.

Au cœur des métiers de la statistique et de la modélisation, le – ou la – Data Scientist en agriculture est responsable de la gestion et de l’analyse des données massives.

Sa vocation est de produire des informations utiles à la science et à la recherche agronomique, créatrices de valeur et d’avance technologique, à partir de données issues de sources multiples, hétérogènes et souvent déconnectées les unes des autres : expérimentations scientifiques et agronomiques, réseaux de surveillance biologique et météorologique, applications utilisées par les agriculteurs (crowd sourcing), acteurs collectant des données (climatiques, économiques)….

Grâce à sa maîtrise des outils de calcul et logiciels dédiés aux données de masse, le Data Scientist mobilise des algorithmes complexes et des modèles statistiques et mathématiques avancés qui garantissent la fiabilité des résultats. Il remplit ainsi trois grandes missions :

  • il organise l’acquisition des données et en effectue le "nettoyage" (qualification, vérification…) en écartant tout élément inapproprié ou étranger à l’objet de la recherche ;
  • il en assure l’extraction et la mise en forme afin de les rendre exploitables ;
  • il analyse les données pour en extraire des informations ou pour élaborer des modèles permettant, par exemple, de comprendre les relations entre variables ou de prédire des phénomènes.

Au carrefour d’enjeux stratégiques

Les travaux du Data Scientist apportent une contribution décisive au développement d’outils stratégiques pour l’agriculture moderne, dans différents domaines : sélection variétale, aide à la décision (OAD), projets R&D, prévision et prévention (climat, rendements à la parcelle, suivi des bioagresseurs…).

Rigoureux et organisé par nature, le Data Scientist en agriculture est un professionnel passionné autant par les chiffres et modèles mathématiques que par le monde du vivant. À sa connaissance des bases de données et de l’informatique (outils analytiques, langages de programmation, algèbre linéaire, machine learning…) s’ajoute une bonne compréhension des enjeux du monde agricole et des besoins des différents acteurs.

Polyvalent et autonome, il témoigne d’une curiosité intellectuelle, d’une créativité et d’une capacité à travailler en équipe qui favorisent son intégration au sein de projets complexes et transverses.

Le métier de Data Scientist est ouvert aux candidats de niveau bac +5 titulaires d’un master ou d’un diplôme d’ingénieur, bénéficiant ou non d’une première expérience professionnelle.

Les cursus spécialisés dans le Big Data sont encore peu nombreux mais plusieurs formations permettent d’acquérir les compétences nécessaires pour devenir Data Scientist, notamment dans les filières dédiées aux statistiques, à l’informatique et à l’ingénierie de management (universités scientifiques, grandes écoles).

Le secteur agricole a la spécificité d’ouvrir la fonction autant à des agrostatisticiens spécialisés qu’à des jeunes diplômés des filières agricoles ayant une attirance pour les statistiques, la modélisation et l’informatique. Ces profils sont principalement issus des écoles nationales supérieures d’agronomie ou des écoles d’ingénieurs, publiques ou privées, orientées vers l’agriculture, l’agronomie, l’agroalimentaire et/ou les sciences du Vivant.

En termes de carrière, le Data Scientist peut évoluer vers des fonctions d’encadrement d’équipe, de management ou de direction de projet.

Pour en savoir plus…

Qu’est-ce que la Data Science ? Le guide des 24 articles de référence pour répondre à cette question (langue anglaise)

La Data Science au service des cultures : un exemple de débouché

Un exemple d’outil collecteur et utilisateur de données en application sur le terrain (Raincrop)

"Au service de la vie du végétal"

Fety Andrianasolo, Data Scientist au sein du département Systèmes d’information et Méthodologies chez ARVALIS-Institut du Végétal (Essonne)

"Titulaire d’une licence en Biologie, d’un master en Biologie végétale intégrative et d’une thèse de Modélisation en agronomie, je me suis dirigée vers ce métier par passion pour l’écophysiologie et pour l’étude des comportements des plantes face aux agresseurs et autres éléments extérieurs. Au-delà de l’intitulé moderne de "Data Scientist", c’est une fonction de modélisation dont l’enjeu consiste à découvrir et extraire la substance d’une masse de données pour bâtir et vérifier des hypothèses, élaborer des modèles permettant de mieux comprendre et anticiper les phénomènes et de faire avancer la science."

Un exemple d’application concrète issue des travaux de modélisation conduits par ARVALIS-Institut du Végétal : le « Laboratoire portatif d’analyse des sols » permet à l’agriculteur de cartographier avec finesse et précision l’état d’une parcelle afin d’adapter ses interventions au juste besoin. Pour visionner la vidéo, cliquer ici.

 

"Partenaire du Big Data climatique"

Martin Ducroquet, fondateur de la société Sencrop, fabricant de stations agro-météorologiques connectées (Lille)

"Les stations agro-météo Sencrop sont implantées sur le terrain, au niveau des parcelles. Outre leur caractère opérationnel pour l’agriculteur (aide à la décision, gain de temps, amélioration des rendements), ces outils connectés permettent de remonter de multiples données : température, hygrométrie, pluviométrie, vitesse du vent, luminosité… En tant que "contributeur au Big Data", notre équipe procède à un traitement de premier niveau de ces données qui vont ensuite alimenter les modèles des statisticiens et experts en météorologie."