Moteur de recherche d'offres d'emploi Groupe EDF

Détection non-supervisée d'anomalies dans les séries temporelles, revue et comparaison d'algorithmes F/H


Détail de l'offre

Informations générales

Référence

2024-108045  

Date de début de diffusion

26/04/2024

Date de modification

29/04/2024

Description du poste

Famille professionnelle / Métier

EXPLOITATION CONDUITE FONCTIONNEMENT - Ingénierie / Expertise / Recherche

Intitulé du poste

Détection non-supervisée d'anomalies dans les séries temporelles, revue et comparaison d'algorithmes F/H

Type de contrat

Stage

Description de la mission

Avec le développement des technologies numériques (dont l’internet des objets et les architectures de données Big Data) et l’explosion des capacités de stockage des données informatiques, les larges collections de séries temporelles deviennent une réalité dans un grand nombre de domaines, comme la finance, les sciences de l’environnement, la médecine, les métiers du numérique, l’ingénierie ou l’industrie. Il y a donc un intérêt et un besoin croissants de développer des techniques efficaces pour traiter et analyser ce type de données.

Dans le contexte de la surveillance et de la maintenance des matériels industriels, la détection précoce d’anomalies dans les séries temporelles est cruciale pour prévenir les dysfonctionnements. Pour cela, les algorithmes non-supervisés semblent prometteurs car ils ne nécessitent pas d’annotations préalables des anomalies, ce qui est avantageux pour la découverte de nouveaux défauts encore non rencontrés.

L’analyse des séries temporelles fait l’objet de travaux de recherche intensifs ces dernières années. Il est donc essentiel d’assurer une veille bibliographique continue et d’identifier, parmi toute la production scientifique, les développements les plus prometteurs, pour ensuite les tester et évaluer leurs performances sur des jeux de données de référence. Le stage s’inscrit dans cet objectif de veille active et de benchmark.

À cette fin, il s’articulera selon plusieurs phases :

1)     Recherche de bases de données annotées (simulées ou réelles) mises à disposition de la communauté, comme Exathlon, ODDS ou TSB-UAD.

2)     Revue de littérature des algorithmes de détection non-supervisée d’anomalies dans les séries temporelles (préférentiellement multivariées, c’est-à-dire sur plusieurs dimensions, comme des mesures issues de multiples capteurs installés sur différents équipements) et construction d’une taxonomie tenant compte, entre autres, des deux critères suivants : principe de l’approche (par densité, par distance, par reconstruction…) et capacité à gérer des flux continus.

3)     Récupération des codes existants et/ou implémentation informatique des algorithmes identifiés comme à fort potentiel suite à l’état de l’art réalisé à l’étape 2), puis mise en œuvre et évaluation de leurs performances à partir des données annotées recensées lors de la phase 1).

4)     Comparaison, analyse critique et synthèse des résultats obtenus.

5)     Rédaction du rapport de stage.

À noter qu’en perspective un sujet de thèse pourrait être ouvert à la suite du stage. Il élargira son périmètre dans l’objectif de lever les limites des algorithmes actuels, en particulier dans un objectif de détection non-supervisée d’anomalies dans des flux continus de séries temporelles multivariées.

Profil souhaité

Étudiant.e de M2 (mathématiques appliquées / probabilités-statistiques-machine learning) ou d’écoles d’ingénieur.e.s (généralistes avec majeure en mathématiques appliquées / probabilités-statistiques-machine learning).

Compétences requises :

·       Solides compétences en probabilités, statistiques, machine learning et analyse numérique

·       Goût pour la programmation (Python, R)

·       Aisance dans la communication, orale et écrite, en français et/ou en anglais

Aptitudes personnelles souhaitées :

·       Goût pour la recherche (méthodologies, concepts mathématiques, applications industrielles)

·       Ouverture d'esprit, curiosité et capacité à être autonome

Stage de 6 mois à compter de septembre 2024.

Date souhaitée de début de mission

02/09/2024

Société

EDF

Localisation du poste

Localisation du poste

France, Ile-de-France, Yvelines (78)

Ville

Chatou

Langue de l'offre

Français

Critères candidat

Niveau de formation

04 - BAC +4 / BAC +5

Spécialisation du diplôme

  • Recherche & Développement
  • DATA - Mathématiques appliquées - Statistiques
  • Numérique et DATA

Expérience minimum souhaitée

Débutant

Compétences transverses

  • Autonomie
  • Sens relationnel
  • Rigueur / Respect des consignes
  • Capacité d'analyse / Esprit de synthèse
  • Esprit critique

Autres informations

Permis VL

Non