STAGE - Développement et amélioration de la recherche par IA (RAG) dans un corpus documentaire F/H

Détail de l'offre

Informations générales

Référence

2024-121036  

Date de début de diffusion

06/11/2024

Date de modification

06/11/2024

Description du poste

Famille professionnelle / Métier

SYSTEMES D'INFORMATION, TELECOM ET NUMERIQUE - Conseil / Méthodes

Intitulé du poste

STAGE - Développement et amélioration de la recherche par IA (RAG) dans un corpus documentaire F/H

Type de contrat

Stage

Description de la mission

Cette année, soyez l’un des 6500 stagiaires à rejoindre le Groupe EDF !

90% des étudiants recommandent l’entreprise à l’issue de leur alternance ou de leur stage.

Découvrez en images nos orientations et nos valeurs sur la chaîne YouTube EDF : https://www.youtube.com/user/EDFCommunitymanager

 

🌐 Votre environnement

Vous intègrerez le service DTMP (Développement Technologies, Méthodes et Produits) de l'unité DTG. Sa mission est de promouvoir, impulser et organiser l’innovation à DTG, en collaboration avec les 4 départements métiers, le service DESIR (Développement et Exploitation de Solutions Informatiques et Réseaux) et la cellule vente externe de la DIRDEV (Direction Développement).

 

Ses activités incluent :

  • Coordination de la préparation de l’avenir de DTG, en assurant le maillage interne et externe au Groupe (CIH, R&D, pôles de compétitivité), l’exploration de nouvelles technologies et un appui transverse sur le matériel de mesure et la métrologie.
  • Accompagnement méthodologique des projets de développement (facilitation, collège d’accélération, incubateur).
  • Apport d’expertise technologique (data, drone, métrologie, SIG) en soutien aux projets de développement.
  • Contribution à la production de nouvelles solutions technologiques intégrées, industrialisées et commercialisables.


Dans ce contexte, notre unité EDF DTG propose pour son service DTMP un stage sur le poste développement et amélioration de la recherche par IA (RAG) dans un corpus documentaire F/H.

 

Votre mission 💬

Au sein du LabData, ce stage a pour objectif de développer méthodes avancées de recherche dans de vastes corpus documentaires, pas uniquement textuels mais contenant aussi des images (exemple : graphiques, plans…) et du texte structuré (tableaux, JSON…), en faisant appel aux méthodes d’IA les plus récentes.

👉 prendre en main l’application existante de RAG (Génération Augmentée par la Recherche) basé sur l’extraction de texte, son filtrage et la création de bases de données vectorielles

👉 proposer des améliorations de ce processus et finalement d’évaluer quantitativement la recherche.

👉 développer une nouvelle méthode permettant d’utiliser directement les données sous format image grâce à des embeddings multimodaux, une méthode potentiellement à la fois plus riche et plus simple que l’extraction de texte.

Le stagiaire sera amené à utiliser les moyens informatiques du LabData ainsi que la plateforme IA du groupe EDF permettant de faire appel à des LLM par API.


Le stage se conclura par une note de synthèse, la livraison d’un modèle adapté à l’entreprise, et une preuve de concept avec une application prototype sur un cas d’usage métier.

 

Découvrez également les activités de la Division Technique Générale d’EDF sur la chaine YouTube EDF : Présentation des activités d'EDF DTG

Profil souhaité

Votre profil 🙋‍♀️

🎓 Vous êtes en école d’ingénieur ou en master 2 avec une spécialité en data science, mathématiques appliquées, ou TAL/NLP.
Vous avez un intérêt pour le secteur de l’énergie et pour les solutions d’IA génératives textuelles (LLM).

Dans le cadre de votre diplôme BAC+4/5 vous avez un stage à effectuer.

 

⏳ Durée du stage : 6 mois

📌 Lieu :134 Chemin de l'Étang, 38950 Saint Martin Le Vinoux (à 15 minutes de Grenoble en transport en commun)

 

🎯 Nous recherchons les compétences et qualités suivantes pour ce poste :

  • Capacité d'adaptation
  • Autonomie
  • Capacité d'analyse, de synthèse
  • Bonne maîtrise de Python et des librairies scientifiques usuelles serait souhaitable, de même que des connaissances en TAL/NLP
     

🎁 Ce qu’EDF peut vous offrir

  • une aide au logement de 185 € maximum si obligation de déménager pour faire le stage
  • une aide sur les abonnements de transport en commun (remboursement de 70% de l’abonnement mensuel)

Pour candidater 👇

  • votre CV
  • une lettre de motivation
  • vos bulletins de notes des deux dernières années 
     

 

Conformément aux engagements pris par EDF SA en faveur de l'accueil et de l'intégration des personnes en situation de handicap, cette alternance est ouverte à toutes et à tous, sous réserve de l'accord de la médecine du travail.

Date souhaitée de début de mission

03/03/2025

Société

EDF

Localisation du poste

Localisation du poste

Europe, France, Auvergne-Rhône-Alpes, Isère (38)

Ville

GRENOBLE

Langue de l'offre

Français

Critères candidat

Niveau de formation

04 - BAC +4 / BAC +5

Spécialisation du diplôme

  • DATA - Mathématiques appliquées - Statistiques
  • Numérique et DATA

Expérience minimum souhaitée

Débutant

Compétences transverses

  • Capacité d'adaptation
  • Autonomie
  • Capacité d'analyse / Esprit de synthèse

Autres informations

Permis VL

Non