DESCRIPTION :
Au sein du LIST, le Laboratoire de Vision et d'Apprentissage pour l'Analyse de Scènes (LVA) mène ses recherches dans le domaine de la vision par ordinateur et de l'intelligence artificielle pour la perception des systèmes intelligents et autonomes. Les thématiques de recherche du laboratoire incluent la reconnaissance visuelle, l'analyse des comportements et des activités, l'annotation automatique à grande échelle, ainsi que les modèles de perception et de décision., En tant que stagiaire au CEA, vous aurez l'opportunité de travailler au sein d'un environnement de recherche de renommée mondiale. Nos équipes sont composées d'experts passionnés et dédiés, offrant un cadre propice à l'apprentissage et à la collaboration. Vous aurez accès à des équipements de pointe et à des ressources de recherche de premier ordre pour mener à bien vos missions.
Contexte
Les outils d'analyse de mise en page sont aujourd'hui performants pour les documents textuels (factures, formulaires), mais les cartes et plans posent encore de nombreux défis en raison de leur complexité graphique (symboles vectoriels, annotations textuelles, légendes, échelles, etc.).
Le logiciel MapLayoutParser, développé par le CEA LIST, constitue une solution innovante pour répondre à ces problématiques et ouvre la voie à des applications variées : intelligence géospatiale, urbanisme, numérisation d'archives, robotique.
Objectifs
Évaluer les performances actuelles de Map-Layout-Parser sur différents types de cartes et plans (architecturaux, topographiques, techniques).
Améliorer la robustesse du modèle par fine-tuning, augmentation de données et adaptation des classes cibles.
Développer des modules de post-traitement pour enrichir les résultats et faciliter leur exploitation.
Valider l'approche par des benchmarks et une étude de cas appliquée (ex. extraction automatique d'informations clés).
Missions principales
*
Analyse et évaluation des performances de l'outil sur divers jeux de données.
*
Mise en place de stratégies d'amélioration :
+
Fine-tuning sur jeux de données annotés,
+
Augmentation et génération de données,
*
Développement d'un module de post-traitement pour :
+
Regroupement sémantique des éléments,
+
Alignement texte-symbole (association étiquette-objet),
+
Export structuré en JSON ou graphes.
+
Validation expérimentale via benchmarks et étude de cas.
Compétences développées
*
Vision par ordinateur et deep learning appliqués aux documents complexes.
*
Traitement et augmentation de données annotées.
*
Développement d'algorithmes de post-traitement et structuration de données.
*
Évaluation et validation par benchmarks et cas d'usage concrets., * L'opportunité de travailler au sein d'une organisation de renommée mondiale dans le domaine de la recherche scientifique,
* Un environnement unique dédié à des projets ambitieux au profit des grands enjeux sociétaux actuels,
* Une expérience à la pointe de l'innovation, comportant un fort potentiel de développement industriel,
* Des moyens expérimentaux exceptionnels et un encadrement de qualité,
* De réelles opportunités de carrière à l'issue de votre stage
* Un poste au cœur de la métropole grenobloise, facilement accessible via la mobilité douce favorisée par le CEA,
* Une participation aux transports en commun à hauteur de 85%,
* Un équilibre vie privée - vie professionnelle reconnu,
* Un restaurant d'entreprise,
* Une politique diversité et inclusion,
Conformément aux engagements pris par le CEA en faveur de l'intégration des personnes handicapées, cet emploi est ouvert à toutes et à tous. Le CEA propose des aménagements et/ou des possibilités d'organisation pour l'inclusion des travailleurs handicapés.
Code d'emploi : Data Scientist (h/f)
Domaine professionnel actuel : IT R&D Professionals
Niveau de formation : Bac+4/+5
Temps partiel / Temps plein : Plein temps
Type de contrat : Stage/Jeune diplômé
Compétences : Intelligence Artificielle, Applications Analytiques, Vision par Ordinateur, JSON, Python (Langage de Programmation), Analyse Syntaxique, Tensorflow, Pytorch, Large Language Models, Deep Learning, Generative AI, Développement Industriel, Recherche, Algorithmes, Implantation Aménagements Urbains, Traitement de Documents, Gestion de la Performance, Etudes de Terrain, Systèmes Intelligents, Techniques de Laboratoire, Conception et Réalisation en Robotique, Recherche Technologique
Courriel :
internet.saclay@cea.fr
Téléphone :
0160833031
Type d'annonceur : Employeur direct