STAGE MACHINE LEARNING OCR

Date de mise à jour de l’offre

7 LIEUES TECHNOLOGIES :

L'Edition, la conception, la réalisation, l'exploitation, la vente ou la revente de logiciels et solutions informatiques et les prestations de conseil relatives à divers solutions informatiques.

Description de la mission

Contribuer à la mise en place du module IA d’un assistant virtuel multicanal pour PME et ETI

Mise en place d’un module OCR phase 1
- Appropriation des outils open source de (pré-)traitement des images pour uniformisation, mise en qualité et identification des zones d’intérêt métiers
- Mise en place d’un pipeline de traitement des images, notation de la qualité, gestion des rejets

Mise en place d’un module OCR phase 2
- Appropriation des outils open source de classification/reconnaissance d’image (OCR plus précisément)
- Apprentissage & tests, constitution de modèles de RNN/CNN pré-entraînés sur des datasets « métiers »
- Industrialisation du ré-entraînement final, propre à un métier/client donné, indentification des pré-requis et des risques
- Plus généralement : identification des paramètres optimums (ou proches) pour une prédiction acceptable en fonction de seuils métiers, analyse des prérequis par rapport à un dataset donné, ou par rapport à des inducteurs métiers spécifiques
- Benchmark des résultats obtenus par rapport aux solutions du marché disponibles
- Mise en place d’un mécanisme de ré-entraînement continu (récupération input utilisateur, ré-annotation, ajustement, identification des faux-positifs et analyse), mesure de la progression, identification des risques d’overfitting et mitigation associée
- Anticipation des temps d’entraînement et de la puissance de calcul nécessaire pour chaque étape majeure

Transverse & Intégration mobile
- Mise en place d’une interface web de visualisation des reconnaissances
- Mise en place de contrats d’interfaces (APIs) pour échange avec des modules « techniques », plus précisément les pellicules et l’appareil photo d’un téléphone (iOS et Android principalement)
- Analyse de la meilleure approche pour l’embarqué : consultation d’un modèle cloud nécessairement online, ou micro-librairie embarquée offline

Bonus
- Intégration de méta-data comme les données de géolocalisation (et la consultation de SIG externes type Google maps) pour améliorer les prédictions et faciliter la consultation
- Approche d’entraînement /classification sur datasets non annotés
- Gestion multi-langues

Profil recherché

Esprit critique, autonomie
Réactivité, souplesse
Compréhension des enjeux et contraintes métiers
Rigueur et qualité scientifiques
Capacité d’apprentissage et d’appropriation d’outils IT et ML nouveaux
(OpenCV, Tesseract, Python/Javascript...)
Sensibilité UX/UI en bonus
Compréhension des enjeux de startup (efficience et non surqualité)

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    7 LIEUES TECHNOLOGIES
  • Secteur d’activité de la structure
    Emploi - Économie - Innovation - Numérique
  • Effectif de la structure
    De 0 à 10 salariés
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    6 Avenue Château du Loir
    92400 COURBEVOIE
  • Accès et transports
    Au pied de la gare de Courbevoie, 10min à pied de la Défense