Stage Machine Learning NLP

Date de mise à jour de l’offre

QWAM CONTENT INTELLIGENCE :

Editeur de solutions logicielles de valorisation de l’information textuelle via ses technologies sémantiques et IA, QWAM Content Intelligence est spécialiste des solutions d’analyse, gestion et veille des contenus informationnels. QWAM a notamment développé une gamme de solutions logicielles d’analyse d’informations textuelles métier ou web intégrant les technologies sémantiques, du big data et de l’intelligence artificielle. QWAM propose des solutions d’intelligence artificielle dédiées au traitement, à l'enrichissement et l'analyse de données textuelles métier ou web, à l'analyse d’avis clients, opinions, ...

Description de la mission

Le stage proposé a pour but de contribuer à l’amélioration de la plateforme d’analyse de contenus en masse QWAM Text Analytics (QTA).
Nous travaillons à divers axes d’amélioration tel que l’utilisation des plongements lexicaux (word embeddings) comme entrée pour un réseau de neurones. Nous souhaitons tester et évaluer différents algorithmes de reconnaissance d’entités, relations et sentiments.
Dans ce contexte, votre mission principale consistera en :
La constitution d’un jeu de données pour l’entraînement d’un modèle de reconnaissance d’entités, relations et sentiments avec, dans un premier temps, OpenNLP. Ensuite, l’évaluation d’autres librairies est aussi envisageable
L’optimisation et évaluation des modèles entraînés

De plus, vous serez amené(e) à participer aux tâches suivantes :
La conception et l’amélioration des règles linguistiques
L’actualisation et la maintenance de ressources linguistiques existantes
La réalisation d’un contrôle qualité et de traductions ponctuelles (anglais et/ou espagnol et/ou allemand)

Profil recherché

Étudiant(e) de niveau Master 2 en Traitement Automatique des Langues, ou Informatique avec une spécialisation en Traitement Automatique des Langues.
Programmation en Java et/ou Python


Bonne connaissance de librairies NLP (Stanford CoreNLP, SpaCy, OpenNLP…) et d’outils d’annotation comme GATE
Des expériences d’utilisation de librairies d’apprentissage automatique (Scikit-Learn, Deeplearning4j, TensorFlow, PyTorch…)
Notions en ontologie et web sémantique

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    QWAM CONTENT INTELLIGENCE
  • Secteur d’activité de la structure
    Emploi - Economie - Innovation - Numérique
  • Effectif de la structure
    De 11 à 20 salariés
  • Site internet de la structure
    https://www.qwamci.com
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Supérieur à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    29 rue Taitbout
    75009 PARIS 9E ARRONDISSEMENT
  • Accès et transports
    saint lazare - opéra