Stage Machine Learning NLP - Traitement Automatique du Langage

Date de mise à jour de l’offre

QWAM CONTENT INTELLIGENCE :

QWAM Content Intelligence poursuit son développement (+50% sur les 2 dernières années) sur les domaines en forte croissance de l’analyse sémantique et de l’intelligence artificielle dédiée aux données textuelles, de la surveillance et l’extraction d’informations web, et des solutions de recherche et d’analyse d’informations métier. Nous éditons des solutions logicielles innovantes adaptées à ces besoins, et notamment la solution QWAM Text Analytics (QTA).

Description de la mission

Le stage proposé a pour but de contribuer à l’amélioration de la plateforme d’analyse de contenus en masse QWAM Text Analytics (QTA).
Nous travaillons à divers axes d’amélioration tel que l’utilisation des plongements lexicaux (word embeddings) comme entrée pour un réseau de neurones. Nous souhaitons tester et évaluer différents algorithmes de reconnaissance d’entités, relations et sentiments.
Dans ce contexte, votre mission principale consistera en :
La constitution d’un jeu de données pour l’entraînement d’un modèle de reconnaissance d’entités, relations et sentiments avec, dans un premier temps, OpenNLP. Ensuite, l’évaluation d’autres librairies est aussi envisageable
L’optimisation et évaluation des modèles entraînés

De plus, vous serez amené(e) à participer aux tâches suivantes :
La conception et l’amélioration des règles linguistiques
L’actualisation et la maintenance de ressources linguistiques existantes
La réalisation d’un contrôle qualité et de traductions ponctuelles (anglais et/ou espagnol et/ou allemand)

Profil recherché

Étudiant(e) de niveau Master 2 en Traitement Automatique des Langues, ou Informatique avec une spécialisation en Traitement Automatique des Langues.
Programmation en Java et/ou Python


Bonne connaissance de librairies NLP (Stanford CoreNLP, SpaCy, OpenNLP…) et d’outils d’annotation comme GATE
Des expériences d’utilisation de librairies d’apprentissage automatique (Scikit-Learn, Deeplearning4j, TensorFlow, PyTorch…)
Notions en ontologie et web sémantique

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    QWAM CONTENT INTELLIGENCE
  • Secteur d’activité de la structure
    Emploi - Economie - Innovation - Numérique
  • Effectif de la structure
    De 11 à 20 salariés
  • Site internet de la structure
    https://www.qwamci.com
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    29 rue Taitbout
    75009 PARIS 9E ARRONDISSEMENT
  • Accès et transports
    saint lazare - opéra