Stage Data Scientist à Lille ou Paris

Stage Data Scientist Paris : Machine Learning et NLP (Natural Language Processing)

Clustaar est une entreprise spécialisée en Search Marketing et en Search Analytics basée à Paris, avec des clients en France et à l’international.

Nous développons un outil d’analyse sémantique, baptisé  » Clustaar « , basé sur un algorithme de clustering unique.
Il nous permet d’avoir une vision des requêtes tapées par les internautes dans les moteurs de recherche (Google ou autres).

L’objectif ? Devenir la référence mondiale en matière d’analyse des requêtes 

Comment comptons nous faire cela ?

Clustaar est composé de 3 équipes intriquées :

  • Les consultants SEO au contact des clients
  • Les développeurs qui industrialisent les solutions pour les rendre maintenables et robustes
  • Les data scientists, dont tu feras partie, qui tentent de comprendre toutes les langues en même temps sans en parler plus que 2 ou 3 chacun, donc 4 en tout…

Stage Data Scientist, Machine Learning Paris

Donc toi, oui toi, qui lis ces lignes. Si tu veux faire :

  • Des maths
  • Du NLP avec Benjamin
  • Du Machine Learning avec Quentin
  • Un peu de deep learning avec Niki
  • Booster tes qualités de codeur avec Aurélien
  • Participer à une boîte jeune et dynamique
  • Rire

Alors regarde le paragraphe suivant.

Comment travaille-t-on la donnée ?

Aurélien nous prépare une appli centrale aux petits oignons. Elle permet de traiter nos problématiques de travail de requêtes. Il faudra donc y injecter du code propre, bien préparé, testé, validé. Du vrai code de dev.

Mais avant il faut préparer la donnée, la passer au hachoir, et la repackager pour qu’elle soit utilisable.

Pour ce faire nous utilisons :

  • Des algorithmes de machine learning (clustering, algorithmes par modèle de forces…)
  • Des méthodes de NLP (Levenstein, …)
  • Notre propre couche logicielle basée sur Python / MongoDB et Angular.
  • Une boite à outils de DataViz, de stats et de BI (Gephi, Qlikview, R, Kibana…).

A quoi sert Clustaar maintenant ?

  • Etudes de marché et prévisions par l’analyse des requêtes tapées par les internautes dans Google
  • Optimisation du SEO (référencement naturel) de nos clients (optimisations sémantiques et stratégie de contenus)
  • Optimisation des moteurs de recherche interne sur les sites e-commerce, le SAV, les applis mobiles…
  • Création de moteur de discussion pour des chatbots

Ta mission

Nous aider à chouchouter nos clients et développer nos algorithmes de NLP et de clustering, en travaillant sur des projets client qui nécessitent des fortes compétences d’analyse :

  • Etudes de données de moteurs de recherche interne
  • Etudes sémantiques poussées
  • Analyse des logs serveur et des données web
  • Recommandations et accompagnement à la mise en oeuvre
  • Faire du code propre pour l’injecter dans le « Core »

Tu participeras également au développement de Clustaar et des méthodes

  • Test d’outils du marché et d’APIs
  • Propositions d’évolutions de notre outil propriétaire
  • R&D sur des algorithmes de clustering et de méthodes d’analyse sémantique

Nous cherchons à bâtir une équipe talentueuse et internationale. Les candidats internationaux sont les bienvenus !

Si tu es …

  • Curieux(se) : On aime bien poser des tonnes de questions à nos clients.
  • Volontaire : On est une petite boîte, tout est à faire, il faut « juste » le faire
  • Souriant(e) : On préfère

Avec ces quelques qualités, quelques pré-requis

  • Un cursus en Data Science, Machine Learning, Natural Language Processing ou Statistiques…
  • Des connaissances dans un ou plusieurs langages / outils, de préférence Python, Spark, RoR
  • Une bonne maîtrise de l’anglais

… Postule

Envoie un CV par mail à recrutement@clustaar.com

Pas besoin de lettre de motivation, par contre un mail avec tes envies à court et moyen terme ça nous intéresse.

Et après ?

On te propose :

  • un entretien pour te connaître
  • un entretien technique et algorithmie
  • et voilà, c’est plié, tu sais si tu as un stage