Stage Développement informatique

Stage de développement de crawler de fichiers

Rattaché(e) au CTO et en collaboration avec l’équipe de développement, la mission consiste à analyser, développer et valider de nouvelles fonctionnalités pour un crawler de fichiers de données non structurées. Ecrit sur le runtime nodejs, le crawler s’intègre dans les plateformes Linux, Macos et Windows, et a pour objectif de détecter dans de gros volumes de fichiers (textes, bureautiques, zip, pdf) des occurrences de concepts ou de mots issus de thésaurus ou de dictionnaires.

Le crawler fournira le résultat sous la forme d’un ensemble d’entités JSON contractualisées et compatibles avec notre plateforme de cartographie du système d’information. Les nouvelles fonctionnalités du crawler ne devront pas dégrader les temps de réponse de la plateforme auditée malgré le volume important d’informations à auditer.

Voici les missions proposées lors de ce stage :

Analyse :

  • Rechercher et valider les dictionnaires / thésaurus utilisés
  • Définir les types sémantiques à rechercher dans les données (email, # CB, # CI, …)
  • Architecturer la solution cible afin de respecter l’objectif de performance

Développement :

  • Découper la backlog en items de 1 à 2 jours de développement
  • Prioriser les tâches
  • Respect des pourcentages cibles de taux de couverture de code

Tests et recette :

  • Participer aux tests de la solution
  • Intégrer le nouveau crawler dans la plateforme existante
  • Recetter le développement dans un environnement de production

Le profil que nous recherchons :

Tu es autonome et organisé.e, passionné.e par la technique et le développement de solutions efficaces. Tu as connaissances des enjeux liés à la sécurité au sein des Systèmes d’Information. Tu aimes travailler en équipe, tu es polyvalent.e, curieux.se. et force de proposition.

Tu rêves de découvrir le travail au sein d’une startup ? Envois nous ta candidature et ton CV à rh@dawizz.fr