Nous présentons dans cet article les méthodes utilisées par l'équipe HULTECH pour sa participation au Défi Fouille de Textes 2012 Deft 2012 La tâche de cette édition du défi consiste à retrouver dans des articles scientifiques les mots-clés choisis par les auteurs Nous nous appuyons sur la détection de chaînes répétées maximales rst rmax au grain caractère et au grain mot La méthode développée est simple et non supervisée Elle a permis à notre système d'atteindre la 3e place sur 10 équipes sur la première piste du défi ----------- We present here the HULTECHHuman Language Technology team approach for the Deft 2012 french text mining challenge The aim of the challenge is to retrieve the keywords given by the authors of scientific articles Our method relies on a text algorithmics technic detection of maximal repeated strings This technic is applied at character level and word level We achieved the third rank over 10 of the first track
from HAL : Dernières publications http://ift.tt/1FB2Xf5
from HAL : Dernières publications http://ift.tt/1FB2Xf5

0 commentaires:
Enregistrer un commentaire