Pour analyser le mot que nous avons choisi, en l’occurence « robot », nous utilisons un logiciel qui s’appelle « Le Trameur » .
Def : Le Trameur est un programme d’analyse comportant de nombreuses fonctionnalités pour l’analyse automatique, statistique et documentaire de textes en vue de leur profilage sémantique, thématique et de leur interprétation. Ce logiciel est à l’origine un outil de textométrie : il intègre les fonctionnalités classiques de ce type d’outils dans ce domaine. Il dispose aussi des fonctionnalités particulières qui permettent d’annoter dynamiquement des corpus ou d’explorer des ressources richement annotées (treebanks monolingues/multilingues ou des alignements).
Travaillant sur mac, je n’ai pas pu ouvrir le logiciel directement, un message d’erreur apparaissait dès que j’essayais. J’ai du télécharger un petit logiciel en plus « XQuartz » me permettant la bonne ouverture du Trameur. Puis j’ai lancé l’ouverture du logiciel via mon terminal :
Ensuite nous avons chargé le corpus français dans le logiciel en important le fichier contenant la concaténation des fichiers DUMPS bien encodés en UTF8. Nous avons bien coché la case étiquetage avant l’importation du fichier.
Une fois le corpus chargé, nous avons regardé dans l’onglet Forme – Lemme du logiciel afin de reperer le nombre de fois que notre mot a été mentionné.
On voit ici que le mot « robot » tel que nous l’avions orthographié dans la barre de recherche apparait 428 fois. Au pluriel il apparait 222 fois.
En revanche nous ne comprenons pas pourquoi le mot robot apparait deux fois, et qu’il est indiqué que la première forme du mot (grisée sur la capture d’écran) a une féquence de 1. Nous ne savons pas pourquoi les deux formes ne sont pas rassemblées en une seule.
Nous avons le même problème dans l’espace réservé aux lemmes. Le mot robot apparait deux fois, séparement. Et on remarque que le lemme « robot » apparait bienplus que sa forme : 662.