Le trameur et Itrameur

 

Pour analyser le mot que nous avons choisi, en l’occurence « robot », nous utilisons un logiciel qui s’appelle « Le Trameur » .

Def : Le Trameur est un programme d’analyse comportant de nombreuses fonctionnalités pour l’analyse automatique, statistique et documentaire de textes en vue de leur profilage sémantique, thématique et de leur interprétation. Ce logiciel est à l’origine un outil de textométrie : il intègre les fonctionnalités classiques de ce type d’outils dans ce domaine. Il dispose aussi des fonctionnalités particulières qui permettent d’annoter dynamiquement des corpus ou d’explorer des ressources richement annotées (treebanks monolingues/multilingues ou des alignements).

Travaillant sur mac, je n’ai pas pu ouvrir le logiciel directement, un message d’erreur apparaissait dès que j’essayais. J’ai du télécharger un petit logiciel en plus « XQuartz » me permettant la bonne ouverture du Trameur. Puis j’ai lancé l’ouverture du logiciel via mon terminal :

 

Capture d’écran 2018-01-04 à 18.31.01.png

 

Ensuite nous avons chargé le corpus français dans le logiciel en important le fichier contenant la concaténation des fichiers DUMPS bien encodés en UTF8. Nous avons bien coché la case étiquetage avant l’importation du fichier.

Une fois le corpus chargé, nous avons regardé dans l’onglet Forme – Lemme du logiciel afin de reperer le nombre de fois que notre mot a été mentionné.

On voit ici que le mot « robot » tel que nous l’avions orthographié dans la barre de recherche apparait 428 fois. Au pluriel il apparait 222 fois.

En revanche nous ne comprenons pas pourquoi le mot robot apparait deux fois, et qu’il est indiqué que la première forme du mot (grisée sur la capture d’écran) a une féquence de 1. Nous ne savons pas pourquoi les deux formes ne sont pas rassemblées en une seule.

Nous avons le même problème dans l’espace réservé aux lemmes. Le mot robot apparait deux fois, séparement. Et on remarque que le lemme « robot » apparait bienplus que sa forme : 662.

letrameur.png

 

Puis nous allons dans l’onglet concordance afin que toutes les occurences d’un mot que nous allons chercher dans la barre de recherche à gauche soient trouvées et présentées. Ces formes sont présentées avec leur contexte, afin de rendre visibles les mots adjacents.

Ici la construction des concordances :

concordance.png

Nous pouvons également trier ces concordances pour plus de lisibilité dans l’onglet Tri-Concordance. Cela nous les classe et donne plus de visibilité dans la concordance obtenues :

Capture d’écran 2018-01-04 à 17.42.13.png

Capture d’écran 2018-01-12 à 22.23.35.png

On peut constater apres la lecture de ce concordancier que le terme robot est principalement utilisé pour parler de robot humanöide ou androïde fabriqués dans le but d’aider l’homme ou de lui simplifier des tâches. Des IA dernières générations qui font l’objets de polimiques ou de critiques mais qui sont censées nous apporter une grande aide. Il est question notament (et ce robot revient souvent dans notre corpus) d’un petit robot concu pour passer du temps avec les personnes hospitalisées.

Nous n’avons que très peu d’occurences du mot robot pour désigner des robots ménagers  ou autres plus anciens, la majorité désigne de nouveaux robots, dernier cri ou en construction, les dernières technologies.

Et en chinois, le terme AI est plus fréquent dans les concurrences  de 机器人(robot).  D’ailleurs, les 机器人 (robot) sont de plus en plus automatisés et personnalisés, car ils sont liés avec les termes signifiés  tels que 语音(pronunciation) et  情感 (émotion),etc.

Ici, nous décidons d’utiliser l’onglet Cooc, afin de trouver les cooccurrences du mot.

Nous pouvons voir les mots auxquels notre mot « robot | 机器人 » est principalement relié :

coocurance.png

robot_cooc.png

ITRAMEUR :

Nous sommes ensuite aller completer notre analyse sur ITrameur.

Nous avons donc importé notre fichier pour la segmentation du texte, ajouter le mot que nous voulions analyser et calculer les cooccurrents

Capture d’écran 2018-01-04 à 18.32.26.png

Voici ce que nous obtenons, nous avons les mêmes résultats que les cooccurrents dans le Trameur : les mots « humanoïde », « autonome », « Cozmo » reviennent souvent, ainsi que les mots « compagnon », « chien », « hospitalisés »

Ces résultats sont bien en accord avec notre première analyse, qui était que le corpus français (les URLS ayant été récoltées au même moment et sur Google Actualité) parle principalement lorsqu’il s’agit du terme « robot » des nouvelles technologies récentes et du ou des robots hospitaliers qui tiennent compagnie aux patient hospitalisées (car au moment de la collecte des URLS il y avait une grande explosion médiatique à ce sujet)

Capture d’écran 2018-01-04 à 18.12.54.png

Capture d’écran 2018-01-04 à 18.13.04.png

Laisser un commentaire

search previous next tag category expand menu location phone mail time cart zoom edit close