dimanche 5 janvier 2014

Le Trameur

Pour calculer le nombre de co-occurrences avec les mots "placebo" et "effet" nous nous sommes servies du logiciel de lexicométrie le Trameur.
Pour calculer correctement le nombre de co-occurrences à l'intérieur d'un corpus (un fichier) à chaque étape de concaténation nous avons introduit la ligne de commande echo "§" >> ./FICHIERS_GLOBAUX/DUMP_GLOBAUX/DUMP_GLOBAUX-$i.txt; pour obtenir le parseur unique "§" entre les textes bruts.

Après avoir effectué un sacré travail de nettoyage à la main des "cochonneries" tels que ^, [, °, #, & etc., on a obtenu les résultats suivants:

Anglais


Arabe


Français


Russe



Nous avons affiché ici que les résultats intéressants et informatifs. 
Nous avons remarqué que le calcul de co-occurrence s'effectue de gauche à droite - c'est pourquoi parmi les co-occurrences trouvées par le Trameur, il n'y a pas le mot "effet" en français. Par contre, le mot "эффект" (effet) en russe a parmi ses résultats le mot "placebo" car celui-ci est toujoours placé à sa droite. 

Ce qui est triste c'est que l'Arabe n'a donné aucun résultat car le dictionnaire n'est pas reconnu.

Aucun commentaire:

Enregistrer un commentaire