dimanche 22 janvier 2012

Nuages de mots avec Wordle

On a résolu un petit problème de concatenation du contenu des fichiers .txt et on a terminé notre script ! Notre aventure est arrivée à une étape très importante ! :-)
Pour ce faire on a créé des fichiers qui s'appellent "Contextesglobaux" pour chaque langue prise en compte par notre analyse: français, anglais et italien, et pour les deux parties à analyser : critique de cinéma et critique de théâtre.
D'abord on a essayé de construire de nuages de mots avec Wordle, en ajoutant le contenu de chaque fichier appelé "Contextesglobaux" pour le verbe français "jouer" (et les verbes correspondant en anglais et italien). Dans le tableau noir à gauche, il y a le résultat pour ce qui concerne l'analyse de la critique de cinéma et dans le tableau ci-dessous, il y a le résultat pour ce qui concerne l'analyse de la critique de théâtre. On a remarqué plusieurs éléments utils pour notre analyse linguistique:

1) Pour ce qui concerne le verbe "jouer" en français (mais aussi bien "play" en anglais et "interpretare" en italien), il n'y a pas beaucoup de différences entre les nuages de mots qui composent les critique de cinéma et les nuages de mots  qui composent les critique de théâtre.
2) Toutefois, une différence très importante, c'est la liaison entre le verbe choisi (le motif) et les mots du contexte extrait. Par exemple, dans le contexte du verbe "jouer" dans les critiques de cinéma le mot "film" est très fréquemment lié au "jouer", par contre dans les critiques de théâtre  le mot "pièces" est plus fréquemment lié au "jouer").
3) Cette remarque nous conduit à penser que notre analyse ne doit pas unifier les contextes de cinéma et théâtre parce que, autrement, les différences significatives iraient disparaître.

Ici, dans notre blog, on a présenté juste des exemples d'analyse mais on développera tout ça dans le site web qu'on est en train de construire et qui contient une comparaison des nuages de mots dans les trois langues pour chaque type de critique. Le Trameur nous permettra de développer ces intuitions parce que il donne la possibilité de construire de nuages de mots contextualisées. Notre prochaine post sera alors dédié aux résultats de ce type d'analyse...