Emolex
Le lexique des émotions dans 5 langues européennes.


Résultats


Approches et méthodologie

Deux approches jusqu’à présent utilisées séparément sont appliquées dans le cadre du projet : l’analyse systématique du lexique des émotions à travers l’étude de leur combinatoire lexico-syntaxique et une approche fondée sur des méthodes statistiques (étude des accompagnateurs qui s’avèrent préférentiels sur la base de calculs probabilistes). Cette dernière permet de mesurer la spécificité des cooccurrents des lexies d’un corpus et d’établir les relations de proximité distributionnelle et sémantique entre les lexies d’affect.

Une méthodologie rigoureuse a été élaborée pour la sélection des lexies (noms, verbes, adjectifs) des émotions regroupées dans 9 champs sémantiques (Surprise, Déception, Respect, Mépris, Joie, Admiration, Colère, Jalousie, Tristesse) et pour leur comparaison interlinguistique. Un protocole méthodologique a été également mis en place pour le codage sémantique et syntaxique des lexies. Les codages sémantiques correspondent aux valeurs intensité, polarité, contrôle, manifestation, causativité, aspect, expérienciation et verbalisation des émotions, les codages syntaxiques correspondent aux relations syntaxiques qu’entretient la lexie d’émotion (pivot) avec ses collocatifs, ainsi qu’aux structures actancielles (valence syntaxique et sémantique) des lexies. L’analyse linguistique des dimensions sémantiques, des relations syntaxiques et des structures actancielles permet d’atteindre le niveau discursif qui comprend l’étude de la dynamique informationnelle (thème-thème) au sein de la phrase, de l’argumentation, de la prévisibilité et des scénarios discursifs des lexies des émotions au niveau textuel. Les données des codages des collocations sont utilisées pour compléter les rubriques du dictionnaire Bilexicon.

Corpus multilingues

Les corpus comparables et parallèles (alignés), annotés syntaxiquement, constitués dans le cadre d’Emolex comportent environ 130 millions de mots pour chaque langue du projet, issus de textes littéraires et journalistiques. Des interfaces d’interrogation sophistiquées et ergonomiques, développées dans le cadre du projet, permettent de faire des requêtes complexes et d’extraire des collocations d’émotions dans les cinq langues et d’élaborer leurs profils combinatoires inter-linguistiques.

Base de données EmoBase

Une base de données (BDD) open source sera mise en ligne et inaugurée le vendredi 7 juin 2013. Cette BDD comporte trois volets :

  • EmoConc (interface d’interrogation des corpus multilingues),
  • EmoLing (interface permettant de faire des calculs statistiques et de comparer les profils combinatoires des lexies des émotions dans les cinq langues)
  • EmoProf (interface destinée aux enseignants / apprenants du FLE, comportant des cartes heuristiques et des séquences didactiques)

Colloque international

Un Colloque international Nouvelles perspectives en sémantique lexicale et en organisation du discours a eu lieu du 6 au 8 février 2013 à Osnabrück (Allemagne). Ce Colloque a été co-organisé par les trois équipes du projet Emolex et a réuni une cinquantaine de chercheurs de différents pays. Un ouvrage sera publié fin 2013 chez Peter Lang (P. Blumenthal, I. Novakova, D. Siepmann eds.), qui regroupera des contributions des trois volets du Colloque :

  • combinatoire lexico-syntaxique et organisation du discours
  • nouvelles approches en linguistique de corpus
  • perspectives lexicographiques et didactiques.