Atelier ASLAN Complexité -
Dimensions de complexité dans la synergie BFM / TXM pour l'analyse linguistique empirique par corpus
10h-12h
ENS de Lyon, Site Descartes, salle R174
Titre : Dimensions de complexité dans la synergie BFM / TXM pour l'analyse linguistique empirique par corpus
par Serge Heiden, ICAR
Résumé :
L'équipe LinCoBaTo du laboratoire ICAR développe la méthode d'analyse de corpus textuels appelée "textométrie" qu'elle diffuse à travers son implémentation dans le logiciel "TXM". Ce logiciel est utilisé par la même équipe pour analyser linguistiquement le corpus diachronique de la Base de Français médiéval composée des premiers textes du français du IXième au XVième siècle.
La description de la prise en charge par les outils d'analyse de TXM de toute la richesse des encodages numériques et des annotations disponibles sur ces textes sera l'occasion de présenter la complexité des accès aux différents niveaux et points de vue linguistiques et des représentations numériques associées. L'exposé abordera également les invariants statistiques habituels que l'on trouve dans l'analyse de données textuelles à différents niveaux linguistiques.