DDL - UMR 5596
ISH - Bat C
14 avenue Berthelot
69007 Lyon
Tél : 04 72 72 64 12
Fax : 04 72 72 65 90
Contact

Calendrier






Previous Month Décembre 2024 Previous Month
L M M J V S D
25 26 27 28 29 30 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

  Colloque
  Conférences
  Soutenance
  Divers
  Plusieurs évènements
 Vous êtes ici : Accueil /  Évènements / Calendrier

lun. 09/12/2024 [Séminaire DiLiS] Typologie quantitative à partir des treebanks syntaxiques Universal Dependencies
15:00-16:30
MSH-LSE, salle André Bollier (CHANGEMENT DE SALLE)
Conférence de :
  • Sylvain Kahane (Laboratoire Modyco (UMR 7114), Université Paris Nanterre et Institut Universitaire de France)

dans le cadre DILIS

https://cnrs.zoom.us/j/92715535367?pwd=0aD3I4A3OhVCSJttnOWcnabbPEU46s.1

--- Résumé
Après avoir présenté l’annotation syntaxique en dépendance, nous montrerons principalement trois études réalisées à partir des treebanks des 160 langues de la base UD, sans oublier d'en pointer les limites (déséquilibre de l’échantillonnage, qualité variable des annotations, nature du schéma d'annotation).
Une étude sur l’ordre des mots et les universaux à la Greenberg (Gerdes, Kahane, Chen 2021; Kahane, Peng, Gerdes 2023)
Une étude sur la complexité syntaxique en terme de longueur des dépendances et de flux de dépendance (Kahane & Yan 2019)
Une étude sur la taille des constituants selon leur position et le principe “short-before-long” (Gerdes & Kahane 2025)
Nous terminerons en présentant le projet ANR Autogramm d’induction de descriptions grammaticales à partir de treebanks et ses implications pour la typologie : possibilité d’induire les prédicteurs de l’ordre des mots, possibilité d’induire des grammaires contrastives.

Liens et références
  • Projet UD: https://universaldependencies.org/
  • Accès au treebanks: https://universal.grew.fr/
  • Typométrie sur UD: https://typometrics.elizia.net/#/
Gerdes K., Kahane S., Chen X. (2021) Typometrics: From Implicational to Quantitative Universals in Word Order Typology, Glossa: a journal of general linguistics 6(1):16. 1-31. DOI: http://doi.org/10.5334/gjgl.764
Gerdes K., Kahane S. (2025) The 2.5x factor: A linguistic “short-before-long” riddle across the 160 UD languages, Unidive, Budapest.
Herrera S., Corro C., Kahane S. (2024) Sparse Logistic Regression with High-order Features for Automatic Grammar Rule Extraction from Treebanks, Proceedings of LREC-Coling, 15114–15125.
Kahane S., Peng Z., Gerdes K. (2023). Word order flexibility: a typometric study. In Proceedings of the Seventh International Conference on Dependency Linguistics (Depling), GURT/SyntaxFest, 68-80, ACL.
Kahane S., Yan C. (2019) Advantages of the flux-based interpretation of dependency length minimization, Proccedings of the first international conference on Quantitative Syntax (Quasy), SyntaxFest, Paris.
Löfgren A., Herrera S., Guillaume B., Levshina N., Kahane S. (2025) Exploring Sampling Strategies for Linguistic Diversity: A Comparative Analysis of UD Treebanks, 15th International Conference of the Association for Linguistic Typology (ALT XV).




ASLAN -  Université de Lyon -  CNRS -  Université Lumière Lyon 2 -  MSH-LSE -  IXXI -  DDL :  Contact |  Mentions légales |