L objectif de la thèse est de parvenir, grâce à une étude de corpus, à la génération de descriptions dé nies référant à des entités nouvelles et de descriptions démonstratives. La première partie présente un état de l art et la seconde expose les résultats de notre étude. Le premier chapitre expose les données théoriques et empiriques sur les expressions référentielles et les limites de ces analyses. Le deuxième chapitre présente la problématique de la génération d expressions référentielles, et le troisième présente la linguistique de corpus et le traitement de corpus électroniques. La première partie s achève par une synthèse reliant les trois domaines abordés. Le cinquième chapitre présente les travaux réalisés sur le corpus, des pré-traitements à l extraction des résultats. Les sixième et septième chapitres exposent les résultats d une étude des anaphores associatives et des SN coréférentiels annotés dans notre corpus et deux extensions de l algorithme de Gardent et Striegnitz. Le dernier chapitre présente les contraintes sémantiques et syntaxiques identifiées à l aide du corpus sur le choix du déterminant des descriptions.