Quelle est la quantité d'information nécessaire a priori pour découvrir la structure d'une langue ? Le paradigme de l'apprentissage automatique porte sur la question un éclairage qui peut surprendre. Cet ouvrage propose l'une des premières introductions en français à ce champ de recherche. Il en illustre la démarche en l'appliquant à deux problèmes liés en phonologie et en morphologie : le classement des phonèmes en consonnes et voyelles et la description du mode de formation du mot qui prévaut dans les langues comme l'arabe ou l'hébreu. Sur un mode didactique, l'ouvrage présente les principales approches développées dans ce domaine, avec un accent particulier sur les méthodes et modèles basés sur la théorie des probabilités et la théorie de l'information. Plus généralement, il montre que des structures linguistiques complexes peuvent être découvertes en ne faisant qu'un minimum d'hypothèses a priori sur les phénomènes considérés.