Avec l'augmentation de la taille des données, la recherche d'information devient de plus en plus complexe. Ces données sont de plus en plus précises, vivant dans des espaces multidimensionnels (allant d'une dizaine de dimension à plusieurs millions et au-delà). De fait, ces espaces sont creux et rendent l'analyse ou la classification difficiles. Il est alors nécessaire de réduire les données dans un espace compact représentatif de la variété dont ils sont issus. Les nouvelles techniques de réduction de dimension se basent sur l'analyse des faiblesses des représentations linéaires telles que l'analyse en composantes principales et permettant de représenter efficacement des données complexes. La fonction de passage entre ces deux espaces permet d'améliorer la classification dans l'espace réduit ainsi que l'analyse statistique dans l'espace d'origine des données.