Internet est le siège d'une création massive et permanente de données. L'exploitation efficace de celles-ci implique un besoin d'outillage des utilisateurs. Les techniques de classification automatique concernent la caractérisation de classes dans un ensemble d'éléments, et sont très souvent employées pour la réalisation d'outils rendant l'information accessible aux utilisateurs. Dans le cadre de cette thèse, nous avons contribué à l'agrégation de modèles de mélange de distributions de probabilité. Cette classe de modèles est en effet souvent utilisée pour des tâches de catégorisation. Nos propositions, utilisant un formalisme bayésien variationnel, sont caractérisées par des coûts de calcul et de transmission réduits, adéquats pour le traitement de données réparties. Nous avons également contribué à la classification visuelle de données en flux. Pour ce faire, nous avons notamment employé des principes bio-mimétiques, ou encore des résultats de la théorie des graphes. Outre la proposition d'interfaces efficaces pour un utilisateur, nous avons également envisagé la manière dont celui-ci peut rétro-agir sur le processus de classification.