56,99 €
inkl. MwSt.
Versandkostenfrei*
Versandfertig in 6-10 Tagen
  • Broschiertes Buch

L'apprentissage statistique propose un ensemble de techniques capables de construire des modèles à partir d'observations passées. Ces techniques ont montré leur capacité à traiter des volumétries importantes. Cependant, de nouvelles applications génèrent de plus en plus de données visibles sous la forme d'un flux et qui doivent être traitées séquentiellement. Parmi ces applications, on citera : la publicité en-ligne, la modélisation des utilisateurs au sein d'un réseau social, le web mining. L'un des défis techniques est de concevoir des algorithmes permettant l'apprentissage avec les…mehr

Produktbeschreibung
L'apprentissage statistique propose un ensemble de techniques capables de construire des modèles à partir d'observations passées. Ces techniques ont montré leur capacité à traiter des volumétries importantes. Cependant, de nouvelles applications génèrent de plus en plus de données visibles sous la forme d'un flux et qui doivent être traitées séquentiellement. Parmi ces applications, on citera : la publicité en-ligne, la modélisation des utilisateurs au sein d'un réseau social, le web mining. L'un des défis techniques est de concevoir des algorithmes permettant l'apprentissage avec les nouvelles contraintes imposées par les flux de données. Nous proposons d'aborder ce problème à l'aide de nouvelles techniques de résumé de flux de données dans le cadre de l'apprentissage supervisé. Notre méthode prend en compte les ressources mémoire et processeur. Ces résumés constituent un prétraitement qui nous permet de proposer de nouvelles versions du classifieur bayésien naïf et des arbres de décision fonctionnant en-ligne sur flux de données. Les flux de données peuvent comporter des changements de concept. Nous proposons aussi une nouvelle technique supervisée pour détecter ces changements.
Autorenporträt
Christophe Salperwyck travaille dans le domaine du traitement des données volumineuses (Big Data). Il a effectué sa thèse de doctorat à Orange Labs sur l'apprentissage sur flux de données et plus particulièrement les méthodes en-ligne. Ses méthodes peuvent s'appliquer aux domaines de la publicité en-ligne ou de la sélection de contenu.