La rapida crescita di Internet e dei social media ha portato a un aumento delle dimensioni del traffico Internet e della complessità dell'analisi del comportamento del traffico, soprattutto nelle reti su larga scala come le piattaforme dei social media. Le metodologie tradizionali basate su regole sono state sostituite da approcci automatizzati basati sull'apprendimento automatico, grazie alla disponibilità di grandi insiemi di dati che consentono modelli di intelligenza artificiale ad alte prestazioni. Questo libro passa in rassegna le recenti ricerche sull'analisi del traffico informatico nei social network e in Internet, concentrandosi sui concetti di somiglianza, correlazione e indicazione collettiva e sottolineando l'importanza degli obiettivi di sicurezza nella classificazione di host, applicazioni, utenti e tweet della rete. Per affrontare queste sfide, il documento introduce una nuova metodologia di ricerca chiamata data-driven cyber security (DDCS) e la sua applicazione nell'analisi del traffico sociale e Internet. La metodologia DDCS è costituita da tre componenti principali: l'elaborazione dei dati di sicurezza informatica, l'ingegneria delle caratteristiche di sicurezza informatica e la modellazione della sicurezza informatica.