Per costruire il classificatore, abbiamo seguito un approccio sistematico che prevedeva diversi passaggi chiave. Per prima cosa abbiamo caricato il set di dati, che in genere consiste in una raccolta di messaggi etichettati come spam o ham. Questo set di dati funge da base per la formazione e la valutazione del nostro classificatore. Successivamente, abbiamo eseguito la preelaborazione dei dati e l'estrazione delle funzionalità. Ciò ha comportato la trasformazione dei messaggi di testo grezzi in rappresentazioni di caratteristiche numeriche che gli algoritmi ML possono elaborare.