Il web è diventato una parte fondamentale dei nostri ordinari esercizi sociali e monetari. Il phishing di un sito Web può essere descritto come un'imitazione di un sito riservato per ottenere dati delicati da client online, ad esempio nomi utente e password. Il phishing è una frode del sito con l'aspettativa di tracciare e prendere i dati delicati dei clienti online. L'aggressore inganna il cliente con procedure di progettazione sociale come SMS, voce, e-mail, sito e malware. Questa tesi descrive diversi confini per identificare i siti come phishing o autentici. Poiché l'estrazione dei componenti è la parte principale di questo lavoro, sono stati forniti diversi confini degli elementi dai quali è possibile scegliere i confini utili per la disposizione aggiuntiva del sito di input come autentico o di phishing. Il classificatore SVM diventa più lento quando la dimensione delle informazioni aumenta e il tasso di precisione è basso. L'algoritmo Random Forest è stato proposto per superare questo inconveniente. Può classificare i siti Web come legittimi o non legittimi e anche migliorare il tasso di accuratezza.