Questo libro è progettato utilizzando Visual ASP .Net 2010 e MS-SQL Server 2008. Il linguaggio di codifica usato è VB.NET. Il progetto coinvolge le impostazioni per varie opzioni come la ricerca delle pagine web ed estrae gli id di posta, gli URL del web, i numeri di telefono, i link per scaricare le canzoni e i tag come i tag di intestazione. Il livello di profondità è dato in modo che non solo le pagine web date, ma anche le pagine collegate a questa pagina web vengono cercate e il contenuto viene estratto. L'approccio multi-threading è usato in modo che ogni pagina sia cercata da un thread separato e questo aiuta a velocizzare il processo. Nel sistema proposto più pagine web possono essere cercate nello stesso o in diversi siti web con una ricerca intelligente, quindi prende la risorsa da una pagina web con l'uso di profondità. La ricerca intelligente viene eseguita utilizzando un'estrazione avanzata chiamata espressione regolare e quindi qualsiasi tipo di informazione può essere estratta. Per esempio, il modello \d{6} recupera i codici postali indiani.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.