Il Data Mining dei database di sequenze proteiche pone delle sfide perché molte sequenze proteiche non sono relazionali, mentre la maggior parte degli algoritmi di Data Mining presuppone che i dati di input siano database relazionali. Inoltre, i database di sequenze proteiche grezzi non forniscono informazioni significative finché non vengono suddivisi in categorie significative. In questo libro sono stati utilizzati 1700 dati di sequenze proteiche di VEGF (Vascular Endothelial Growth Factor) e algoritmi di Data Mining per la predizione. Nel biocomputing, le tecniche di Data Mining (DM) sono ampiamente utilizzate per la previsione della struttura delle proteine. L'interpretazione di voluminosi dati biologici è complessa e la necessità di concetti di Data Mining è significativa. I dati molecolari come la sequenza di DNA/proteine, il livello di espressione genetica, le vie biochimiche, i biomarcatori e le strutture proteiche costituiscono una parte importante dei dati biologici. Il libro illustra come vengono eseguite le tecniche standard di Data Mining, come l'estrazione dei dati proteici, la segregazione tramite clustering, l'associazione e la visualizzazione su un set di dati di sequenze proteiche in tempo reale. Lo strumento integrato esistente BioParisodhana viene confrontato con BioBCDM, dove il nuovo strumento supera BioParisodhana.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.