Data Mining von Proteinsequenzdatenbanken stellt eine Herausforderung dar, da viele Proteinsequenzen nicht relational sind, während die meisten Data-Mining-Algorithmen davon ausgehen, dass die Eingabedaten eine relationale Datenbank sind. Darüber hinaus liefern rohe Proteinsequenzdatenbanken keine aussagekräftigen Informationen, solange sie nicht in sinnvolle Kategorien unterteilt werden. In diesem Buch wurden 1700 VEGF (Vascular Endothelial Growth Factor) Proteinsequenzdaten verwendet und Data-Mining-Algorithmen für die Vorhersage eingesetzt. Im Biocomputing werden Data-Mining-Techniken (DM) häufig für die Vorhersage von Proteinstrukturen verwendet. Die Interpretation umfangreicher biologischer Daten ist komplex und der Bedarf an Data-Mining-Konzepten ist groß. Molekulare Daten wie DNA-/Proteinsequenzen, das Niveau der genetischen Expression, biochemische Pfade, Biomarker und Proteinstrukturen machen einen großen Teil der biologischen Daten aus. In diesem Buch wird erörtert, wieStandard-Data-Mining-Techniken wie die Extraktion von Proteindaten, Segregation durch Clustering, Assoziation und Visualisierung auf einem Echtzeit-Proteinsequenzdatensatz durchgeführt werden. Das bestehende integrierte Tool BioParisodhana wird mit BioBCDM verglichen, wobei das neue Tool BioParisodhana übertrifft.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.