A extração de dados de bases de dados de sequências de proteínas coloca desafios porque muitas sequências de proteínas não são relacionais, enquanto a maioria dos algoritmos de extração de dados assume que os dados de entrada são bases de dados relacionais. Além disso, a base de dados de sequências de proteínas em bruto não fornece informações significativas enquanto não for dividida em categorias significativas. Neste livro, foram utilizados 1700 conjuntos de dados de sequências de proteínas VEGF (Vascular Endothelial Growth Fator) e algoritmos de exploração de dados para a previsão. Em Biocomputação, as técnicas de Data Mining (DM) são amplamente utilizadas para a previsão da estrutura das proteínas. A interpretação de dados biológicos volumosos é complexa e a necessidade de conceitos de extração de dados é significativa. Os dados moleculares, como a sequência de ADN/proteínas, o nível de expressão genética, as vias bioquímicas, os biomarcadores e as estruturas proteicas constituem uma parte importante dos dados biológicos. O livro aborda a forma como são executadas as técnicas padrão de exploração de dados, como a extração de dados de proteínas, a segregação por agrupamento, a associação e a visualização num conjunto de dados de sequências de proteínas em tempo real. A ferramenta integrada existente BioParisodhana é comparada com o BioBCDM, onde a nova ferramenta supera o BioParisodhana.