La minería de textos o minería de datos es una herramienta de descubrimiento de conocimiento que se refiere al proceso de extraer patrones interesantes y no triviales de una base de datos de textos no estructurados. Aquí presentamos un nuevo sistema de aprendizaje automático para la minería de conjuntos de datos biológicos (datos de texto/literatura científica) con el fin de comprender las relaciones entre dos genes (dos términos) en un texto científico. El sistema imita la inteligencia humana y determina con precisión las relaciones entre dos genes/proteínas. Los conjuntos de datos bibliográficos se curaron manualmente mediante deep curation para generar el conjunto de entrenamiento. Además, nuestros resultados de predicción se validaron con la ayuda de expertos para generar la confianza necesaria para utilizar nuestro sistema en diferentes situaciones en tiempo real. A continuación, el sistema se automatizó para que personas de todo el mundo puedan determinar las relaciones entre dos o más moléculas en un texto utilizando máquinas de vectores soporte. Nuestro equipo aplica con frecuencia este sistema semiautomatizado para escribir reseñas sobre un tema determinado. Por ejemplo, nuestro equipo fue capaz de examinar y extraer más de 36 000 artículos para escribir una reseña sobre herramientas de acoplamiento molecular. En 2016, nuestro equipo fue capaz de reconstruir la red molecular de la obesidad utilizando este sistema (Jaisri et al 2016, Plos One).
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.