Textowyj majning ili majning dannyh - äto instrument obnaruzheniq znanij, pod kotorym ponimaetsq process izwlecheniq interesnyh i netriwial'nyh zakonomernostej iz bazy dannyh nestrukturirowannyh textow. Zdes' my predstawlqem nowuü sistemu mashinnogo obucheniq dlq dobychi biologicheskih dannyh (textowyh dannyh/nauchnoj literatury) s cel'ü wyqwleniq swqzej mezhdu dwumq genami (dwumq terminami) w nauchnom texte. Sistema imitiruet chelowecheskij intellekt i tochno opredelqet swqzi mezhdu dwumq genami/belkami. Dlq sozdaniq obuchaüschego nabora my wruchnuü proanalizirowali nabory literaturnyh dannyh, ispol'zuq metod glubokogo analiza. Krome togo, rezul'taty prognozirowaniq byli prowereny s pomosch'ü äxpertow, chto pozwolilo sozdat' uwerennost' w ispol'zowanii nashej sistemy w razlichnyh situaciqh real'nogo wremeni. Dalee sistema byla awtomatizirowana, chtoby lüdi po wsemu miru mogli opredelqt' swqzi mezhdu dwumq ili bolee molekulami w texte s pomosch'ü mashin opornyh wektorow. Jeta poluawtomatizirowannaq sistema chasto primenqetsq nashej komandoj dlq napisaniq obzorow na zadannuü temu. Naprimer, dlq napisaniq obzora po instrumentam molekulqrnogo dokinga nasha komanda smogla proseqt' i izuchit' bolee 36000 statej. V 2016 godu nasha komanda smogla rekonstruirowat' molekulqrnuü set' ozhireniq s pomosch'ü ätoj sistemy (Jaisri et al 2016, Plos One).