Spontannaq markirowka soderzhaniq cifrowogo izobrazheniq qwlqetsq naibolee wazhnoj problemoj glubokogo obucheniq, kotoraq swqzywaet komp'üternuü wizualizaciü i anglijskij qzyk. V ätoj issledowatel'skoj rabote my sozdali model' rasprostraneniq, osnowannuü na glubokoj rekurrentnoj produkcii, kotoraq ob#edinqet sowremennye usowershenstwowaniq w komp'üternoj wizualizacii i pereskaze kontrib'ücii i mozhet byt' ispol'zowana dlq porozhdeniq regulqrnyh werdiktow, markiruüschih cifrowoe izobrazhenie. Prototip wypolnen takim obrazom, chtoby ispol'zowat' wse preimuschestwa weroqtnosti ob#ektiwnogo ob#qsnitel'nogo werdikta, uchitywaq sootwetstwie cifrowogo izobrazheniq. Dannaq rabota naprawlena na generaciü subtitrow dlq izobrazhenij s ispol'zowaniem nejronnyh qzykowyh modelej. S teh por kak nejrolingwisticheskie modeli i glubokie swertochnye nejronnye seti (CNN) poluchili shirokoe rasprostranenie, kolichestwo predlagaemyh modelej dlq zadachi sozdaniq subtitrow k cifrowym izobrazheniqm znachitel'no wozroslo. Nasha rabota osnowana na odnoj iz takih rabot, w kotoroj ispol'zuetsq wariant rekurrentnoj nejronnoj seti (RNN) w sochetanii s CNN.