Het automatiseren van bijschriften, d.w.z. het creëren van de taalbeschrijving van een afbeelding met behulp van een natuurlijke taalverwerking, is een moeilijke taak. Het vereist een goede grip op zowel de beeldverwerking als de natuurlijke taalverwerking. Dit boek bespreekt verschillende beschikbare technieken die model staan voor de afbeeldingsonderschriften. De vooruitgang van de technologie op het gebied van objectherkenning en machinaal leren heeft de prestaties van het afbeeldingsonderschrijfmodel in de afgelopen jaren sterk verbeterd. Daarnaast zullen we proberen de verschillende technieken en algoritmes te benaderen om dit model te bouwen. Uiteindelijk speelt modelevaluatie een belangrijke rol die nuttig zal zijn om na te gaan welk algoritme het beste past in het scenario. Er zijn technieken die gebruikt kunnen worden om de prestaties te evalueren zoals verwarringsmatrix, f1-score, maar in dit geval is de data gebaseerd op natuurlijke taal dus gebaseerd op dat er een bepaald speciaal type technologie kan worden gebruikt zoals Microsoft COCO en Flickr30K.