Le capacità di imaging delle fotocamere digitali o degli smartphone sono aumentate e l'acquisizione di video è diventata molto semplice per la scansione, la condivisione e l'archiviazione di documenti. Così, le persone hanno iniziato a utilizzare glismartphone per catturare schermi digitali, poster di grandi dimensioni, documenti, ricevute e alcune superficiriflettenti come le carte d'identità. Tuttavia, per ottenere un'immagine chiara, spesso sono necessari più scatti.per ottenere un'immagine chiara, spesso sono necessari più scatti e spostarsi tra i vari scatti può essere difficile e dispendioso in termini di tempo. Per evitare questo mosaico di scatti multipli, è preferibile ottenere più fotogrammi di un singolo video per ottenereil contenuto in un'unica ripresa.Viene proposto un metodo per costruire in modo automatico ed efficiente l'immagine a mosaico per il video in ingresso, in cui l'attenzione si concentra principalmente sul mosaico di immagini utilizzando il fotogramma di riferimento.il fotogramma di riferimento. Questo fotogramma di riferimento è quello in cui è visibile l'intero documento.Gli algoritmi come la Trasformazione prospettica omografica, la Trasformazione di caratteristicheInvariant Feature Transformation (SIFT) e Mean Structural Similarity (MSSIM) sono utilizzati nel processo di mosaico di immagini.