A análise de cenas complexas por computadores não é uma tarefa trivial, entretanto, o cérebro humano pode realizar esta função de maneira eficiente. A evolução natural tem desenvolvido formas para otimizar nosso sistema visual, de modo que apenas partes importantes da cena sejam analisadas a cada instante. Este mecanismo de seleção é denominado por atenção visual. Neste cenário, diversas teorias têm sido propostas e podem ser agrupadas em duas linhas principais: atenção baseada no espaço (Bottom-up) e atenção baseada em objetos (Top-down). Um importante ponto a ser notado é a característica de integração entre os modelos de atenção visual bottom-up e top-down. De maneira geral, tanto processos bottom-up, quanto processos top-down, atuam na seleção dos estímulos mais relevantes no campo receptivo. Nesta condição, a atenção visual pode ser considerada como um processo intermediário que integra coerentemente estes estímulos.