A aprendizagem automática registou recentemente alguns desenvolvimentos dramáticos, que suscitaram um grande interesse por parte da indústria, do meio académico e da cultura popular. Estes desenvolvimentos são impulsionados pelos avanços nas redes neuronais artificiais, frequentemente designadas por aprendizagem profunda, um conjunto de técnicas e algoritmos que permitem aos computadores descobrir padrões complicados em grandes conjuntos de dados. Os avanços são alimentados por um maior acesso aos dados ("big data"), por quadros de software de fácil utilização e por uma explosão da capacidade de computação disponível, permitindo a utilização de redes neuronais mais profundas do que nunca. Atualmente, estes modelos constituem a abordagem mais avançada para uma grande variedade de problemas no domínio da visão computacional, da modelização da linguagem e da robótica. A aprendizagem profunda alcançou a sua posição de destaque na visão computacional quando as redes neuronais começaram a superar outros métodos em vários testes de referência de análise de imagem de alto nível. O mais famoso foi o Image Net Large-Scale Visual Recognition Challenge (ILSVRC) em 2012, quando um modelo de aprendizagem profunda (uma rede neural convolucional) reduziu para metade a segunda melhor taxa de erro na tarefa de classificação de imagens.