Os grandes dados são dados que excedem a capacidade de processamento dos sistemas de bases de dados convencionais. Os dados são demasiado grandes, movem-se demasiado depressa ou não se adequam às restrições das suas arquitecturas de bases de dados. Para obter valor destes dados, é necessário escolher uma forma alternativa de os processar. O valor dos grandes volumes de dados para uma organização divide-se em duas categorias: utilização analítica e criação de novos produtos. A análise de grandes volumes de dados pode revelar conhecimentos anteriormente ocultos por dados demasiado dispendiosos para processar, como a influência dos pares entre os clientes, revelada pela análise das transacções dos compradores e dos dados sociais e geográficos. A capacidade de processar todos os itens de dados em tempo razoável elimina a necessidade problemática de amostragem e promove uma abordagem de investigação dos dados, em contraste com a natureza algo estática da execução de relatórios pré-determinados.