Il data mining può essere utilizzato per scoprire modelli nei dati, ma spesso viene effettuato solo su campioni di dati. Il processo di estrazione sarà inefficace se i campioni non sono una buona rappresentazione dell'insieme dei dati. Il data mining non può scoprire modelli che potrebbero essere presenti nell'insieme dei dati se tali modelli non sono presenti nel campione che viene "estratto". L'incapacità di trovare modelli può diventare una causa di controversie tra clienti e fornitori di servizi. Pertanto, il data mining non è infallibile, ma può essere utile se vengono raccolti campioni di dati sufficientemente rappresentativi. La scoperta di un particolare schema in un particolare insieme di dati non significa necessariamente che lo stesso schema si trovi altrove nei dati più ampi da cui è stato tratto il campione. Una parte importante del processo è la verifica e la convalida dei modelli su altri campioni di dati.