L'exploration de données peut être utilisée pour découvrir des modèles dans les données, mais elle n'est souvent effectuée que sur des échantillons de données. Le processus d'exploration sera inefficace si les échantillons ne sont pas une bonne représentation de l'ensemble des données. L'exploration de données ne peut pas découvrir des modèles qui peuvent être présents dans l'ensemble des données si ces modèles ne sont pas présents dans l'échantillon "exploité". L'incapacité à trouver des modèles peut être à l'origine de certains litiges entre les clients et les fournisseurs de services. L'exploration de données n'est donc pas infaillible, mais elle peut être utile si des échantillons de données suffisamment représentatifs sont collectés. La découverte d'un modèle particulier dans un ensemble particulier de données ne signifie pas nécessairement qu'un modèle se retrouve ailleurs dans les données plus larges à partir desquelles cet échantillon a été tiré. La vérification et la validation des modèles sur d'autres échantillons de données constituent une partie importante du processus