Data Mining kann zur Aufdeckung von Mustern in Daten verwendet werden, wird aber oft nur an Stichproben von Daten durchgeführt. Der Mining-Prozess ist unwirksam, wenn die Stichproben keine gute Repräsentation der Gesamtheit der Daten sind. Data Mining kann keine Muster entdecken, die in der Gesamtheit der Daten vorhanden sind, wenn diese Muster nicht in der untersuchten Stichprobe vorhanden sind. Die Unfähigkeit, Muster zu finden, kann ein Grund für Streitigkeiten zwischen Kunden und Dienstleistern sein. Data Mining ist also nicht narrensicher, kann aber nützlich sein, wenn ausreichend repräsentative Datenproben gesammelt werden. Die Entdeckung eines bestimmten Musters in einem bestimmten Datensatz bedeutet nicht zwangsläufig, dass das Muster auch an anderer Stelle in den größeren Daten, aus denen diese Stichprobe gezogen wurde, zu finden ist. Ein wichtiger Teil des Prozesses ist die Überprüfung und Validierung von Mustern in anderen Datenproben.