Die Vorbereitung eines Datensatzes für die Analyse ist in der Regel die zeitaufwändigste Aufgabe in einem Data-Mining-Projekt. Sie erfordert viele komplexe SQL-Abfragen, das Verbinden von Tabellen und das Aggregieren von Spalten. Im Allgemeinen ist ein erheblicher manueller Aufwand erforderlich, um Datensätze zu erstellen, für die ein horizontales Layout erforderlich ist. Hier werden einfache, aber leistungsfähige Methoden zur Generierung von SQL-Code vorgestellt, der aggregierte Spalten in einem horizontalen Tabellenlayout zurückgibt, wobei eine Reihe von Zahlen anstelle einer Zahl pro Zeile zurückgegeben wird. Diese neue Klasse von Funktionen wird als horizontale Aggregationen bezeichnet. Eine Aggregationsfunktion mit einer Gruppierungstechnik gibt Abfrageoptimierern die Möglichkeit, verschiedene Abfrageauswertungspläne zu erstellen. Bei Abfragen mit einer nicht-distributiven Aggregationsfunktion kann die Auswertung erst durchgeführt werden, wenn die gesamte Eingabe konstruiertist. Dadurch verzögert sich die gesamte Berechnung. Aggregationsfunktionen dieser Art werden als holistische Aggregationsfunktionen bezeichnet. Um die Auswertungsleistung einer holistischen Aggregationsfunktion zu verbessern, kann ein Ansatz namens partielle Aggregation verwendet werden. Die partielle Aggregation führt Berechnungen inkrementell durch und erhöht die Geschwindigkeit der Berechnung.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.