Eksploracja danych jest procesem wydobywania ukrytych i u¿ytecznych informacji z danych. Wykrywanie warto¿ci odstaj¿cych jest fundamentaln¿ cz¿¿ci¿ eksploracji danych i w ostatnim czasie cieszy si¿ ogromnym zainteresowaniem ¿rodowiska naukowego. Wynik odstaj¿cy to obiekt danych, który odbiega od innych obserwacji. Wykrywanie warto¿ci odstaj¿cych ma istotne zastosowanie w czyszczeniu danych, jak równie¿ w eksploracji punktów odbiegaj¿cych od normy w celu wykrywania oszustw, analizy gie¿dowej, wykrywania w¿amä, marketingu, czujników sieciowych. Wi¿kszo¿¿ istniej¿cych badä koncentruje si¿ na numerycznych zbiorach danych, które nie maj¿ bezpo¿redniego zastosowania w przypadku kategorycznych zbiorów danych, gdzie uporz¿dkowanie danych i obliczenie odleg¿o¿ci pomi¿dzy punktami danych nie ma wi¿kszego sensu. Ponadto, wiele z obecnych metod wykrywania warto¿ci odstaj¿cych wymaga czasu kwadratowego w odniesieniu do rozmiaru zbioru danych i zwykle wymaga wielokrotnego skanowania danych; cechy te s¿ niepo¿¿dane, gdy zbiory danych s¿ du¿e. W niniejszej pracy skoncentrowano si¿ i oceniono eksperymentalnie metod¿ wykrywania warto¿ci odstaj¿cych, która jest ukierunkowana na zbiory kategoryczne. Ponadto, jest to prosty, skalowalny i wydajny algorytm wykrywania warto¿ci odstaj¿cych, który ma t¿ zalet¿, ¿e pozwala wykrywä warto¿ci odstaj¿ce w kategorycznych lub numerycznych zbiorach danych poprzez per
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.