W dzisiejszym szybko rozwijaj¿cym si¿ ¿wiecie analizujemy rozproszone ¿ród¿a danych publikuj¿ce do gigabajtów danych kädego dnia, gromadz¿c je w ci¿gu kilku miesi¿cy do skali terabajtów. Rodzi to wyzwanie, w jaki sposób efektywnie przechowywä te rozproszone zbiory danych, zarówno w roboczych pami¿ciach podr¿cznych zapewniaj¿cych szybki dost¿p w czasie rzeczywistym, jak i w formach zarchiwizowanych, które mo¿na ponownie wykorzystä do analizy danych offline. W tym artykule przedstawili¿my us¿ugi przetwarzania, które musz¿ uzyskä dost¿p do kilku zbiorów danych jednocze¿nie, aby uzyskä inteligentne wyniki fuzji danych, które s¿ nast¿pnie udost¿pniane decydentom w czasie rzeczywistym. Poniewä skuteczna analiza wszystkich wyników jest wyzwaniem, musimy znale¿¿ rozwi¿zanie, które przyspieszy i usprawni przetwarzanie. W tym przypadku projektujemy metod¿ wykorzystuj¿c¿ metatagi, aby skróci¿ czas przetwarzania i zmniejszy¿ obci¿¿enie istniej¿cych systemów. Metatagi zasadniczo definiuj¿ ró¿ne atrybuty plików danych i zapewniaj¿ nam opcje dost¿pu do plików na podstawie wybranych atrybutów. W proponowanym systemie lekka i ci¿¿ka semantyka s¿ oddzielane na podstawie rozmiaru. Powy¿ej 10 s¿ dodawane do listy wagi ci¿¿kiej, a poni¿ej 10 s¿ dodawane do listy wagi lekkiej.