In der heutigen schnell wachsenden Welt haben wir verteilte Datenquellen analysiert, die täglich bis zu Gigabyte an Daten veröffentlichen, die sich über einen Zeitraum von mehreren Monaten bis in den Terabyte-Bereich ansammeln. Daraus ergibt sich die Herausforderung, wie diese verteilten Datensätze effizient gespeichert werden können, sowohl in Arbeits-Caches für den schnellen Echtzeit-Zugriff als auch in archivierten Formen, die für die Offline-Datenanalyse wiederverwendet werden können. In diesem Beitrag haben wir die Verarbeitungsdienste vorgestellt, die für den gleichzeitigen Zugriff auf mehrere Datensätze erforderlich sind, um intelligente Datenfusionsergebnisse zu erzeugen, die anschließend den Entscheidungsträgern in Echtzeit zur Verfügung gestellt werden. Da es eine Herausforderung ist, alle Ergebnisse effizient zu analysieren, müssen wir eine Lösung finden, um die Verarbeitung schneller und effizienter zu gestalten. Hier entwerfen wir eine Methode, die Metatags verwendet, um die Verarbeitungszeit und die Belastung der bestehenden Systeme zu reduzieren. Die Metatags definieren im Grunde die verschiedenen Attribute von Datendateien und bieten uns Optionen für den Zugriff auf die Dateien auf der Grundlage der Auswahl von Attributen. Im vorgeschlagenen System werden leichtgewichtige und schwergewichtige semantische Daten auf der Grundlage ihrer Größe getrennt. Über 10 werden in die Liste der schwergewichtigen und unter 10 in die Liste der leichtgewichtigen Dateien aufgenommen.