La scarsa qualità dei dati può ostacolare o danneggiare seriamente l'efficienza e l'efficacia di organizzazioni e imprese. La crescente consapevolezza di tali ripercussioni ha condotto a importanti iniziative pubbliche come la promulgazione del "Data Quality Act" negli Stati Uniti e della direttiva 2003/98 del Parlamento Europeo.
Gli autori presentano un'introduzione completa e sistematica all'ampio insieme di problemi legati alla qualità dei dati. Il libro parte con una descrizione dettagliata di diverse dimensioni della qualità dei dati, come l'accuratezza, la completezza e la consistenza, e ne discute l'importanza in relazione sia a diverse tipologie di dati, come i dati federati, i dati presenti sul web e i dati con dipendenze temporali, che alle diverse categorie in cui i dati si possono classificare. L'esauriente descrizione di tecniche e metodologie provenienti non solo dalla ricerca nell'area della qualità dei dati ma anche in aree correlate, quali data mining, teoria della probabilità, analisi statistica dei dati e apprendimento automatico, fornisce un'eccellente introduzione allo stato dell'arte attuale. La presentazione è completata da una breve descrizione e da un confronto critico di strumenti e metodologie pratiche, che aiuterà il lettore a risolvere i propri problemi di qualità.
Questo libro costituisce la combinazione ideale fra la correttezza dei fondamenti teorici e l'applicabilità degli approcci pratici. E' ideale per tutti coloro - ricercatori, studenti o professionisti - che siano interessati a una panoramica completa sui problemi della qualità dei dati. Può essere inoltre impiegato come manuale in un corso introduttivo all'argomento, o dall'autodidatta.
Gli autori presentano un'introduzione completa e sistematica all'ampio insieme di problemi legati alla qualità dei dati. Il libro parte con una descrizione dettagliata di diverse dimensioni della qualità dei dati, come l'accuratezza, la completezza e la consistenza, e ne discute l'importanza in relazione sia a diverse tipologie di dati, come i dati federati, i dati presenti sul web e i dati con dipendenze temporali, che alle diverse categorie in cui i dati si possono classificare. L'esauriente descrizione di tecniche e metodologie provenienti non solo dalla ricerca nell'area della qualità dei dati ma anche in aree correlate, quali data mining, teoria della probabilità, analisi statistica dei dati e apprendimento automatico, fornisce un'eccellente introduzione allo stato dell'arte attuale. La presentazione è completata da una breve descrizione e da un confronto critico di strumenti e metodologie pratiche, che aiuterà il lettore a risolvere i propri problemi di qualità.
Questo libro costituisce la combinazione ideale fra la correttezza dei fondamenti teorici e l'applicabilità degli approcci pratici. E' ideale per tutti coloro - ricercatori, studenti o professionisti - che siano interessati a una panoramica completa sui problemi della qualità dei dati. Può essere inoltre impiegato come manuale in un corso introduttivo all'argomento, o dall'autodidatta.
From the reviews:
"This book provides an account about the data quality issue. ... the book represents a useful reading for students, researchers, practitioners and all those who are interested in a clear, polished and complete presentation of theoretical and practical issues about data quality. The book is well written and examples throughout the book ... providing help to the (even not specialized) reader to fully appreciate the presented material. A highly recommended reading ... for everyone interested into this specific but definitively relevant topic in data management." (Luigi Palopoli, Zentralblatt MATH, Vol. 1155, 2009)
"This book provides an account about the data quality issue. ... the book represents a useful reading for students, researchers, practitioners and all those who are interested in a clear, polished and complete presentation of theoretical and practical issues about data quality. The book is well written and examples throughout the book ... providing help to the (even not specialized) reader to fully appreciate the presented material. A highly recommended reading ... for everyone interested into this specific but definitively relevant topic in data management." (Luigi Palopoli, Zentralblatt MATH, Vol. 1155, 2009)