Riesige Mengen an webbasierten oder anderen Angeboten bieten den Nutzern eine Fülle von Informationen. Die Archive werden jedoch immer vielfältiger, und die in den Texten verwendete Sprache wird immer vielfältiger; dies gilt insbesondere für das Web. Zwei Autoren, die über dasselbe Thema schreiben, verwenden möglicherweise ein anderes Vokabular als Sie. Benutzer, die nach Informationen zu diesem Thema suchen, sollten ihr Wissen in einer idealen Weise vermitteln, die von beiden Autoren verwendet worden wäre. Es kann verschiedene Arten von Dokumenten geben, wie strukturierte Dokumente, unstrukturierte Dokumente und halbstrukturierte Dokumente. Information Retrieval ist das Auffinden von Material (in der Regel Dokumente) unstrukturierter Natur (in der Regel Text), das einen Informationsbedarf in großen Sammlungen befriedigt. Die benötigten Daten werden als Anfrage an den Kunden weitergeleitet. Die Dokumente, die die Anfrage erfüllen, sollten nach Ansicht des Kunden relevant sein. Berichten, die nicht zum Thema gehören, sollte keine Bedeutung beigemessen werden. Der Prozess der Datenwiederherstellung beginnt, wenn eine Person in den Kontext einer Untersuchung gerät. Hier spielt die Formulierung der Anfrage eine wichtige Rolle, um die relevantesten Informationen zu finden.