Doktorarbeit / Dissertation aus dem Jahr 2001 im Fachbereich Informatik - Angewandte Informatik, Note: 1,0, Universität des Saarlandes (Informationswissenschaft), Sprache: Deutsch, Abstract: Inhaltsangabe:Einleitung:
Information-Retrieval-Systeme (IRS) können als Spezialfall eines IS beschrieben werden, indem die einzelnen Komponenten des Tupels (A, W, Q, I, E) spezifiziert werden, was im Kontext des Standard-Retrieval-Prozesses in einem Vektorraummodell geschehen soll. Gegeben ist zu einem Zeitpunkt t eine Dokumentmenge Dt, die durch eine Dokument-Indexierungsfunktion AIR(D) auf eine Dokumentvektorenmenge DVMt abgebildet wurde. Die einzelnen Dokumentvektoren xi sind Element eines metrischen, nt-dimensionalen Dokumentvektorraumes DVR, mit nt als der Anzahl der Merkmale (Features), auf der die Indexierung basiert und die in der Menge Ft zusammengefasst werden. Der Dokumentvektorraum wird allgemein als Teilraum von Rn(t) beschrieben, z.B. durch [0, 1]n(t). Die Query-Indexierungsfunktion AIR(Q) wird vereinfachend definiert als Abbildung aus der Menge Q(T) der möglichen bzw. zugelassenen Queries über einem endlichen Alphabet T, in DVR. Es folgt die Anwendung der Retrieval-Funktion, die abhängig ist von der momentanen Dokumentvektorenmenge DVMt, dem Queryvektor qi t und dem metrischen Dokumentvektorraum DVR mit seinen definierenden Eigenschaften, wobei hier ausschließlich die Metrik dDVR betrachtet wird. Sei GDVR die Menge aller Metriken, die in einem Dokumentvektorraum DVR angewendet werden können, ohne dass hier auf die Definition der Metrik eingegangen werden soll (siehe Abschnitt 3.6.3)). Die Retrieval-Funktion kann somit spezifiziert werden als eine Abbildung der Potenzmenge PDVM(t) der Dokumentvektorenmenge DVMt, dem DVR und GDVR auf PDVM(t), indem das Tripel aus DVMt, dem Queryvektor qi t und eine Metrik dDVR auf die query-abhängige Ergebnis-Dokumentvektorenmenge DVMi t abgebildet wird. D.h. die Retrieval-Funktion besitzt die allgemeine Form ret(DVMt, qit, dDVR) bzw. ret(DVMt, qit, dDVR, e), wenn eine einfache Best-Match-Retrievalstrategie betrachtet wird, bei der alle Dokumentvektoren aus DVMt selektiert werden, deren Abstand von qi t kleiner-gleich einer Distanzschwelle e ? R+ ist. Der letzte Schritt besteht in der Erzeugung der Dokumentmenge Dit, die zu der Ergebnismenge DVMi t korrespondiert. Vereinfachend wurde auf die Beschreibung einer Ranking-Funktion verzichtet, die aus DVMi t eine geordnete Liste von Dokumentvektoren erzeugt.
Inhaltsverzeichnis:Inhaltsverzeichnis:
1.Einleitung und Überblick13
1.1Information-Retrieval-Systeme als Spezialfall von Informationssystemen13
1.2Problemkomplexität des Information Retrievals14
1.2.1Hochdimensionale Zusammenhänge15
1.2.2Nicht-lineare und multimodale Zusammenhänge15
1.2.3Dynamische Zusammenhänge (nicht-stationäre Funktionen)16
1.2.4Unsicherheit (uncertainty) und Vagheit (fuzzyness)18
1.2.5Diversität der Agenten und ihre Ziele19
1.2.6Mehrziel-Anforderungen20
1.3Methodentransfer21
1.4Adaptive Informationssysteme35
1.5Einbettung externer Informationsbeschaffung in ein Modell der allgemeinen Intelligenz37
1.6Polyrepräsentation43
1.6.1Polyrepräsentation in IS und IRS44
1.6.2Inter- und Intraparadigmen-Polyrepräsentation45
1.6.3Gründe für das Vektorraummodell als Intraparadigmen-Polyrepräsentation47
1.6.4Gründe für Polyrepräsentation48
1.6.4.1Beschränkung endlicher Lernmengen48
1.6.4.2Fundamentale Beschränkung aller Repräsentationssprachen49
1.6.4.3Modellierung von Unsicherheit in Bezug zur Diversität der Agenten51
1.7Relevanz-Approximationsmodelle52
1.8Aktives Lernen55
1.8.1Passives und aktives Lernen55
1.8.2Geschlossene und offene Lernmenge56
1.8.3Direkte und indirekte Verfahren des aktiven Lernens57
1.8.4Effektivitäts- und Effizienz-Vergleich direkter und indirekter Ve...
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.
Information-Retrieval-Systeme (IRS) können als Spezialfall eines IS beschrieben werden, indem die einzelnen Komponenten des Tupels (A, W, Q, I, E) spezifiziert werden, was im Kontext des Standard-Retrieval-Prozesses in einem Vektorraummodell geschehen soll. Gegeben ist zu einem Zeitpunkt t eine Dokumentmenge Dt, die durch eine Dokument-Indexierungsfunktion AIR(D) auf eine Dokumentvektorenmenge DVMt abgebildet wurde. Die einzelnen Dokumentvektoren xi sind Element eines metrischen, nt-dimensionalen Dokumentvektorraumes DVR, mit nt als der Anzahl der Merkmale (Features), auf der die Indexierung basiert und die in der Menge Ft zusammengefasst werden. Der Dokumentvektorraum wird allgemein als Teilraum von Rn(t) beschrieben, z.B. durch [0, 1]n(t). Die Query-Indexierungsfunktion AIR(Q) wird vereinfachend definiert als Abbildung aus der Menge Q(T) der möglichen bzw. zugelassenen Queries über einem endlichen Alphabet T, in DVR. Es folgt die Anwendung der Retrieval-Funktion, die abhängig ist von der momentanen Dokumentvektorenmenge DVMt, dem Queryvektor qi t und dem metrischen Dokumentvektorraum DVR mit seinen definierenden Eigenschaften, wobei hier ausschließlich die Metrik dDVR betrachtet wird. Sei GDVR die Menge aller Metriken, die in einem Dokumentvektorraum DVR angewendet werden können, ohne dass hier auf die Definition der Metrik eingegangen werden soll (siehe Abschnitt 3.6.3)). Die Retrieval-Funktion kann somit spezifiziert werden als eine Abbildung der Potenzmenge PDVM(t) der Dokumentvektorenmenge DVMt, dem DVR und GDVR auf PDVM(t), indem das Tripel aus DVMt, dem Queryvektor qi t und eine Metrik dDVR auf die query-abhängige Ergebnis-Dokumentvektorenmenge DVMi t abgebildet wird. D.h. die Retrieval-Funktion besitzt die allgemeine Form ret(DVMt, qit, dDVR) bzw. ret(DVMt, qit, dDVR, e), wenn eine einfache Best-Match-Retrievalstrategie betrachtet wird, bei der alle Dokumentvektoren aus DVMt selektiert werden, deren Abstand von qi t kleiner-gleich einer Distanzschwelle e ? R+ ist. Der letzte Schritt besteht in der Erzeugung der Dokumentmenge Dit, die zu der Ergebnismenge DVMi t korrespondiert. Vereinfachend wurde auf die Beschreibung einer Ranking-Funktion verzichtet, die aus DVMi t eine geordnete Liste von Dokumentvektoren erzeugt.
Inhaltsverzeichnis:Inhaltsverzeichnis:
1.Einleitung und Überblick13
1.1Information-Retrieval-Systeme als Spezialfall von Informationssystemen13
1.2Problemkomplexität des Information Retrievals14
1.2.1Hochdimensionale Zusammenhänge15
1.2.2Nicht-lineare und multimodale Zusammenhänge15
1.2.3Dynamische Zusammenhänge (nicht-stationäre Funktionen)16
1.2.4Unsicherheit (uncertainty) und Vagheit (fuzzyness)18
1.2.5Diversität der Agenten und ihre Ziele19
1.2.6Mehrziel-Anforderungen20
1.3Methodentransfer21
1.4Adaptive Informationssysteme35
1.5Einbettung externer Informationsbeschaffung in ein Modell der allgemeinen Intelligenz37
1.6Polyrepräsentation43
1.6.1Polyrepräsentation in IS und IRS44
1.6.2Inter- und Intraparadigmen-Polyrepräsentation45
1.6.3Gründe für das Vektorraummodell als Intraparadigmen-Polyrepräsentation47
1.6.4Gründe für Polyrepräsentation48
1.6.4.1Beschränkung endlicher Lernmengen48
1.6.4.2Fundamentale Beschränkung aller Repräsentationssprachen49
1.6.4.3Modellierung von Unsicherheit in Bezug zur Diversität der Agenten51
1.7Relevanz-Approximationsmodelle52
1.8Aktives Lernen55
1.8.1Passives und aktives Lernen55
1.8.2Geschlossene und offene Lernmenge56
1.8.3Direkte und indirekte Verfahren des aktiven Lernens57
1.8.4Effektivitäts- und Effizienz-Vergleich direkter und indirekter Ve...
Hinweis: Dieser Artikel kann nur an eine deutsche Lieferadresse ausgeliefert werden.