Das Oromoo-Schreibsystem ist eine Abwandlung des lateinischen Schriftsystems. Daher weist die Sprache viele Gemeinsamkeiten mit der englischen Schrift auf, allerdings mit einigen Modifikationen. Das Schriftsystem der Sprache, das als "qubee Afaan Oromoo" bekannt ist, ist einfach und basiert auf der lateinischen Schrift. Die Buchstaben der englischen Sprache sind also auch in Oromoo zu finden, nur eben in einer anderen Schreibweise. AOTIE hat eine Trainings- und eine Testphase. In der Trainingsphase wird das Klassifizierungsmodell auf der Grundlage der extrahierten NP-Chunks aus den getaggten Trainingsdaten erstellt. Das erstellte Klassifikatormodell wird in der Testphase zur Vorhersage der Kategorie der Textkandidaten verwendet. Die Ausgabe der Unterkomponente Informationsextraktion sind die Kandidatentexte mit ihrer jeweiligen vorhergesagten Kategorie, die als Eingabe für die Nachbearbeitungskomponente verwendet wird.