Este trabajo propone una arquitectura de sistemas de adquisición automática de contenido para la Web Semántica. Su objetivo concreto es proporcionar un marco conceptual para el desarrollo de sistemas para el procesamiento de contenido actual de la WWW y convertirlo en contenido semánticamente anotado para los agentes y las aplicaciones de la Web Semántica puedan procesarlo. Se parte de un estudio del estado del arte de las tecnologías existentes en el área de extracción de información con algunas aplicaciones existentes en objetivos similares.