Este trabalho é dedicado aos problemas de desenvolvimento de software linguístico e algorítmico que serve para criar um sistema moderno de extracção de informação de conteúdo chave através da aplicação de uma vasta classe de métodos matemáticos e linguísticos de processamento lógico e analítico de grandes matrizes de caracteres. Como parte desta investigação, um esquema generalizado de processamento de um conjunto de textos publicitários para a sub-língua dos media, identificou tendências, tendo em conta os resultados do processamento de texto em linguagem natural, realizado por computador e pelo homem, propôs um modelo do texto como um composto de modelos formais dos seus componentes, que se baseia na integração de métodos linguísticos estatísticos e formais, O algoritmo de extrair elementos de significado do conjunto de textos de tópicos limitados, incluindo o bloco de processamento semântico primário, bloco de indexação e classificação dos conceitos, bloco de estabelecimento de relações, bloco de identificação da unidade temática, bloco de estabelecimento de ocorrência de pares, bloco de construção de uma rede semântica, bloco de síntese de informação da rede.