Se presenta una nueva Forma Intermedia de representación para resolver la falta de estructura de textos semiestructurados en bases de datos. Dicha Forma Intermedia se basa en la extración del conjunto frecuente de items siguiendo el Algoritmo Apriori. Además se encontrará la implementación del modelo matemático propuesto para soportar la nueva Forma Intermedia de representación, en un Modelo Relacional Orientado a Objetos utilizando Software Libre. También se realiza la evaluación de la propuesta, con datos reales provenientes del entorno hospitalario.