Le thème du corpus est étroitement lié au type de corpus contemporain de la langue anglaise, le British National Corpus (BNC). Le BNC est un corpus de 100 millions de mots contenant des échantillons d'anglais britannique écrit et parlé provenant d'un large éventail de sources. Le corpus couvre l'anglais britannique de la fin du XXe siècle, représenté par une grande variété de genres, et est censé être représentatif de l'anglais britannique parlé et écrit typique de l'époque.