É possível, ainda, encontrar tipos de corpus mais específicos que levam em consideração características mais peculiares observadas por quem irá fazer a análise linguística, como a proposta por EAGLES (1994) :
- (i) Corpus de referência – possui, assim como o corpora generalizado mencionado acima, uma amostra significativa das diferentes variedades de uma língua, vocabulários e estrutura gramatical. Esse tipo de corpus busca fornecer informações mais ambragentes sobre uma dada língua. O corpus de referência é construído com o intuito de auxiliar na produção de gramáticas e dicionários de referência.
- (ii) Corpus monitor – caracteriza-se, sobretudo, pelo seu crescimento permanente. Nesse tipo de corpus apenas são adicionados materiais novos à medida que materiais antigos são eliminados . Cabe destacar, ainda, que esse tipo de corpus permite a observação das mudanças recentes que ocorrem no uso de uma determinada língua.
- (iii) Corpus oral – é constituído por transcrições de conversas espontâneas e informais dos falantes de uma dada língua. Vale ressaltar que, em alguns casos, esse tipo de corpus permite a inclusão de textos escritos que foram lidos ou declamados.
- (iv) Corpus de amostragem: é constituído por apenas fragmentos de textos. Esse tipo de corpus tem por objetivo obter amostras de áreas específicas de uma língua.
- (v) Corpus especializado: é um corpus elaborado com o objetivo de se ter uma amostra de gênero ou de uso da língua por uma comunidade de fala específica, por exemplo, linguagem infantil, política, religiosa, etc.
- (vi) Corpus paralelo ou bilíngue/multilíngue: é organizado apenas a partir de textos e suas traduções em uma ou várias línguas. Objetiva-se com esse tipo de corpus representar várias, ou pelo menos duas línguas diferentes, muitas vezes com o mesmo texto (para análises contrastivas). A tradução de um texto para outra língua pode ser elaborada com análises detalhadas do significado das palavras que constituem o texto original. Os textos desse tipo de corpus podem também ser interlinearizados , trazendo traços que identificam os pontos de correspondência entre o texto original e o texto com sua tradução.
Torruella e Llisterri (1999, pp. 9-13) propõem o seguinte conjunto de corpus:
- (i) Corpus de aprendiz – construído a partir de material linguístico produzidos por falantes não nativos de uma determinada língua. Esse tipo de corpus tem o objetivo de representar a linguagem produzida por alunos da língua que se está aprendendo.
- (ii) Corpus de treinamento – este tipo de corpus é organizado com o intuito de desenvolver software e/ou ferramentas de análise linguística.
- (iii) Corpus histórico – elaborado a partir de textos de um período específico de tempo. Este tipo de corpus visa, portanto, representar um estágio anterior ou etapas anteriores de uma língua.
- (iv) Corpus sincrônico – composto por material linguístico que representa uma etapa contemporânea de uma língua.
- (v) Corpus diacrônico – constituído por material linguístico que representa períodos anteriores de uma língua.