Tesouro Medieval Informatizado da Lingua Galega - Universidade de Santiago de Compostela

versión 2.1 (2007)

O corpus

 

Acceso á lista de obras

 

1.- Tipoloxía textual

O corpus do TMILG abrangue, en números redondos, unhas 16000 unidades textuais distribuídas nun total de 82 obras, representativas das tres grandes categorías recoñecibles na produción textual da Galicia medieval: a prosa notarial, a prosa non notarial e a poesía (verso).

Histograma sobre a distribución das tipoloxías no Corpus

A) Prosa notarial: é, dos tres grupos mencionados, o que maior volume de texto achega (preto do 80% do total). Dentro da prosa notarial incluímos documentación de natureza tipolóxica moi diversa mais reducible en última instancia aos cinco grandes grupos detectados por M. Vázquez Bertomeu (2001):

A estas cinco categorías podemos engadir aínda outras dúas representadas por documentos de características temáticas bastante peculiares:

Tamén é interesante constatar que, a través do TMILG, o usuario pode acceder a documentación xerada tanto en focos eclesiásticos (catedrais, mosteiros, parroquias e sínodos) como civís (concellos, universidades, documentos de carácter privado e outros textos de natureza diversa). Porén, é o primeiro grupo, o da prosa notarial relixiosa e máis concretamente a redactada nos mosteiros, a que goza dunha maior presenza numérica dentro do corpus. Neste sentido, están xa incorporadas ao TMILG un total de 32 coleccións documentais procedentes de diversos mosteiros, dos cales 12 radican na provincia de Lugo, 9 na da Coruña, 7 na de Ourense e 4 na de Pontevedra. Ademais, están xa revisadas, preparadas e listas para a súa inminente inclusión varias coleccións diplomáticas doutros mosteiros, algúns pertencentes aos territorios galegófonos de Asturias, Zamora e León.

No que se refire aos textos civís, o grupo claramente dominante é o constituído por documentación de tipo particular, sendo moito menos numerosa a documentación xerada nos ambientes universitario (nomeadamente na Universidade de Santiago de Compostela, a única representada a tales efectos no noso corpus) e municipal (soamente os concellos de Santiago, Noia, Pontevedra, Ourense e A Coruña achegan produción textual relevante ao TMILG).

Nos seguintes mapas pódese visualizar máis clara e detalladamente a distribución deste inxente volume de prosa notarial sobre o territorio galegofalante moderno.

Mapa das Fontes de Institucións Relixiosas Mapa das Fontes de Institucións e Persoas Civís

B) Prosa non notarial: é o segundo grupo en importancia numérica, pois comprende aproximadamente o 20% do total dos textos. A prosa non notarial está representada por obras ou fragmentos de obras pertencentes a cinco grandes bloques temáticos ben coñecidos e delimitados: prosa histórica, literaria, xurídica, relixiosa e técnica.

Histograma sobre a distribución da Prosa Non Notarial

C) Verso: os textos en verso, coa súa innegable relevancia cualitativa dentro da produción escrita galego-portuguesa medieval, son os menos numerosos do noso corpus textual, pois supoñen aproximadamente nel un 10%. Este conxunto pode dividirse en dous grupos atendendo á súa cronoloxía e á tradición estética en que se inscriben:

Deste xeito, no TMILG encóntranse perfectamente representadas as parcelas textuais cultivadas na Galicia medieval, quer no terreo da prosa, quer no do verso. Con todo, non deixa de ser considerable o número de xéneros que non contaron co debido desenvolvemento e para os que, en consecuencia, carecemos de obras representativas (épica, didáctica, textos dramáticos...). Mais esta situación está suxeita en todo caso ás alteracións que poderían derivar da descuberta e difusión de textos ata o de agora inéditos e, por suposto, á incorporación da produción lusitana.

Histograma sobre a distribución dos textos de Verso

2.- Cronoloxía e glotoloxía dos textos

Desde o punto de vista da cronoloxía, o corpus TMILG cobre un período amplísimo, comprendido entre os séculos VIII (ano 700) e XVII (ano 1600). Neste sentido, o documento máis antigo incluído a día de hoxe no noso corpus é unha doazón datada no ano 787 e editada por López Ferreiro no seu Galicia Histórica (capítulo 113). Aínda que no TMILG podemos encontrar representadas diversas linguas, o certo é que, na situación actual, a aplicación informática só permite facer buscas no texto en galego. O latín e o castelán poden aparecer como elemento contextual nas concordancias. No futuro está previsto o acceso aos outros córpora (TMILL-G, TMILC-G / TMILP e TMILL-P). Globalmente no XELMÍREZ o 56% da documentación notarial está escrita en galego, fronte a un 28% en castelán e un 15% en latín.

3.- Codificación

A codificación dos textos demandou unha atención moi especial, polas peculiaridades tanto da scripta medieval como dos hábitos modernos de edición.

A especificidade das grafías medievais obrigounos a arbitrar solucións pouco convencionais no asentamento dos textos e no seu tratamento informático. A nasalidade sobre vogal ou consoante (c, g, q, m) é o trazo máis característico. Outros elementos específicos son os tipos de <s> (alto, de dobre curva e sigmático), o <z> visigótico e o signo tironiano.

Os textos foron sometidos a un proceso rigoroso de etiquetado. Hai etiquetas xerais, que figuran en todo tipo de textos. Dúas subministran información relativa á autoría e ó título. Outras conteñen información cronolóxica:

É específica da Lírica Profana a xeración do trobador, e da prosa notarial o mes de redacción do instrumento.

Algunhas referencias encárganse de facilitar a contextualización dentro da obra:

Tres atenden á tipoloxía textual:

Na produción da obra teñen relevancia dous tipos de datos: Por unha banda o carácter orixinal, de copia ou de traslado ou de falsificación do documento nas obras notariais, e o carácter orixinal ou de tradución nas non notariais (13). Por outra banda, aténdese á lingua da obra orixinal nas obras traducidas (14).

É específica das obras notariais a indicación da localización (15), que representa xeralmente a demarcación territorial da competencia do notario. Cando é posible tamén se incorpora a información correspondente ao concello e á provincia na actualidade.

Na codificación tamén se etiquetaron as cadeas onomásticas e as locucións adverbiais, prepositivas e conxuntivas, aínda que polo momento non aparecen identificadas nin son procesables sistematicamente pola internet.

O seguinte esquema resume o esencial da codificación (etiquetación):

 

 
A) Autoría e obra:
  1. Obra.
  2. Autor.
B) Cronoloxía:
  1. Século.
  2. Ano.
  3. Xeración (LP).
  4. Mes (PN).
C) Contextualización na obra:
  1. Volume ou tomo.
  2. Capítulo ou número de documento.
  3. Páxina.
D) Tipoloxía textual:
  1. Xénero 1 (verso ou prosa).
  2. Xénero 2 (Verso: profano, mariano ou da decadencia // Prosa notarial, histórica, literaria, xurídica, relixiosa ou técnica).
  3. Xénero 3 (PN: doazón, venda, testamento, etc. // Verso: en LP: amigo, amor, escarnio e lais. En CSM: narrativa, de loor, etc.)
E) Produción da obra:
  1. Tipo (PN: orixinal, copia ou traslado. // Outras obras: orixinal ou traducida).
  2. Lingua (Lingua da obra orixinal nas obras traducidas).
F) Contextualización xeográfica:
  1. Localización (Basicamente na PN).

 

Acceso á lista de obras