Tesouro do léxico patrimonial galego e portugués

USC. Instituto da Lingua Galega

Galego | Português | English

Proxecto

 

Finalidade do Tesouro

O Tesouro do léxico patrimonial galego e portugués é unha iniciativa de universidades brasileiras, galegas e portuguesas coordinada pola profesora Rosario Álvarez do Instituto da Lingua Galega da Universidade de Santiago de Compostela. Este proxecto naceu coa intención de constituír un corpus informatizado que reunise material léxico vinculado coa cultura tradicional, especialmente o relacionado con aquelas actividades e saberes que polos cambios culturais e sociais se perderon ou están en proceso de desaparición. Ademais, o proxecto pretende que todo o material se poida localizar xeograficamente para facilitar os estudos comparativos e de distribución e difusión das formas léxicas.

O Tesouro pretende tamén contribuír ó estudo do patrimonio tradicional dos respectivos países, tanto na súa vertente material coma na inmaterial, realizando unha importante contribución ós estudos etnográficos. A cultura e a tecnoloxía asociadas ó mundo rural xa desapareceron de boa parte dos nosos países, debido ás profundas mudanzas económicas e sociais das últimas décadas.

A terceira finalidade do Tesouro é a de proporcionar un corpus lexical amplo que poida servir de apoio para diversas liñas de investigación, tanto na perspectiva sincrónica coma na diacrónica. Ademais do obvio interese para a dialectoloxía e a lexicoloxía, a aplicación fornece material relevante para numerosas iniciativas noutros campos, especialmente na etimoloxía, fonética e fonoloxía, lexicografía e morfoloxía.

Finalmente, un obxectivo do Tesouro é constituírse nun portal de léxico dialectal que, ademais de ofrecer unha edición electrónica de vocabulario patrimonial, conteña información completa e variada de interese para os investigadores de diversas disciplinas. Nese sentido, ademais da concepción aberta da base de datos, que inclúe fotografías, deseños e información etnográfica de todo tipo, tamén forma parte da aplicación un Inventario de fontes dialectais galegas e portuguesas que contén os datos bibliográficos de todas as obras que estudan léxico dialectal nestes dominios, nas súas diferentes perspectivas. Este inventario permite facer buscas de distinto tipo (ano, autor, localización, etc.).

 

Fontes

O Tesouro do léxico patrimonial galego e portugués incorpora calquera tipo de obra de contido lexicográfico que conteña material dialectal localizado xeograficamente no Brasil, Galicia ou Portugal. A base de datos alberga materiais moi heteroxéneos, de diferente feitura, distinta organización e múltiples orixes.

a) Monografías etnolingüísticas sobre a fala dunha localidade ou territorio de extensión reducida. Este grupo de obras foi concibido principalmente como traballos académicos dirixidos que abordaban o estudo da lingua dunha pequena área, normalmente unha parroquia, un concello ou un grupo de concellos.

b) Atlas lingüísticos e enquisas dialectais. Este segundo conxunto de obras inclúe materiais recollidos en traballo de campo nunha ampla rede de puntos distribuída ó longo dun ou varios dos países que integran o Tesouro. Dentro destas obras ocupan un lugar de especial relevancia os atlas lingüísticos.

c) Outras obras con léxico dialectal. No ámbito do galego e do portugués europeo existen numerosos traballos que estudan diversos aspectos da cultura local desde o punto de vista onomasiolóxico ou etnolingüístico. Estes traballos acostuman presentarse como artigos en revistas científicas ou ben como monografías.

 

Tratamento dos datos

Desde o inicio dos traballos de deseño do proxecto, os investigadores consideraron que a aplicación informática que dese acceso ó Tesouro do léxico patrimonial galego e portugués debía manter toda a información contida nas obras orixinais e ó tempo tiña que permitir recuperala dun modo áxil e produtivo, segundo as diferentes necesidades dos usuarios.

A pesar de que a heteroxeneidade dos materiais dificulta este labor de organización e clasificación da información, a estrutura da base de datos é suficientemente completa e flexible como para facilitar a integración de toda a información contida nas obras.

A seguir preséntase unha breve descrición dos principais campos que constitúen a estrutura da base de datos do Tesouro e que son utilizados para normalizar e ordenar a información:

a) Variante. Trátase da forma que aparece abrindo a entrada en cada un dos glosarios introducidos no Tesouro. Respectase escrupulosamente a variante ortográfica proporcionada polo autor, xa que acostuma transmitir información interesante. Cando na obra orixinal a forma recollida se ofrece unicamente en transcrición fonética, créase a variante correspondente en grafía convencional correspondente.

b) Transcrición fonética. Aínda que o proxecto se centra no aspecto lexicográfico, considerouse interesante conservar a información de tipo fonético relevante, cando esta aparecía consignada nas obras tratadas. As convencións empregadas para representar a pronuncia das palabras son moi diferentes, polo que se considerou imprescindible unificar e adaptar as transcricións fonéticas empregando os símbolos do Alfabeto Fonético Internacional.

c) Categoría gramatical. Mantense exactamente a categoría que aparece na fonte, coa súa formulación orixinal. Deste modo, unha mesma palabra pode estar categorizada como s, sm, subst, subst m, etc. Para axudar na clasificación e ordenación dos distintos materiais atribuíuse ademais unha categoría normalizada, en función do lema asignado, que se almacena nun campo específico da base de datos.

d) Lema. As diferentes variantes fónicas e gráficas que se recollen nas obras remítense a un único lema que as agrupa e permite un acceso rápido a todas elas. O lema, que pode ser monolexical ou fraseolóxico, é particular para cada unha das variedades lingüísticas (galego, portugués europeo e portugués do Brasil), por exemplo, as variantes dereito, dreito, direito son agrupadas en galego baixo o lema dereito e en portugués baixo o lema direito. As formas constituídas por morfemas derivativos considéranse lemas independentes (queixo, queixelo, queixal).

e) Exemplos. En varios casos, as obras ofrecen exemplos de uso das formas definidas. Ás veces fornécese información de tipo gramatical (rexencias), noutros casos expóñense colocacións e, con moita frecuencia, refírense coplas, refráns ou outras construcións que conteñen a palabra en cuestión.

f) Remisións. É bastante frecuente que nunha determinada entrada dunha obra se realicen remisións a outras formas relacionadas que figuran na mesma obra. Estas remisións serven para vincular dúas variantes dunha mesma palabra moi próximas formalmente (albitanas/albitanes); noutras ocasións, as remisións marcan unha relación de significado, como hipónimo/merónimo (jugo ~ tchabielha, canzile, molida, solada, solinho, temoeiro, canga...); outras veces, estas indicacións serven para vincular varias formas, consideradas secundarias, cunha entrada primaria que contén agrupada toda a información sobre significados, os exemplos e as indicacións complementarias.

g) Definicións. Este campo está reservado para acoller a información semántica, que se considera a parte fundamental nas obras recompiladas. A denominación definición debe ser entendida en sentido amplo, pois inclúe non só aquelas compoñentes que normalmente se entenderían como definición en sentido estrito nun dicionario, senón tamén aqueloutras que poden interpretarse como explicación do significado da forma correspondente. Neste campo incorpórase tamén información que non ten cabida noutras seccións máis específicas: datos que figuran nas notas de rodapé, indicacións xeográficas sobre o lugar en que se recolleu a variante ou ben referencias sobre se a forma está ou non incluída nos dicionarios de uso.

h) Clasificación semántica. Ó deseñar o proxecto considerouse que sería imprescindible realizar unha clasificación semántica de todos os materiais incorporados á base de datos. Esta clasificación permite recuperar a información de maneira agrupada por campos semánticos, de xeito que os usuarios poden obter unha listaxe de todas as palabras vinculadas a un mesmo grupo semántico (o tempo meteorolóxico, tipos de terras de cultivo, plantas e árbores, a vivenda e as construcións anexas, etc.). Con esta finalidade creouse, con base nalgúns traballos previos, un esquema de clasificación semántica básico de doce grandes tipos, con subdivisións no seu interior. Debe terse en conta que a asignación dos clasificadores semánticos nas obras que posúen ordenación onomasiolóxica toma sempre como guía e punto de partida a clasificación establecida polos seus autores, o que explica algunas diverxencias na clasificación semántica dunha mesma voz en diferentes obras.

i) Referencia xeográfica. Unha das condicións que deben cumprir os materiais que son incorporados á base de datos do Tesouro é a de estaren localizados xeograficamente. Este requisito supón que a información lexicográfica debe estar atribuída a unha localidade, a unha parroquia, a un concello ou algunha outra entidade xeográfica referenciable. Entre as dúas posibilidades de indicación da procedencia das formas, punto ou área, escolleuse a segunda, xa que facilita a representación cartográfica e permite apreciar de xeito rápido a distribución das formas léxicas nos tres territorios. Para salvar as diferenzas de extensión dos tres territorios acordouse empregar distintas entidades administrativas para a representación dos datos. Para Galicia e Portugal emprégase o concello como entidade de referencia. Para Brasil utilízase a mesorrexión, unha división administrativa que reúne varios municipios con características económicas e sociais similares.

j) Imaxes e debuxos. Moitos dos materiais recolectados para formar parte do Tesouro conteñen información gráfica que serve para ilustrar os obxectos que se describen e definen. Estas fotos e debuxos están incorporados tamén á base de datos e poden ser consultados ó mesmo tempo que se accede á información textual.

 

Axudas e financiamento

2010-2012

Ministerio de Ciencia e Innovación (España), FFI2009-12110.

Fundação para a Ciência e a Tecnologia. Ministério de Ciência, Tecnologia e Ensino Superior (Portugal). PTDC/CLE-LIN/102650/2008.

2009

AECID (Agencia Española de Cooperación Internacional para el Desarrollo). Ministerio de Asuntos Exteriores y Cooperación (España) 2009.

2007-2011

Axudas de consolidación e estruturación de unidades de investigación do SUG, Secretaría Xeral de Universidades, Consellería de Educación e Ordenación Universitaria (Galicia).


© 2018 Instituto da Lingua Galega - USC