top of page

 

 

CORPUS PLURILINGÜES

BDDH || Dialogyca BDDH || http://www.dialogycabddh.es/

Responsable: Consolación Baranda Leturio y Ana Vian Herrero || Centro: Instituto Universitario Menéndez Pidal (Universidad Complutense de Madrid) || Correo de contacto: dialogycabddh@pdi.ucm.es || Año de inicio: 2005, en la red 2010
Ámbito temporal: Edad Media - presente || Ámbito geográfico: Ámbito ibérico || Ámbito tipológico: Diálogos escritos en lenguas peninsulares o traducidos a estas lenguas.
Estado: Consultable abierto || Lematizado: No || Núm. de documentos: 306 fichas (28-02-2018) || Núm. de formas: ______
Breve descripción del corpus:
+

 

CGPA || Corpus Galego-Portugués Antigo || http://ilg.usc.gal/cgpa/zonaprivada/consultas/consulta.php

Responsable: Xavier Varela (ILG-USC) / Alexandra Fieis (CLUNL) / Charlotte Galves (Universidade de Campinas) || Centro: Instituto da Lingua Galega (Universidade de Santiago de Compostela) / Centro de Lingüistica da Universidade Nova de Lisboa (Universidade Nova de Lisboa) / Universidade de Campinas (Brasil) || Correo de contacto: xavier.varela@usc.es || Año de inicio
Ámbito temporal: Orígenes de la lengua / siglo XVI (Portugal) - siglo XVIII (Galicia) - siglo XIX (Brasil) || Ámbito geográfico: Galicia, Portugal y Brasil || Ámbito tipológico: Obras en verso y prosa de todas las tipologías.
Estado: Consultable abierto || Lematizado: No || Núm. de documentos: 368 obras de carácter no documental (Galicia: 233 / Portugal: 47 / Brasil: 88) // 28.000 piezas documentales (mayoritariamente de Galicia) (Fecha de recuento: 2022) || Núm. de formas: 24.00.000 (Galicia: 16.600.000 / Portugal: 3.900.000 / Brasil: 3.500.000).
Breve descripción del corpus:
+

---      || Corpus "Ineffabilis Deus" ||https://corpus-ineffabilis.org 

Responsable: Johannes Kabatek || Centro: Universidad de Zúrich || Correo de contacto: kabatek@rom.uzh.ch || Año de inicio: 2020
Ámbito temporal: mediados siglo XIX || Ámbito geográfico: Europa || Ámbito tipológico: https://corpus-ineffabilis.org/project/
Estado: Consultable abierto || Lematizado: No || Núm. de documentos: 1 en varias lenguas y variedades || Núm. de formas: 4385
Breve descripción del corpus:
+

OSTA|| Old Spanish Textual Archive || http://osta.oldspanishtextualarchive.org/

Responsables: Francisco Gago Jover y Javier Pueyo Mena || Centro: Hispanic Seminary of Medieval Studies (HSMS)  || Correo de contacto: hispanicseminary.ltd@gmail.com || Año de inicio: 2015. Versión en línea 2021
Ámbito temporal: XIII-XVII (la fecha es siempre la del códice) || Ámbito geográfico: Península Ibérica (textos en castellano, asturiano, leonés, navarro-aragonés y aragonés) || Ámbito tipológico: Textos de carácter literario (excluye colecciones de carácter notarial) ||  Estado: Consultable abierto || Lematizado: Sí || Núm. de documentos: 492 transcripciones semipaleográficas [436 códices], 1622 obras con diferente título. (Fecha de recuento: 05/11/2022) || Núm. de formas: 32.302.959
Breve descripción del corpus:
+

P. S. || Post Scriptum. A Digital Archive of Ordinary Writting|| http://ps.clul.ul.pt/index.php

Responsable: Rita Marquilhas|| Centro: Centro de Linguística da Universidade de Lisboa (CLUL)|| Correo de contacto: rita.marquilhas@gmail.com|| Año de inicio: 2012
Ámbito temporal: s. XVI - s. XIX (1500 - 1834)|| Ámbito geográfico: España y Portugal|| Ámbito tipológico: Cartas privadas
Estado: Consultable abierto || Lematizado: Sí (lema y etiqueta POS). Un 25% de los documentos del corpus también está anotado sintácticamente (una carta por autor)  || Núm. de documentos: 2430
 cartas (corpus español)/ 2447 cartas (corpus portugués) [Recuento: 27/09/2018|| Núm. de formas: 987.390 (corpus español) / 993.274 (corpus portugués)
Breve descripción del corpus:
+                                                                                                                Actualizado: 28/11/2023

TLPGP || Tesouro do léxico patrimonial galego e portugués || http://ilg.usc.es/Tesouro/

Responsable: Rosario Álvarez || Centro: Instituto da Lingua Galega (USC) || Correo de contacto: rosario.alvarez@usc.es || Año de inicio: 2009
Ámbito temporal: ______ || Ámbito geográfico: Galicia, Portugal y Brasil; occidente de Principado de Asturias, Castilla y León, Extremadura y Andalucía || Ámbito tipológico: ______
Estado: Consultable abierto || Lematizado: Sí || Núm. de documentos: 172 (41 del Brasil) (año 2018) || Núm. de formas: 217.669
Breve descripción del corpus:
+

BDDH
P.S.
TLPGP
OSTA
Ineffabilis
CGPA
bottom of page