Portal de Corpus Históricos Iberorrománicos
Joan Torruella (ICREA-UAB) - Johannes Kabatek (Universität Zürich)
V. 6.0 (2024)
Presentación
En la versión 6.0 perteneciente al año 2023-2024, se han actualizado algunos datos, se han eliminado algunos corpus que habían dejado de funcionar y se han añadido otros de nueva creación.
El Portal de Corpus Históricos Iberorrománicos (CORHIBER) es una herramienta informática que tiene como finalidad ofrecer a sus usuarios el elenco de corpus históricos en lenguas iberorrománicas que actualmente se encuentra a su disposición a través de Internet. Juntamente con el enlace con cada corpus reseñado en el Portal, se aportan una serie de informaciones referentes a su procedencia, a sus parámetros clasificadores y a su estado actual, así como una breve descripción de su historia y de su contenido. Las informaciones que se ofrecen de cada corpus han sido facilitadas por los responsables de cada uno de ellos, a los que queremos agradecer su amabilidad e implicación con el proyecto.
Tal como se precisa en el Expert Advisory Group on Linguistic Engineering Standards - EAGLES (1996), haciendo suya la definición que hizo John Sinclair, consideramos como «corpus» a collection of pieces of language that are selected and ordered according to explicit linguistic criteria in order to be used as a sample of the language y lo diferenciamos de «colecciones de textos» o «repositorios» (Archivos informatizados y Bibliotecas electrónicas) cuyas recopilaciones no implican que la selección de los textos o documentos sea hecha con criterios específicos, de forma unificada, ordenada y estructurada, por lo que no se reseñan en esta plataforma De todos modos, se contempla la posibilidad de incluir en el Portal otros tipos de repositorios que no sean estrictamente «corpus» que puedan ser útiles a los historiadores de la lengua en particular y a los demás usuarios en general. Así se ha hecho, por ejemplo, con la inclusión de la Fazienda de Ultramar, que, aunque contenga un solo texto, destaca por su interés para los historiadores de la lengua y ofrece facsímil, transcripción paleográfica y concordancia, o de la base de datos bio-bibliográfica PhiloBiblon, imprescindible a la hora de obtener datos sobre las fuentes de textos romances escritos en la península ibérica en la Edad Media y temprano Renacimiento.
Las informaciones que se ofrecen de cada corpus son las siguientes:
IDENTIFICACIÓN Y PROCEDENCIA
- Siglas del corpus.
- Título del corpus.
- Dirección electrónica.
- Centro al que pertenece.
- Nombre responsable/s.
- Correo electrónico de contacto.
- Año de inicio del corpus.
PARÁMETROS DE CLASIFICACIÓN
- Ámbito temporal.
- Ámbito geográfico.
- Ámbito tipológico.
ESTADO ACTUAL
- Estado de su consulta.
- Lematización.
- Núm. de documentos.
- Fecha del recuento.
- Núm. de formas.
DESCRIPCIÓN
- Breve descripción del corpus.
El Portal CORHIBER se irá actualizando periódicamente, por lo que pedimos que si alguien conoce corpus o colecciones de textos que no figuran en nuestra lista o detecta imprecisiones en nuestras informaciones, nos lo comunique.
CONTACTO:
Joan Torruella: joan.torruella@uab.cat
Johannes Kabatek: johannes.kabatek@uzh.ch