Corpus

Membres del projecte

corpus

JOSEP QUER: Director

GEMMA BARBERÀ: Coordinadora del Corpus LSC

SANTIAGO FRIGOLA: Expert sord

LALI RIBERA: Coordinadora de la Base de dades lèxica LSC

DELFINA ALIAGA: Anotadora

XAVIER ÁLVAREZ: Anotador

ALEXANDRA NAVARRETE: Revisora i intèrpret

Antics membres:

Noelia Hernández: Anotadora

Sara Costa: Intèrpret

Guillem Massó: Expert en bases de dades i corpus

Share

Base de dades

corpus

Per poder organitzar i classificar tot el material enregistrat i anotat és imprescindible utilitzar una base de dades. Només d’aquesta manera es poden fer cerques per conceptes diversos de forma ràpida i àgil. Durant l’any 2016 hem estat dissenyant aquesta base de dades, que esperem poder programar i posar en línia ben aviat a disposició dels usuaris.

El que ens permetrà la base de dades, tal com l’hem dissenyada, serà fer dos tipus de cerca: una oberta al públic en general i una altra dirigida a investigadors o professionals.

La consulta oberta al públic en general podrà facilitar resultats d’acord amb els següents filtres:

  • Lloc de gravació
  • Activitat: d’entre les programades.
  • Tipus de discurs: monòleg o diàleg.
  • Gènere discursiu: descriptiu, argumentatiu o narratiu.
  • Data de la gravació
  • Grup d’edat: de 18 a 29, de 30 a 49 i més de 50.
  • Sexe: home o dona.

En canvi, la consulta dirigida als investigadors o professionals que s’acreditin com a tals, permetrà fer filtres més específics, relacionats amb aspectes dels signants i del seu entorn lingüístic, social i educatiu. Per a dur a terme aquest segon tipus de cerca, caldrà obtenir unes claus d’accés.

Share

Enregistraments

corpus

Àrea del Vallès:

Terrassa: Associació de persones sordes de Terrassa:

L’Associació de persones sordes de Terrassa va fundar-se l’any 1981 i és la més antiga de les tres entitats vinculades a l’LSC de Terrassa, capital del Vallès Occidental conjuntament amb Sabadell.

Enregistraments:

Dos informants del grup d’edat entre 18 i 30 anys.

Dos informants del grup d’edat de més de 51 anys.

Setembre 2013

 

Àrea de Lleida:

Lleida: Llar de persones sordes de Lleida

La Llar de persones sordes de Lleida va ser fundada l’any 1953 i és l’única associació vinculada a l’LSC de tota la comarca del Segrià. Molts dels socis de l’Associació van anar quan eren petits a l’Escola Llar de Sant Josep de Serviàs, on es van conèixer i van començar a formar part de la comunitat de persones Sordes de la zona. Per això, alguns dels signes que utilitzen són diferents o presenten variants respecte la resta del domini lingüístic de l’LSC.

Enregistraments:

Novembre 2014 – parelles adulta i d’edat avançada

Juny 2015 – parella de joves

 

Àrea de Girona:

Palafrugell: Centre de Persones Sordes del Baix Empordà.

El Centre de Persones Sordes del Baix Empordà és l’associació de creació més recent, de totes les visitades, ja que va fundar-se l’any 2013.

Enregistraments:

Dos informants del grup d’edat entre 31 i 50 anys.

Novembre 2015

Blanes: Associació de Persones Sordes de Blanes i La Selva

L’Associació de persones sordes de Blanes i la Selva va fundar-se l’any 1984.

Enregistraments:

Dos informants del grup d’edat de més de 51 anys.

Dos informants del grup d’edat entre 31 i 50 anys.

Febrer 2016

 

Àrea de Barcelona

Barcelona: Casal de Sords de Barcelona:

El Casal de Sords de Barcelona és la més antiga de les associacions on hem anat a gravar, ja que va fundar-se l’any 1916. També és l’associació visitada que compta amb més membres associats (319 segons les dades que figuren al web de la FESOCA).

Enregistraments:

Dos informants del grup d’edat entre 18 i 30 anys.

Dos informants del grup d’edat entre 31 i 50 anys.

Dos informants del grup d’edat de més de 51 anys.

Setembre 2016

Barcelona: Cerecursor

El Centre Recreativo Cultural de Sordos va fundar-se l’any 1941.

Enregistraments:

Dos informants del grup d’edat entre 18 i 30 anys.

Dos informants del grup d’edat entre 31 i 50 anys.

Dos informants del grup d’edat de més de 51 anys.

Novembre 2016

Comissió de Joventut de la FESOCA

Dos informants del grup d’edat 18-10 anys

Octubre 2013

Share

Corpus de l’LSC

corpus

L’any 2007, l’IEC, la Federació de Persones Sordes de Catalunya, la Universitat Pompeu Fabra, la Fundació Barcelona Media i Linguamón van prendre la iniciativa de col·laborar de cara a crear un corpus de referència de l’LSC. En aquell moment, però, la falta de finançament no va permetre dur endavant el projecte. L’any 2012 l’Institut d’Estudis Catalans va oferir la possibilitat d’iniciar un primer projecte de constitució de corpus amb una fase preparatòria i una prova pilot, que va ser possible gràcies al suport del Departament de Política Lingüística de la Generalitat de Catalunya i a una subvenció de l’Obra Social “La Caixa”. Un any després d’iniciar el projecte pilot es va veure que el projecte corpus de l’LSC era possible, per la qual cosa, el projecte pilot va convertir-se en el projecte de corpus de l’LSC. Des d’aleshores, i gràcies a la continuació del suport del Departament de Política Lingüística de la Generalitat de Catalunya i a la subvenció de l’Obra Social “La Caixa”, hem pogut enregistrar, i seguim enregistrant signants d’arreu del territori del domini lingüístic de l’LSC.

Els objectius principals d’aquest projecte de constitució de corpus són els següents. En primer lloc, documentar l’estat actual de la LSC mitjançant una mostra àmplia i representativa de diferents tipus de discurs signat. En segon lloc, fer una anotació bàsica i descriptiva i posar en línia part del corpus com a material accessible que pot ser utilitzat amb finalitats de recerca, educatives o de consulta per part d’usuaris. En tercer lloc, oferir una eina útil per a la recerca tant teòrica, ja que es comptarà amb un conjunt de dades anotades que permetran fer descripcions i anàlisis per conèixer millor la gramàtica i el lèxic de la LSC, com aplicada, ja que servirà com a punt de referència en la creació de diccionaris i bases de dades o en els programaris de traducció automàtica. Aquest corpus serà una contribució important que aportarà les bases per a l’estandardització de la llengua de signes, tant des d’un punt de vista lingüístic, com de cara a l’establiment d’uns criteris metodològics compartits, tot fixant unes convencions d’anotació.

Durant l’etapa preparatòria, es van preparar els materials d’elicitació necessaris, es van especificar els perfils lingüístics de signants que cal enregistrar per tal que el corpus sigui representatiu, tot tenint en compte aspectes com ara l’edat, el sexe, la distribució geogràfica, l’escolarització, etc., i es va fer un treball de camp per determinar els punts de recollida de dades, a través d’associacions i contactes personals dins la Comunitat Sorda. També es van determinar els criteris d’anotació i els requisits tècnics per a la constitució del corpus, com per exemple el servidor, el programari de codificació, la interfície web, etc. A més es va elaborar un pla de difusió i informació del projecte de corpus durant l’execució. Finalment, es va elaborar un protocol ètic de cara a la recollida, el processament, l’emmagatzematge i la distribució de les dades enregistrades.

El procés d’execució es divideix en tres fases. En la primera, per a la recollida de les dades es determina la ciutat o poble de Catalunya on s’han de fer els enregistraments. Se seleccionen els sis signants nadius i l’entrevistador sord, que utilitza materials d’elicitació i guia els temes de conversa. La segona fase consisteix en l’anotació del discurs signat en català oral, mitjançant el programa ELAN. La tercera fase consisteix en la revisió de l’anotació i en la publicació de l’enregistrament, conjuntament amb l’anotació de la gravació.

Share

Corpus de llengües de signes

corpus

 

Un corpus és una col·lecció representativa de mostres d’una llengua en format llegible per una màquina, que s’utilitza per a estudiar el tipus i la freqüència d’unitats lingüístiques. A més, constitueix una representació àmplia de la llengua i de les seves varietats geogràfiques, de registres i generacionals. Quant als corpus de llengües de signes, es caracteritzen per ser col·leccions de vídeos anotats que contenen material escrit alineat amb les dades principals en llengua de signes. També constitueixen una mostra representativa de la llengua en qüestió.

El benefici principal que aquests tipus de corpus presenten és preservar la llengua de signes com a part important del patrimoni social i lingüístic d’una societat. És important destacar que la iniciativa que presentem aquí compta amb el valuós precedent de projectes semblants d’elaboració de corpus d’altres llengües de signes europees que es troben davant de mancances comparables. Així, als Països Baixos, al Regne Unit, a Austràlia, a Alemanya, a Irlanda i a Itàlia, ja s’han constituït projectes de corpus per a les respectives llengües de signes del país i es troben en fase de construcció, anotació i finalització, segons el cas. L’experiència acumulada en aquests projectes, a la qual tenim accés per les col·laboracions existents amb alguns dels seus responsables, ens permetrà d’avançar encara amb més solidesa i eficiència en la constitució del corpus de la LSC sobre la base de criteris fiables.

Els corpus ens permeten recollir les unitats lèxiques d’una llengua. Del corpus en podem obtenir les propietats gramaticals de les unitats lèxiques que hi apareixen, ja que ens aporta informació sobre el context sintàctic, la fonologia, la morfologia, la semàntica i la pragmàtica d’aquestes unitats. Tota aquesta informació es pot recollir en una base de dades lèxica per classificar-la i organitzar-la. Alguns dels projectes de corpus ja estan prou avançats com per haver-ne pogut obtenir una base de dades lèxica. No totes les bases de dades mostren el mateix tipus d’informació, de manera que trobem des d’aquelles que contenen la definició, la fonologia, la morfologia i fins i tot aspectes pragmàtics dels signes, fins aquelles que es troben en un estadi més inicial i només mostren com s’articula el signe i la glossa corresponent.

-Corpus de la llengua de signes britànica (BSL)

-Corpus de la llengua de signes dels Països Baixos (NGT)

-Corpus de la llengua de signes australiana (AUSLAN)

-Corpus de la llengua de signes alemanya (DGS)

-Corpus de la llengua de signes de la Bèlgica francòfona (LSBF)

-Corpus de la llengua de signes polonesa (PJM)

-Bases de dades de la llengua de signes espanyola (LSE)

-Base de dades de la llengua de signes americana (ASL)

 

Share

Benvinguts

corpus

Benvinguts! Aquesta és la pàgina web del projecte de corpus de la llengua de signes catalana (LSC). Aquest projecte va iniciar-se l’any 2012 i ens servirà de font per a elaborar estudis sobre la llengua de signes catalana,  utilitzada pels signants del territori català, així com també per elaborar materials lingüístics en LSC. Als diferents apartats trobareu informació concreta sobre què són els corpus de llengües de signes, en què consisteix el projecte de corpus de l’LSC, els enregistraments i l’enllaç a la base de dades. Esperem que us sigui útil i us agradi!

Share