Arxiu de l'autor: samuri

Membres del projecte

corpus

JOSEP QUER: Director

GEMMA BARBERÀ: Coordinadora del Corpus LSC

SANTIAGO FRIGOLA: Expert LSC

LALI RIBERA: Coordinadora de la Base de dades lèxica LSC

DELFINA ALIAGA: Anotadora

ALEXANDRA NAVARRETE: Revisora i intèrpret

AIDA VILLAÉCIJA: Revisora i intèrpret

DAVID FALGUERA: Anotador

 

Antics membres:

Noelia Hernández: Anotadora

Sara Costa: Intèrpret

Guillem Massó: Expert en bases de dades i corpus

Xavier Álvarez: Anotador

Share

Base de dades

corpus

Per poder organitzar i classificar tot el material enregistrat i anotat és imprescindible utilitzar una base de dades. La base de dades permet la cerca per diferents conceptes de manera ràpida i fàcil. Durant l’any 2016 vam dissenyar aquesta base de dades, que esperem poder programar i posar en línia a disposició dels usuaris ben aviat.

Tal com l’hem dissenyada, la base de dades permetrà fer dos tipus de cerca: una oberta al públic en general i una altra dirigida a investigadors o professionals.

La consulta oberta al públic en general podrà facilitar resultats d’acord amb els següents criteris de cerca:

  • Lloc de gravació
  • Activitat: d’entre les programades
  • Tipus de discurs: monòleg o diàleg
  • Gènere discursiu: descriptiu, argumentatiu o narratiu
  • Data de la gravació
  • Grup d’edat: de 18 a 30; de 31 a 50 i de més de 51
  • Sexe: home o dona

En canvi, la consulta per part d’investigadors o professionals que s’acreditin com a tals permetrà emprar filtres més específics, relacionats amb aspectes dels signants i del seu entorn lingüístic, social i educatiu. Per a dur a terme aquest segon tipus de cerca, caldrà registrar-se per obtenir unes claus d’accés.

Share

Enregistraments

corpus

Àrea del Vallès:

Terrassa: Associació de Persones Sordes de Terrassa:

L’Associació de Persones Sordes de Terrassa va fundar-se l’any 1981 i és la més antiga de les tres entitats vinculades a l’LSC de Terrassa, capital del Vallès Occidental, conjuntament amb Sabadell.

Enregistraments:

Dos signants del grup d’edat entre 31 i 50 anys.

Dos signants del grup d’edat de més de 51 anys.

Setembre 2013

Dos signants del grup d’edat entre 18 i 30 anys.

Novembre de 2021

 

Àrea de Lleida:

Lleida: Llar de Persones Sordes de Lleida

La Llar de Persones Sordes de Lleida va ser fundada l’any 1953 i és l’única associació vinculada a l’LSC de tota la comarca del Segrià. Molts dels socis de l’Associació van anar quan eren petits a l’Escola Llar de Sant Josep de Serviàs, on es van conèixer i van començar a formar part de la comunitat de persones Sordes de la zona. Per això, alguns dels signes que utilitzen són diferents o presenten variants respecte la resta del domini lingüístic de l’LSC.

Enregistraments:

Dos signants del grup d’edat entre 31 i 50 anys.

Dos signants del grup d’edat de més de 51 anys.

Novembre 2014

 

Dos signants del grup d’edat entre 18 i 30 anys.

Juny 2015 – parella de joves

 

Àrea de Girona:

Palafrugell: Centre de Persones Sordes del Baix Empordà.

El Centre de Persones Sordes del Baix Empordà és l’associació de creació més recent, de totes les visitades, ja que va fundar-se l’any 2013.

Enregistraments:

Dos signants del grup d’edat entre 31 i 50 anys.

Novembre 2015

 

Blanes: Associació de Persones Sordes de Blanes i La Selva

L’Associació de Persones Sordes de Blanes i la Selva va fundar-se l’any 1984.

Enregistraments:

Dos signants del grup d’edat entre 31 i 50 anys.

Dos signants del grup d’edat de més de 51 anys.

Febrer 2016

 

Àrea de Barcelona

Barcelona: Casal de Sords de Barcelona:

El Casal de Sords de Barcelona és la més antiga de les associacions on hem enregistrat, ja que va fundar-se l’any 1916. També és l’associació visitada que compta amb més membres associats (319 segons les dades que figuren al web de la FESOCA l’any 20XX)).

Enregistraments:

Dos signants del grup d’edat entre 18 i 30 anys.

Dos signants del grup d’edat entre 31 i 50 anys.

Dos signants del grup d’edat de més de 51 anys.

Setembre 2016

Barcelona: Cerecursor

El Centre Recreativo Cultural de Sordos (CERECUSOR) va fundar-se l’any 1941.

Enregistraments:

Dos signants del grup d’edat entre 18 i 30 anys.

Dos signants del grup d’edat entre 31 i 50 anys.

Dos signants del grup d’edat de més de 51 anys.

Novembre 2016

 

Barcelona: Comissió de Joventut de la FESOCA

Dos signants del grup d’edat 18 i 30 anys

Octubre 2013

 

Àrea d’Osona

Vic: Agrupació de Persones Sordes de Vic i Comarca

Enregistraments:

Dos signants del grup d’edat entre 31 i 50 anys.

Dos signants del grup d’edat de més de 51 anys.

Octubre 2019

 

Àrea de Tarragona:

Cambrils: Associació de Persones Sordes de Cambrils

Enregistraments:

Dos signants del grup d’edat entre 31 i 50 anys

Dos signants del grup d’edat de més de 51 anys.

Novembre 2019

Dos signants  del grup d’edat entre 18 i 30 anys.

Novembre 2021.

Àrea del Bages:

Manresa: Casa Social del Sord de Manresa i Comarques

Enregistraments:

Dos signants del grup d’edat entre 31 i 50 anys

Dos signants del grup d’edat de més de 51 anys.

Octubre 2022

Share

Corpus de l’LSC

corpus

L’any 2007, l’IEC, la Federació de Persones Sordes de Catalunya, la Universitat Pompeu Fabra, la Fundació Barcelona Media i Linguamón van prendre la iniciativa de col·laborar de cara a crear un corpus de referència de l’LSC. En aquell moment, però, la falta de finançament no va permetre dur endavant el projecte. L’any 2012 l’Institut d’Estudis Catalans va oferir la possibilitat d’iniciar un primer projecte de constitució de corpus amb una fase preparatòria i una prova pilot, que va ser possible gràcies al suport del Departament de Política Lingüística de la Generalitat de Catalunya i a una subvenció de l’Obra Social “La Caixa”. Un any després d’iniciar el projecte pilot es va veure que el projecte corpus de l’LSC era possible, per la qual cosa, el projecte pilot va convertir-se en el projecte de corpus de l’LSC. Des d’aleshores, i gràcies a la continuació del suport del Departament de Política Lingüística de la Generalitat de Catalunya i a la subvenció de l’Obra Social “La Caixa”, hem pogut enregistrar, i seguim enregistrant signants d’arreu del territori del domini lingüístic de l’LSC.

Els objectius principals d’aquest projecte de constitució de corpus són els següents. En primer lloc, documentar l’estat actual de la LSC mitjançant una mostra àmplia i representativa de diferents tipus de discurs signat. En segon lloc, fer una anotació bàsica i descriptiva i posar en línia part del corpus com a material accessible que pot ser utilitzat amb finalitats de recerca, educatives o de consulta per part d’usuaris. En tercer lloc, oferir una eina útil per a la recerca tant teòrica, ja que es comptarà amb un conjunt de dades anotades que permetran fer descripcions i anàlisis per conèixer millor la gramàtica i el lèxic de la LSC, com aplicada, ja que servirà com a punt de referència en la creació de diccionaris i bases de dades o en els programaris de traducció automàtica. Aquest corpus serà una contribució important que aportarà les bases per a l’estandardització de la llengua de signes, tant des d’un punt de vista lingüístic, com de cara a l’establiment d’uns criteris metodològics compartits, tot fixant unes convencions d’anotació.

Durant l’etapa preparatòria, es van preparar els materials d’elicitació necessaris, es van especificar els perfils lingüístics de signants que cal enregistrar per tal que el corpus sigui representatiu, tot tenint en compte aspectes com ara l’edat, el sexe, la distribució geogràfica, l’escolarització, etc., i es va fer un treball de camp per determinar els punts de recollida de dades, a través d’associacions i contactes personals dins la Comunitat Sorda. També es van determinar els criteris d’anotació i els requisits tècnics per a la constitució del corpus, com per exemple el servidor, el programari de codificació, la interfície web, etc. A més es va elaborar un pla de difusió i informació del projecte de corpus durant l’execució. Finalment, es va elaborar un protocol ètic de cara a la recollida, el processament, l’emmagatzematge i la distribució de les dades enregistrades.

El procés d’execució es divideix en tres fases. En la primera, per a la recollida de les dades es determina la ciutat o poble de Catalunya on s’han de fer els enregistraments. Se seleccionen els sis signants nadius i l’entrevistador sord, que utilitza materials d’elicitació i guia els temes de conversa. La segona fase consisteix en l’anotació del discurs signat en català oral, mitjançant el programa ELAN. La tercera fase consisteix en la revisió de l’anotació i en la publicació de l’enregistrament, conjuntament amb l’anotació de la gravació.

Share

Corpus de llengües de signes

corpus

 

Un corpus és una col·lecció representativa de mostres d’una llengua en format llegible per una màquina, que s’utilitza per a estudiar el tipus i la freqüència d’unitats lingüístiques. A més, constitueix una representació àmplia de la llengua i de les seves varietats geogràfiques, de registres i generacionals. Quant als corpus de llengües de signes, es caracteritzen per ser col·leccions de vídeos anotats que contenen material escrit alineat amb les dades principals en la corresponent llengua de signes. També constitueixen una mostra representativa de la llengua en qüestió.

El benefici principal que aquests tipus de corpus presenten és preservar la llengua de signes com a part important del patrimoni social i lingüístic d’una societat. És important destacar que la iniciativa que presentem aquí compta amb el valuós precedent de projectes semblants d’elaboració de corpus d’altres llengües de signes europees que es troben davant de mancances comparables. Així, als Països Baixos, al Regne Unit, a Austràlia, a Alemanya, a Irlanda i a Itàlia ja s’han constituït projectes de corpus per a les respectives llengües de signes del país i es troben en fase de construcció, anotació i finalització, segons el cas. L’experiència acumulada en aquests projectes, a la qual tenim accés per les col·laboracions existents amb alguns dels seus responsables, ens permet avançar encara amb més solidesa i eficiència en la constitució del corpus de la LSC sobre la base de criteris fiables.

Els corpus ens permeten recollir les unitats lèxiques d’una llengua. Del corpus podem obtenir les propietats gramaticals de les unitats lèxiques que hi apareixen, ja que ens aporta informació sobre el context sintàctic, la fonologia, la morfologia, la semàntica i la pragmàtica d’aquestes unitats. Tota aquesta informació es pot recollir en una base de dades lèxica per classificar-la i organitzar-la. Alguns dels projectes de corpus ja estan prou avançats com per haver-ne pogut crear un enllaç a una base de dades lèxica. No totes les bases de dades mostren el mateix tipus d’informació, de manera que trobem des d’aquelles que contenen la definició, la fonologia, la morfologia i fins i tot aspectes pragmàtics dels signes, fins aquelles que es troben en un estadi més inicial i només mostren com s’articula el signe i la glossa corresponent.

-Corpus de la llengua de signes britànica (BSL)

-Corpus de la llengua de signes dels Països Baixos (NGT)

-Corpus de la llengua de signes australiana (AUSLAN)

-Corpus de la llengua de signes alemanya (DGS)

-Corpus de la llengua de signes de la Bèlgica francòfona (LSBF)

-Corpus de la llengua de signes polonesa (PJM)

-Bases de dades de la llengua de signes espanyola (LSE)

-Base de dades de la llengua de signes americana (ASL)

 

Share

Benvinguts

corpus

Benvinguts! Aquesta és la pàgina web del projecte de corpus de la llengua de signes catalana (LSC). Aquest projecte va iniciar-se a finals de l’any 2012 i ens servirà de font per a elaborar estudis sobre la llengua de signes catalana,  utilitzada pels signants del territori català, així com també per elaborar materials lingüístics en LSC. En els diferents apartats de la pàgina trobareu informació concreta sobre què són els corpus de llengües de signes, en què consisteix el projecte de corpus de l’LSC, els enregistraments i les corresponents anotacions, i l’enllaç a la base de dades. Esperem que us sigui útil i us agradi!

Share

Nota 1 – Projecte de Corpus de la llengua de signes catalana (LSC)

 

Avui iniciem el noticiari del projecte del Corpus llengua de signes catalana (LSC). Com alguns de vosaltres sabreu, l’any 2012 l’Institut d’Estudis Catalans va iniciar un projecte pilot de Corpus de l’LSC. Aquest projecte pretén recopilar dades de signants natius d’LSC d’arreu de Catalunya, per tal de poder estudiar la varietat regional, de registre i generacional de l’LSC. Fins ara hem fet enregistraments a cinc localitats, que són Terrassa, Lleida, Blanes, Palafrugell i Barcelona. De cada lloc s’han escollit sis persones sordes natives i s’han dividit en parelles home-dona per a cada una de les franges d’edat següents: de 18 a 30 anys, de 31 a 50 i majors de 51. Quan acabi aquesta etapa del projecte, s’hauran enregistrat 42 signants i s’hauran obtingut 63 hores de gravació. Tot aquest material estarà disponible a internet, organitzat per activitats i amb les corresponents anotacions. Confiem que serà una eina de gran utilitat per a l’elaboració de materials en LSC, la investigació lingüística i la creació d’una base de dades lexicogràfica de l’LSC.

Share