Universidade de Lisboa Repositório da Universidade de Lisboa

Repositório da Universidade de Lisboa >
Faculdade de Psicologia e Ciências da Educação (FPCE) >
FPCE - Teses de Doutoramento >

Please use this identifier to cite or link to this item: http://hdl.handle.net/10451/3131

Título: Da corrente acústica à palavra : estádios do processamento da percepção da fala
Autor: Fernandes, Tânia Patrícia Gregório, 1978-
Orientador: Ventura, Paulo, 1964-
Kolinsky, Régine
Palavras-chave: Percepção da fala
Psicologia experimental humana
Audição
Linguagens artificiais
Teses de doutoramento - 2008
Issue Date: 2007
Resumo: O problema de Segmentação da Fala é um dos grandes desafios da psicolinguística Cognitiva e é, também, o tema central do trabalho descritivo nesta tese. Dois mecanismos mentais parecem estar envolvidos no processo de segmentação. Primeiro, múltiplos candidatos lexicais são activados e competem directamente para o reconhecimento (e.g. McQueen, Norris, & Cutler, 1994). Em segundo lugar, os ouvintes exploram múltiplos índices (ou pistas) sublexicais, disponíveis na corrente acústica. Estas pistas sublexicais podem ser, de forma geral, classificadas como: pistas suprasegmentais, relativas à prosódia (e.g. o acento lexical); pistas segmentais, a informação estatística relativa à sequência das unidades liguísticas (e.g. fonemas, sílabas) que ocorrem numa língua natural (i.e., probabilidades fonotácticas, Vitevitch & Luce, 1998, 1999) ou numa língua artificial (probabilidade transicional entre sílabas, Saffran, Aslin & Newport, 1996a; Saffran, Newport, &Aslin, 1996b); e pistas subsegmentais relativas a aspectos acústicos de baixo-nível (e.g., a coarticulação, Mattys, 2004). Contudo, até ao momento actual, a maioria das investigações, devotadas ao tema do papel das pistas sublexicais na segmentação da fala em adultos, tem utilizado técnicas experimentais convenciais. Através destas técnicas, como o gating, o priming de modalidade cruzada, o word-spotting, e o registo dos movimentos oculares, o papel dos índices sublexicais na segmentação é indirectamente inferido de acordo com a activação lexical de candidatos compatíveis com o input linguístico. Portanto, o recurso a estes paradigmas não permite avaliar o papel dos índices sublexicais per se, uma vez que aspectos de activação e competição lexical (i.e., informação alto nível) estão igualmente envolvidos no desempenho dos ouvintes. Esta limitação não está presente no paradigma de Aprendizagem de Línguas Artificiais (ALAs) proposto por Saffran e col. (Saffran et al., 1996a, 1996b), permitindo o estudo de informação sublexical em condições de minimização da disponibilidade de informação de alto-nível.Saffran et al. (1996b) demonstraram, recorrendo ao Paradigma de ALA, que mesmo para ouvintes adultos, para quem a informação de alto-nível é prioritária no processo de segmentação, a informação de tipo esstatístico é utilizada na segmentação. Neste paradigma, constituído por duas fases, os ouvintes são primeiro familiarizados com uma corrente acústica contínua composta pela concatenação de um repertório limitado de sílabas Consoante-Vogal. Nesta corrente contínua não existe nenhuma informação acústica que possa indicar ao ouvinte onde uma "palavra" (da LA) começa e onde acaba. Após a fase de familiarização, o ouvinte realiza um teste de escolha forçada onde, em cada ensaio, deverá decidir entre dois estímulos, qual deles corresponde a uma "palavra" de LA. A comparação do desempenho dos ouvintes com o nível do acaso permite avaliar se houve aprendizagem, uma vez que esta será expressa por um desempenho significativamente superior ao nível do acaso (i.e., o ouvinte escolheu com maior frequência os estímulos apresentados que na realidade era "palavras" da LA do que os estímulos constituídos pelo mesmo repertório de sílabas mas que não eram "palavras" da LA). Uma vez que os estímulos, apresentados na segunda fase, ocorreram embebidos numa corrente acústica durante a primeira fase, a observação de efeitos de aprendizagem sugere que os ouvintes são sensíveis à informação que está disponível na corrente apresentada, sendo capazes de utilizá-la ao serviço da segmentação da fala. Normalmente, a informação disponível corresponde a informação segmental de natureza estatística, i.e., a probabilidade transicional (PT) entre sílabas adjacentes. A PT corresponde à probabilidade com que uma primeira sílaba (X) é capaz de prever a que se lhe segue (Y), (i.e., PT = frequência XY / frequência X). De facto, não só numa LA, mas em qualquer língua natural, a probabilidade de uma sílaba prever a seguinte é maior, quando as duas sílabas pertencem à mesma palavra, do que quando ocorrem em posição adjacente na corrente mas com um ponto de segmentação entre si (Perruchet & Peereman, 2004; Swingley, 2005). Como esta computação estatística não exige qualquer conhecimento lexical, esta poderia ser a primeira pista de segmentação disponível aos bebés (Thiessen & Saffran, 2003), ocupando, por isso, uma posição central, não só na aquisição lexical, mas também na aquisição de outras pistas de segmentação (Mattys, White, & Melhorn, 2005). O paradigma de ALAs é também uma metodologia especialmente vantajosa para o estudo da segmentação da fala em adultos. Como informação lexical (prioritária para o sistema perceptivo adulto) não se encontra disponível numa LA, este paradigma permite o estudo rigoroso do papel de diferentes fontes de informação sublexical na segmentação. O controlo sistemático da informação disponível e do tempo de exposição permitem igualmente a redução do conjunto de variáveis não controladas e a análise sistemática do papel de diferentes pistas de segmentação. Recentemente, Mattys e colaboradores (Mattys et al., 2005) apresentaram a primeira proposta teórica relativa à organização das diferentes fontes de informação, quer lexicais quer sublexicais, utilizadas ao serviço da segmentação da fala. Esta proposta considera que a segmentação da fala é produto, quer das fontes de informação que se encontram disponíveis, quer das condições interpretativas. As condições de audição têm um papel gradativo (e não de tipo tudo-ou-nada) na utilização de qualquer pista de segmentação. Nesta proposta teórica, os índices de segmentação encontram-se organizados hierarquicamente em três níveis. No nível superior da hierarquia encontra-se representada a informação lexical e pós-lexical, prioritária para a segmentação da fala em ouvintes com um léxic mental totalmente desenvolvido. Nos níveis inferiores estão representadas as informações sublexicais que terão um papel determinante na segmentação da fala, quando a informação lexical se encontra indisponível ou é reduzida. No segundo nível da hierarquia encontram-se informações de tipo (estatístico) e subsegmental. Estas serão a informação determinante para a segmentação quando apenas informação sublexical se encontre disponível na corrente. O nível inferior da hierarquia corresponde à informação suprasegmental, de natureza prosódica, que funciona como heurística de último recurso em condições de fraca qualidade do sinal (e.g., sobreposição de ruído branco). Na investigação de segmentação da fala é fundamental adoptar uma perspectiva integrativa, no sentido em que, para além do estudo isolado de diferentes pistas de segmentação, estas fontes de informação deverão ser estudadas em condições combinatórias. Por outras palavras, o estudo integrado permite a compreensão de como diferentes fontes de informação são integradas (i.e., quando sugerem as mesmas hipóteses de segmentação, a disponibilidade de diferentes pistas terá um benefício na segmentação da fala?) e como são ponderadas (i.e., quando diferentes pistas de segmentação sugerem limites de palavra distintos, qual a pista considera mais fidedigna?). Uma outra frente de investigação abordada no presente trabalho diz respeito às condições de audição. Tal como proposto por Mattys e col. (2005), estas condições têm um impacto nodulador na ponderação das pistas de segmentação disponíveis na corrente (i.e., a fiabilidade das pistas depende largamente da qualidade do sinal), e estas condições não se circunscrevem apenas à qualidade física do sinal. Há mais ruído do que a simples degradação física da corrente. Contudo, até ao presente, nenhum estudo investigou o papel de tipos de ruído qualitativamente diferentes na organização hierárquica das diferentes fontes de informação. Com o objectivo de avaliar o impacto das condições de audição na ponderação de diferentes tipos de informação sublexical, no presente estudo foi realizado um conjunto de experiências adoptando o paradigma de ALAs. Nesta investigação, foi avaliado o impaco de ruído físico (i.e., sobreposição de ruído branco na corente de fala a diferentes rácios sinal-ruído) e de ruído cognitivo (i.e., redução dos recursos atencionais disponíveis por realização de tarefas concorrente, atencionalmente exigentes), na ponderação de fontes de informação sublexical, representadas na proposta de Mattys e col., quer no mesmo nível (a co-articulação, informação de tipo subsegmental, acústico de baixo-nível vs. a PT entre sílabas adjacentes, informação segmental estatística; e também entre diferentes tipos de informação suprasegmental - a prosódia universal vs. o acento lexical), quer em níveis diferentes (PTs vs. prosódica) da hierarquia. Nas Experiências 1-3B foi avaliado o impacto do ruído físico (i.e., por sobreposição de ruído branco ao sinal de fala) na ponderação dos três tipos de informação sublexical. Na Experiência 1, com sinal intacto, a coarticulação demonstrou-se uma pista de segmentação importante, superando o papel da informação estatística na segmentação. Contudo, o estatuto da informação coarticulatória é modelado pela qualidade física do sinal, enquanto a informação estatística se mantém resistente a uma degradação deste tipo. De facto, a informação estatística se mantém resistente a uma degradação deste tipo. De facto, a informação estatística foi capaz de conduzir o processo de segmentação a níveis similares em condições de sinal intacto e de sinal fortemente degradado. Na Experiência 2, quer a informação prosódica universal, quer as PTs, demonstraram-se insensíveis a degradação física do sinal. Além disso, a informação prosódica foi a pista considerada mais fiável no processo de segmentação em qualquer condição de audição. O papel do acento lexical (i.e., informação suprasegmental, específica da língua em questão) na segmentação da fala (Experiência 3) é muito diferente do papel da informação prosódica universal. De facto, apenas em condições de ruído físico, se observaram efeitos do padrão de acento na segmentação da fala. O impacto do ruído cognitivo (i.e., sobrecarga atencional) na ponderação das pistas sublexicais é muito diferente do impacto do ruído físico. Na Experiência 4, verificou-se que a ponderação da informação estatística e da coarticulação observada em condições de ruído cognitivo é aproximadamente uma imagem em espelho da observada em condições de ruído físico. Em condições de redução drástica dos recursos atencionais disponíveis, a segmentação conduzida pela coarticulação não foi afectada, enquanto a informação estatística se revelou muito sensível a esta degradação. Nas Experiências 5 e 6, avaliámos de forma mais fina o impacto do ruído cognitivo na segmentação conduzida pela informação estatística. Nestas duas experiências foi demonstrado que a computação de PTs é dependente dos recursos atencionais, mas não de um mecanismo selectivo de atenção. Contudo, mesmo quando, os recursos atencionais disponíveis são drasticamente reduzidos, a informação estatística continua a ser capaz de conduzir o processo de segmentação. Nas três últimas experiências (Experiências 7-9) deste estudo combinámos técnicas convencionais com o paradigma de ALAs. Na Experiência 8 e 9 avaliámos qual a natureza das representações fonológicas extraídas de uma corrente continua por aprendizagem estatística. Na Experiência 8 foi demonstrado que ouvintes adultos tratam o output da aprendizagem estatística como potenciais palavras (i.e., efeito de priming inibitório dos novos vizinhos - produtos da segmentação da LA-; e.g., /fiveku) na decisão lexical de palavras reais (e.g., fivela). Este estatuto lexical foi apenas observado quando as pistas de segmentação disponíveis na corrente de fala eram congruentes. Na experiência 9, em condições de pistas incongruentes, não foi observado qualquer efeito de lexicalização do output do procedimento de segmentação utilizado pelos ouvintes. Desta forma, a segmentação da fala é largament o produto da ponderação das fontes de informação disponíveis na corrente, e das condições interpretativas (cf. Mattys et al., 2005). para além disso, no presente trabalho é também sugerido que a ponderação das pistas sublexicais de segmentação depende de dois factores: (i) a sua "generalidade de domínio"; e (ii) o seu papel numa língua em particular (i.e., pista universal vs. pista específica da língua em questão; e.g., informação prosódica universal vs. acento lexical. Assim, o padrão de resultados observado neste estudo sugere que os modelos actuais de reconhecimento da palavra falada deverão incorporar a importância do papel da congruência das pistas de segmentação, bem como da natureza das mesmas, quer na segmentação da fala (i.e, processamento on-line), quer na aprendizagem de novas palavras (i.e, alterações estruturais de longo prazo).
Descrição: Tese de doutoramento em Psicologia (Psicologia Geral), apresentada à Universidade de Lisboa através da Faculdade de Psicologia e de Ciências da Educação, 2008
URI: http://hdl.handle.net/10451/3131
Appears in Collections:FPCE - Teses de Doutoramento

Files in This Item:

File Description SizeFormat
ulsd54476_td_Tania_Fernandes.pdf2,55 MBAdobe PDFView/Open
Statistics
FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

  © Universidade de Lisboa / SIBUL
Alameda da Universidade | Cidade Universitária | 1649-004 Lisboa | Portugal
Tel. +351 217967624 | Fax +351 217933624 | repositorio@reitoria.ul.pt - Feedback - Statistics
DeGóis
  Estamos no RCAAP Governo Português separator Ministério da Educação e Ciência   Fundação para a Ciência e a Tecnologia

Financiado por:

POS_C UE