Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro

  • Pablo Faria Universidade Estadual de Campinas
Palavras-chave: aquisição da linguagem, Aprendizagem de categorias, Análise distribucional, Modelagem Cognitiva

Resumo

Uma criança adquirindo a língua deve descobrir quais são as categorias sintáticas em sua língua e atribuir palavras a uma ou mais delas. A questão que nos propomos a responder aqui é o quanto dessa aprendizagem pode ser realizada através da análise distribucional de enunciados. Para este fim, uma re-implementação do modelo computacional de Redington, Chater e Finch (1998) foi conduzida e aplicada a dados do Português Brasileiro, obtidos de corpora disponíveis publicamente, tanto com fala dirigida à criança, quanto com fala entre adultos. Os resultados de todos os experimentos são apresentados e discutidos. Estes experimentos investigam mais variáveis e aspectos envolvidos nesta tarefa de aprendizagem: tipos de contextos distribucionais, o número de palavras-alvo e de contexto assumidas, o valor da informação distribucional para as diferentes categorias, tamanho do corpus etc. Uma comparação entre a fala dirigida à criança e a fala entre adultos também é feita. Em geral, nossos resultados dão suporte aos de Redington et al. (1998), embora tenhamos encontrado algumas diferenças possivelmente importantes e até contraditórias. Também avaliamos a medida cosseno, comparando a performance obtida com ela à performance obtida com a correlação de Spearman usada no estudo de Redington et al. (1998). 

Publicado
2019-12-16
Como Citar
Faria, P. (2019). Aprendizagem de categorias de palavras por análise distribucional resultados adicionais para Português Brasileiro. Diacrítica, 33(2), 229-251. https://doi.org/10.21814/diacritica.415
Secção
Linguística Experimental e Variedades do Português