REPOSITORIO PUCSP Teses e Dissertações dos Programas de Pós-Graduação da PUC-SP Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem
Use este identificador para citar ou linkar para este item: https://repositorio.pucsp.br/jspui/handle/handle/22524
Tipo: Tese
Título: Representações do ser humano no Google Books: uma perspectiva da Linguística de Corpus sobre os estágios da vida
Autor(es): Dias, Bárbara Soares da Silva
Primeiro Orientador: Sardinha, Antonio Paulo Berber
Resumo: O trabalho que se apresenta foi motivado pela necessidade de compreender as representações do ser humano nas diversas fases da vida. As fases da vida foram operacionalizadas por meio dos seguintes itens lexicais: man, woman, adolescent, adolescence, adult, boy, girl, child, elderly, kid, teen e teenager (bem como suas formas plurais). Os dados da análise consistiram nas publicações disponibilizadas pelo Google Books no período de 1800 a 2008 (i.e., 208 anos), que somam cerca de meio trilhão de palavras. Para tanto, foram realizadas diversas análises dos ngramas (sequências de palavras adjacentes) formados por essas palavras na base de dados Google Books Ngrams. a pesquisa fundamenta-se na Linguística de Corpus, por meio da qual foi possível verificar os padrões de uso dessas palavras bem como a variação do uso desses itens ao logo do tempo. O estudo compreendeu análise quantitativa, primeiramente, e qualitativa, posteriormente, por meio da interpretação da temática apontada pelo léxico, pela leitura e análise de textos disponibilizados pela base do Google Books. A partir da análise dos padrões e da variação temporal de uso, foram apontadas as representações emergentes de cada item investigado. Com base nessa análise, foi possível detectar a introdução, presença e duração das representações, sendo possível verificar como o ser humano tem sido representado pela linguagem (em inglês) nos últimos três séculos. Além dos resultados obtidos, a presente pesquisa salienta o poder de análise histórica baseada em grandes quantidades de dados textuais (big data)
Abstract: The present work was motivated by the need to understand social representations of human being in different phases of life. The life phases were performed through the following lexical items: man, woman, adolescent, adolescence, adult, boy, girl, child, elderly, kid, teen and teenager (as well as their plural forms). The data from the analysis consisted of the publications made available by Google Books in the period from 1800 to 2008 (i.e., 208 years), amounting to about half a trillion words. For this purpose, several analyses of the ngrams (sequences of adjacent words), formed by these words in the Google Books Ngrams database, were performed. The research is based on Corpus Linguistics, which allowed us to verify the patterns of use of these words as well as their usage variation over time. The study included, first, quantitative and then qualitative analysis, through the interpretation of the theme pointed out by the lexicon and affected by the reading and analysis of texts made available by the Google Books database. By analyzing the patterns and the temporal variation of use, the emerging representations of each investigated item were identified. Based on this analysis, it was possible to detect the introduction, presence and duration of the representations, and it was possible to verify how human beings have been represented by language (in English) in the last three centuries. In addition to the obtained results, this research highlights the power of historical analysis based on large amounts of textual data (big data)
Palavras-chave: Linguística de corpus
Google Books
Representação social
Corpus linguistics
Social representation
Sentiment analysis
CNPq: CNPQ::LINGUISTICA, LETRAS E ARTES::LINGUISTICA::LINGUISTICA APLICADA
Idioma: por
País: Brasil
Editor: Pontifícia Universidade Católica de São Paulo
Sigla da Instituição: PUC-SP
metadata.dc.publisher.department: Faculdade de Filosofia, Comunicação, Letras e Artes
metadata.dc.publisher.program: Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem
Citação: Dias, Bárbara Soares da Silva. Representações do ser humano no Google Books: uma perspectiva da Linguística de Corpus sobre os estágios da vida. 2019. 99 f. Tese (Doutorado em Linguística Aplicada e Estudos da Linguagem) - Programa de Estudos Pós-Graduados em Linguística Aplicada e Estudos da Linguagem, Pontifícia Universidade Católica de São Paulo, São Paulo, 2019.
Tipo de Acesso: Acesso Aberto
URI: https://tede2.pucsp.br/handle/handle/22524
Data do documento: 22-Ago-2019
Aparece nas coleções:Programa de Pós-Graduação em Linguística Aplicada e Estudos da Linguagem

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Bárbara Soares da Silva Dias.pdf1,6 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.