Utilize este identificador para referenciar este registo: https://hdl.handle.net/10316/108651
Título: Pesquisa Literária com R: Análise Quantitativa de Dados Textuais, Quanteda tomando como exemplo o Livro do Desassossego
Outros títulos: Literary research using R language: Quantitative Analysis of Textual Data, Quanteda, taking the book Livro do Desassossego as an example
Autor: Giménez, Diego 
Gomide, Andressa
Palavras-chave: quanteda; r; Fernando Pessoa; textual data; leitura distante.; distant reading; données textuelles; lecture à distance
Data: 6-Dez-2022
Editora: Centro de Estudos Interdisciplinares da Universidade de Coimbra
Título da revista, periódico, livro ou evento: Estudos do Século XX
Número: 22
Local de edição ou do evento: Coimbra
Resumo: O presente artigo pretende oferecer uma metodologia de pesquisa com o pacote Quanteda, que utiliza a linguagem R, aplicada à análise da obra de Fernando Pessoa. Quanteda (Quantitative Analysis of Textual Data) é um pacote de R para a manipulação e estudo de dados textuais. O programa objetiva aplicar processamento de linguagem natural a textos. Por sua vez, R é uma linguagem de programação para computação estatística suportada pelo R Core Team e R Foundation for Statistical Computing. A ferramenta, assim, permite o estudo textual quantitativo de corpus e oferece ferramentas de visualização que representam as análises. Desde topic modeling até redes semânticas ou análises de coocorrências, as ferramentas possibilitam estudos e representações detalhados de estruturas textuais.
This article aims to offer a research methodology with the Quanteda package, which uses the R language. The corpus for the analysis is the work of Fernando Pessoa. Quanteda (Quantitative Analysis of Textual Data) is an R package for the manipulation and analysis of textual data. The program was created by R users who needed to apply natural language processing to texts. Also, R is a programming language for statistical computing supported by the R Core Team and the R Foundation for Statistical Computing. The tool, therefore, allows the quantitative textual analysis of the corpus and offers visualization tools that represent the corpus analyses. From topic modeling to semantic networks or analysis of co-occurrences, the tools enable detailed studies of textual structures.
Cet article vise à proposer une méthodologie de recherche avec le module Quanteda, qui utilise le langage R, appliqué à l’analyse de l’œuvre de Fernando Pessoa. Quanteda (Analyse quantitative des données textuelles) est un module de R pour la manipulation et l’étude des données textuelles. Le programme vise à appliquer le traitement du langage naturel aux textes. De son côté, R est un langage de programmation pour le calcul statistique soutenu par la R Core Team et la R Foundation for Statistical Computing. L’outil permet donc une étude textuelle quantitative d’un corpus et propose des outils de visualisation qui représentent les analyses. Du topic modeling aux réseaux sémantiques ou à l’analyse des cooccurrences, les outils permettent des études et des représentations détaillées des structures textuelles.
URI: https://hdl.handle.net/10316/108651
ISSN: 1647-8622
DOI: https://doi.org/10.14195/1647-8622_22_7
Direitos: openAccess
Aparece nas coleções:I&D CLP - Artigos em Revistas Nacionais

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato
11737-Article Text-53029-1-10-20221206.pdf1.72 MBAdobe PDFVer/Abrir
Mostrar registo em formato completo

Visualizações de página

91
Visto em 8/mai/2024

Downloads

60
Visto em 8/mai/2024

Google ScholarTM

Verificar

Altmetric

Altmetric


Este registo está protegido por Licença Creative Commons Creative Commons