Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/108651
Title: Pesquisa Literária com R: Análise Quantitativa de Dados Textuais, Quanteda tomando como exemplo o Livro do Desassossego
Other Titles: Literary research using R language: Quantitative Analysis of Textual Data, Quanteda, taking the book Livro do Desassossego as an example
Authors: Giménez, Diego 
Gomide, Andressa
Keywords: quanteda; r; Fernando Pessoa; textual data; leitura distante.; distant reading; données textuelles; lecture à distance
Issue Date: 6-Dec-2022
Publisher: Centro de Estudos Interdisciplinares da Universidade de Coimbra
Serial title, monograph or event: Estudos do Século XX
Issue: 22
Place of publication or event: Coimbra
Abstract: O presente artigo pretende oferecer uma metodologia de pesquisa com o pacote Quanteda, que utiliza a linguagem R, aplicada à análise da obra de Fernando Pessoa. Quanteda (Quantitative Analysis of Textual Data) é um pacote de R para a manipulação e estudo de dados textuais. O programa objetiva aplicar processamento de linguagem natural a textos. Por sua vez, R é uma linguagem de programação para computação estatística suportada pelo R Core Team e R Foundation for Statistical Computing. A ferramenta, assim, permite o estudo textual quantitativo de corpus e oferece ferramentas de visualização que representam as análises. Desde topic modeling até redes semânticas ou análises de coocorrências, as ferramentas possibilitam estudos e representações detalhados de estruturas textuais.
This article aims to offer a research methodology with the Quanteda package, which uses the R language. The corpus for the analysis is the work of Fernando Pessoa. Quanteda (Quantitative Analysis of Textual Data) is an R package for the manipulation and analysis of textual data. The program was created by R users who needed to apply natural language processing to texts. Also, R is a programming language for statistical computing supported by the R Core Team and the R Foundation for Statistical Computing. The tool, therefore, allows the quantitative textual analysis of the corpus and offers visualization tools that represent the corpus analyses. From topic modeling to semantic networks or analysis of co-occurrences, the tools enable detailed studies of textual structures.
Cet article vise à proposer une méthodologie de recherche avec le module Quanteda, qui utilise le langage R, appliqué à l’analyse de l’œuvre de Fernando Pessoa. Quanteda (Analyse quantitative des données textuelles) est un module de R pour la manipulation et l’étude des données textuelles. Le programme vise à appliquer le traitement du langage naturel aux textes. De son côté, R est un langage de programmation pour le calcul statistique soutenu par la R Core Team et la R Foundation for Statistical Computing. L’outil permet donc une étude textuelle quantitative d’un corpus et propose des outils de visualisation qui représentent les analyses. Du topic modeling aux réseaux sémantiques ou à l’analyse des cooccurrences, les outils permettent des études et des représentations détaillées des structures textuelles.
URI: https://hdl.handle.net/10316/108651
ISSN: 1647-8622
DOI: https://doi.org/10.14195/1647-8622_22_7
Rights: openAccess
Appears in Collections:I&D CLP - Artigos em Revistas Nacionais

Files in This Item:
File Description SizeFormat
11737-Article Text-53029-1-10-20221206.pdf1.72 MBAdobe PDFView/Open
Show full item record

Page view(s)

84
checked on Apr 24, 2024

Download(s)

55
checked on Apr 24, 2024

Google ScholarTM

Check

Altmetric

Altmetric


This item is licensed under a Creative Commons License Creative Commons