Utilize este identificador para referenciar este registo:
https://hdl.handle.net/10316/108651
Título: | Pesquisa Literária com R: Análise Quantitativa de Dados Textuais, Quanteda tomando como exemplo o Livro do Desassossego | Outros títulos: | Literary research using R language: Quantitative Analysis of Textual Data, Quanteda, taking the book Livro do Desassossego as an example | Autor: | Giménez, Diego Gomide, Andressa |
Palavras-chave: | quanteda; r; Fernando Pessoa; textual data; leitura distante.; distant reading; données textuelles; lecture à distance | Data: | 6-Dez-2022 | Editora: | Centro de Estudos Interdisciplinares da Universidade de Coimbra | Título da revista, periódico, livro ou evento: | Estudos do Século XX | Número: | 22 | Local de edição ou do evento: | Coimbra | Resumo: | O presente artigo pretende oferecer uma metodologia de pesquisa com o pacote Quanteda, que utiliza a linguagem R, aplicada à análise da obra de Fernando Pessoa. Quanteda (Quantitative Analysis of Textual Data) é um pacote de R para a manipulação e estudo de dados textuais. O programa objetiva aplicar processamento de linguagem natural a textos. Por sua vez, R é uma linguagem de programação para computação estatística suportada pelo R Core Team e R Foundation for Statistical Computing. A ferramenta, assim, permite o estudo textual quantitativo de corpus e oferece ferramentas de visualização que representam as análises. Desde topic modeling até redes semânticas ou análises de coocorrências, as ferramentas possibilitam estudos e representações detalhados de estruturas textuais. This article aims to offer a research methodology with the Quanteda package, which uses the R language. The corpus for the analysis is the work of Fernando Pessoa. Quanteda (Quantitative Analysis of Textual Data) is an R package for the manipulation and analysis of textual data. The program was created by R users who needed to apply natural language processing to texts. Also, R is a programming language for statistical computing supported by the R Core Team and the R Foundation for Statistical Computing. The tool, therefore, allows the quantitative textual analysis of the corpus and offers visualization tools that represent the corpus analyses. From topic modeling to semantic networks or analysis of co-occurrences, the tools enable detailed studies of textual structures. Cet article vise à proposer une méthodologie de recherche avec le module Quanteda, qui utilise le langage R, appliqué à l’analyse de l’œuvre de Fernando Pessoa. Quanteda (Analyse quantitative des données textuelles) est un module de R pour la manipulation et l’étude des données textuelles. Le programme vise à appliquer le traitement du langage naturel aux textes. De son côté, R est un langage de programmation pour le calcul statistique soutenu par la R Core Team et la R Foundation for Statistical Computing. L’outil permet donc une étude textuelle quantitative d’un corpus et propose des outils de visualisation qui représentent les analyses. Du topic modeling aux réseaux sémantiques ou à l’analyse des cooccurrences, les outils permettent des études et des représentations détaillées des structures textuelles. |
URI: | https://hdl.handle.net/10316/108651 | ISSN: | 1647-8622 | DOI: | https://doi.org/10.14195/1647-8622_22_7 | Direitos: | openAccess |
Aparece nas coleções: | I&D CLP - Artigos em Revistas Nacionais |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
11737-Article Text-53029-1-10-20221206.pdf | 1.72 MB | Adobe PDF | Ver/Abrir |
Visualizações de página
127
Visto em 24/jul/2024
Downloads
84
Visto em 24/jul/2024
Google ScholarTM
Verificar
Altmetric
Altmetric
Este registo está protegido por Licença Creative Commons