Please use this identifier to cite or link to this item:
https://hdl.handle.net/10316/108651
Title: | Pesquisa Literária com R: Análise Quantitativa de Dados Textuais, Quanteda tomando como exemplo o Livro do Desassossego | Other Titles: | Literary research using R language: Quantitative Analysis of Textual Data, Quanteda, taking the book Livro do Desassossego as an example | Authors: | Giménez, Diego Gomide, Andressa |
Keywords: | quanteda; r; Fernando Pessoa; textual data; leitura distante.; distant reading; données textuelles; lecture à distance | Issue Date: | 6-Dec-2022 | Publisher: | Centro de Estudos Interdisciplinares da Universidade de Coimbra | Serial title, monograph or event: | Estudos do Século XX | Issue: | 22 | Place of publication or event: | Coimbra | Abstract: | O presente artigo pretende oferecer uma metodologia de pesquisa com o pacote Quanteda, que utiliza a linguagem R, aplicada à análise da obra de Fernando Pessoa. Quanteda (Quantitative Analysis of Textual Data) é um pacote de R para a manipulação e estudo de dados textuais. O programa objetiva aplicar processamento de linguagem natural a textos. Por sua vez, R é uma linguagem de programação para computação estatística suportada pelo R Core Team e R Foundation for Statistical Computing. A ferramenta, assim, permite o estudo textual quantitativo de corpus e oferece ferramentas de visualização que representam as análises. Desde topic modeling até redes semânticas ou análises de coocorrências, as ferramentas possibilitam estudos e representações detalhados de estruturas textuais. This article aims to offer a research methodology with the Quanteda package, which uses the R language. The corpus for the analysis is the work of Fernando Pessoa. Quanteda (Quantitative Analysis of Textual Data) is an R package for the manipulation and analysis of textual data. The program was created by R users who needed to apply natural language processing to texts. Also, R is a programming language for statistical computing supported by the R Core Team and the R Foundation for Statistical Computing. The tool, therefore, allows the quantitative textual analysis of the corpus and offers visualization tools that represent the corpus analyses. From topic modeling to semantic networks or analysis of co-occurrences, the tools enable detailed studies of textual structures. Cet article vise à proposer une méthodologie de recherche avec le module Quanteda, qui utilise le langage R, appliqué à l’analyse de l’œuvre de Fernando Pessoa. Quanteda (Analyse quantitative des données textuelles) est un module de R pour la manipulation et l’étude des données textuelles. Le programme vise à appliquer le traitement du langage naturel aux textes. De son côté, R est un langage de programmation pour le calcul statistique soutenu par la R Core Team et la R Foundation for Statistical Computing. L’outil permet donc une étude textuelle quantitative d’un corpus et propose des outils de visualisation qui représentent les analyses. Du topic modeling aux réseaux sémantiques ou à l’analyse des cooccurrences, les outils permettent des études et des représentations détaillées des structures textuelles. |
URI: | https://hdl.handle.net/10316/108651 | ISSN: | 1647-8622 | DOI: | https://doi.org/10.14195/1647-8622_22_7 | Rights: | openAccess |
Appears in Collections: | I&D CLP - Artigos em Revistas Nacionais |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
11737-Article Text-53029-1-10-20221206.pdf | 1.72 MB | Adobe PDF | View/Open |
Page view(s)
127
checked on Jul 24, 2024
Download(s)
84
checked on Jul 24, 2024
Google ScholarTM
Check
Altmetric
Altmetric
This item is licensed under a Creative Commons License