Please use this identifier to cite or link to this item: https://hdl.handle.net/10316/101563
DC FieldValueLanguage
dc.contributor.authorKuhn, Tanara Zingano-
dc.contributor.authorFerreira, José Pedro-
dc.date.accessioned2022-08-31T09:16:26Z-
dc.date.available2022-08-31T09:16:26Z-
dc.date.issued2020-
dc.identifier.issn1678-460Xpt
dc.identifier.issn0102-4450pt
dc.identifier.urihttps://hdl.handle.net/10316/101563-
dc.description.abstractO presente estudo tem como objetivo descrever os desafi os e soluções encontrados na compilação do Corpus de Português Escrito em Periódicos - CoPEP, que contém aproximadamente 40 milhões de palavras, é equilibrado entre as variedades português brasileiro e português europeu em número de palavras e cobre seis grandes áreas de conhecimento. Primeiramente, apresentaremos o contexto de criação do CoPEP, qual seja, a elaboração de um dicionário on-line de português para universitários, para o qual serviu como fonte primária de obtenção de evidências linguísticas. Assim, foram as características desse projeto lexicográfi co que informaram os critérios de criação do desenho do CoPEP e as consequentes tomadas de decisão. A seguir, descreveremos a metodologia de aquisição de dados, com foco especial nos desafi os enfrentados e nas soluções encontradas. Terminaremos com a descrição da fase final de compilação, na qual aplicamos uma série de procedimentos para obtenção de equilíbrio.pt
dc.description.abstractThe present study aims to describe the challenges faced and solutions found in the compilation of the Corpus de Português Escrito em Periódicos - CoPEP, which contains approximately 40 million words, is balanced between the Brazilian Portuguese and European Portuguese varieties in number of words and covers six large areas of knowledge. Firstly, we will present the context of the creation of CoPEP, namely, the make of an on-line dictionary of Portuguese for university students, to which CoPEP served as the primary source for linguistic evidence extraction. Thus, it was the characteristics of this lexicographic project that informed the design criteria for CoPEP and the consequent decision-making process. Next, we will describe the methodology of data acquisition, with a special focus on the challenges that were faced, and the solutions found. We will conclude with the description of the fi nal compilation phase, which involved procedures for obtaining balance.pt
dc.language.isoporpt
dc.relationbolsa COST-STSM-IS1305-210216- 071459) na Universidade de Liublianapt
dc.relationbolsa CAPES de doutorado pleno no exteriorpt
dc.rightsopenAccesspt
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/pt
dc.subjectcorpus multivariedadept
dc.subjectcompilação de corpuspt
dc.subjectdiscurso acadêmicopt
dc.subjectlíngua portuguesapt
dc.subjectmultivariate corpuspt
dc.subjectcorpus compilationpt
dc.subjectacademic discoursept
dc.subjectPortuguese languagept
dc.titleO Corpus de Português Escrito em Periódicos - CoPEPpt
dc.title.alternativeThe Corpus of Portuguese from Academic Journalspt
dc.typearticle-
degois.publication.firstPage1pt
degois.publication.lastPage42pt
degois.publication.issue2pt
degois.publication.titleDELTA Documentacao de Estudos em Linguistica Teorica e Aplicadapt
dc.peerreviewedyespt
dc.identifier.doi10.1590/1678-460x2020360209pt
degois.publication.volume36pt
dc.date.embargo2020-01-01*
uc.date.periodoEmbargo0pt
item.openairetypearticle-
item.fulltextCom Texto completo-
item.languageiso639-1pt-
item.grantfulltextopen-
item.cerifentitytypePublications-
item.openairecristypehttp://purl.org/coar/resource_type/c_18cf-
crisitem.author.researchunitCELGA-ILTEC – Research Centre for General and Applied Linguistics-
crisitem.author.researchunitCELGA-ILTEC – Research Centre for General and Applied Linguistics-
crisitem.author.orcid0000-0003-2640-5500-
crisitem.author.orcid0000-0003-0593-5043-
Appears in Collections:I&D CELGA - Artigos em Revistas Internacionais
Files in This Item:
File Description SizeFormat
O Corpus de português escrito em periódicos-CoPEP.pdf798.37 kBAdobe PDFView/Open
Show simple item record

Google ScholarTM

Check

Altmetric

Altmetric


This item is licensed under a Creative Commons License Creative Commons