Utilize este identificador para referenciar este registo:
https://hdl.handle.net/10316/101563
Título: | O Corpus de Português Escrito em Periódicos - CoPEP | Outros títulos: | The Corpus of Portuguese from Academic Journals | Autor: | Kuhn, Tanara Zingano Ferreira, José Pedro |
Palavras-chave: | corpus multivariedade; compilação de corpus; discurso acadêmico; língua portuguesa; multivariate corpus; corpus compilation; academic discourse; Portuguese language | Data: | 2020 | Projeto: | bolsa COST-STSM-IS1305-210216- 071459) na Universidade de Liubliana bolsa CAPES de doutorado pleno no exterior |
Título da revista, periódico, livro ou evento: | DELTA Documentacao de Estudos em Linguistica Teorica e Aplicada | Volume: | 36 | Número: | 2 | Resumo: | O presente estudo tem como objetivo descrever os desafi os e soluções
encontrados na compilação do Corpus de Português Escrito em
Periódicos - CoPEP, que contém aproximadamente 40 milhões de
palavras, é equilibrado entre as variedades português brasileiro e
português europeu em número de palavras e cobre seis grandes áreas de
conhecimento. Primeiramente, apresentaremos o contexto de criação do
CoPEP, qual seja, a elaboração de um dicionário on-line de português
para universitários, para o qual serviu como fonte primária de obtenção
de evidências linguísticas. Assim, foram as características desse projeto
lexicográfi co que informaram os critérios de criação do desenho do
CoPEP e as consequentes tomadas de decisão. A seguir, descreveremos
a metodologia de aquisição de dados, com foco especial nos desafi os
enfrentados e nas soluções encontradas. Terminaremos com a descrição da fase final de compilação, na qual aplicamos uma série de procedimentos
para obtenção de equilíbrio. The present study aims to describe the challenges faced and solutions found in the compilation of the Corpus de Português Escrito em Periódicos - CoPEP, which contains approximately 40 million words, is balanced between the Brazilian Portuguese and European Portuguese varieties in number of words and covers six large areas of knowledge. Firstly, we will present the context of the creation of CoPEP, namely, the make of an on-line dictionary of Portuguese for university students, to which CoPEP served as the primary source for linguistic evidence extraction. Thus, it was the characteristics of this lexicographic project that informed the design criteria for CoPEP and the consequent decision-making process. Next, we will describe the methodology of data acquisition, with a special focus on the challenges that were faced, and the solutions found. We will conclude with the description of the fi nal compilation phase, which involved procedures for obtaining balance. |
URI: | https://hdl.handle.net/10316/101563 | ISSN: | 1678-460X 0102-4450 |
DOI: | 10.1590/1678-460x2020360209 | Direitos: | openAccess |
Aparece nas coleções: | I&D CELGA - Artigos em Revistas Internacionais |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
O Corpus de português escrito em periódicos-CoPEP.pdf | 798.37 kB | Adobe PDF | Ver/Abrir |
Visualizações de página
111
Visto em 17/jul/2024
Downloads
66
Visto em 17/jul/2024
Google ScholarTM
Verificar
Altmetric
Altmetric
Este registo está protegido por Licença Creative Commons