TY - EJOUR A1 - Tagnin, Stella O. TI - Corpus-driven terminology in Brazil T2 - Cahiers de lexicologie 2012 – 2, n° 101. Dynamique de la recherche en lexicologie, lexicographie et terminologie au Brésil JO - Cahiers de lexicologie (ISSN 2262-0346), 101, 2012 – 2 DO - 10.15122/isbn.978-2-8124-4148-6.p.0169 SN - 2262-0346 SP - 169 EP - 182 AB - Most terminological reference sources in Brazil tend to focus primarily on single terms, which eventually proves to be of little use to translators and other text producers because language consists mostly of pre-fabricated chunks. Besides, quite often these works merely update previous ones without any scientific criteria for this addition, except for the compiler’s intuition. In contrast, our research group, Project CoMET, has been producing corpus-driven glossaries which not only consist of the most frequent vocabulary in the area, but also includes collocations and other relevant phraseology. A carefully built specialized corpus, mostly comparable English-Portuguese, with original texts in both languages, is the source from which all entries are extracted. This is done with WordSmith Tools, a computational tool for linguistic analysis. First, a frequency list of one of the corpora is extracted. Next, this list is compared with another frequency list, usually from a corpus of general language. This produces a list of KeyWords, which are considered candidate terms. Each one is then analyzed in concordance lines to identify its collocates, context of occurrence, or to verify if it is part of an extended unit of meaning. This process is then repeated for the other language. Equivalents are then retrieved with specific search strategies. This methodology has been used for the production of two technical English-Portuguese glossaries: Chemistry (Perrotti-Garcia & Rebechi 2007) and Cooking (Teixeira & Tagnin 2008). Three other ones, Fashion, Photography and Football, are being revised to be published shortly. A maioria das fontes de referência terminológicas no Brasil tendem a apresentar principalmente termos monolexicais, o que acaba por se revelar ser de pouca utilidade para tradutores e produtores de texto, porque a linguagem é, em grande parte, constituída de blocos pré-fabricados. Além disso, muitas vezes esses trabalhos limitam-se a atualizar alguma obra anterior, sem quaisquer critérios científicos para esse acréscimo, exceto a intuição do compilador. Em contraste, nosso grupo de pesquisa, projeto COMET, vem produzindo glossários direcionados por um corpus, uma abordagem que privilegia não apenas os termos mais frequentes na área, como também inclui colocações e fraseologismos relevantes. Um corpus especializado cuidadosamente construído, em especial um corpus comparável inglês-português, com textos originais em ambas as línguas, é a fonte da qual todas as entradas são extraídas. Esse processo é realizado com o programa WordSmith Tools, uma ferramenta computacional para análise linguística. O primeiro passo consiste em extrair uma lista de frequência de um dos corpora. Em seguida, essa lista é comparada com outra lista de frequência, comumente a partir de um corpus de língua geral. Isso produz uma lista de palavras-chave, que são consideradas candidatas a termos. Cada uma é então analisada em linhas de concordância, também produzidas pelo programa, para identificar suas colocações, o contexto de ocorrência, ou para verificar se é parte de uma unidade estendida de significado. Esse processo é então repetido para o outro idioma. Equivalentes são identificados com estratégias de busca específicas. Esta metodologia tem sido utilizada para a produção de vários glossários técnicos inglês-português, dois dos quais já publicados: Química (Perrotti-Garcia & Rebechi 2007) e Culinária (Teixeira & Tagnin 2008). O de Fotografia está no prelo e outros dois, de Moda e de Futebol, estão sendo revistos para serem publicados em breve. PY - 2012 DA - 2012/11/19 DP - Classiques Garnier PB - Classiques Garnier CY - Paris KW - corpus-driven terminology, candidate terms, collocates, extended unit of meaning, technical English-Portuguese glossaries, linguística de corpus, candidato termo, colocação, fraseologismo, glossário técnico LA - eng UR - https://shop.staging.classiques-garnier.net/cahiers-de-lexicologie-2012-2-n-101-dynamique-de-la-recherche-en-lexicologie-lexicographie-et-terminologie-au-bresil-corpus-driven-terminology-in-brazil-en.html Y2 - 2025/12/06 ER -