Export ???item.export.type.endnote??? ???item.export.type.bibtex???

Please use this identifier to cite or link to this item: https://bdtd.ucb.br:8443/jspui/handle/123456789/1323
Type: Dissertação
Title: Suporte à padronização das cartas de solos do cerrado utilizando mineração de textos
Author(s): Rodrigues, Francisco Carlos da Luz 
First Advisor: Prado, Hércules Antônio do
Summary: A informação em meio digital existente hoje em dia está representada, em sua maior parte, no formato textual. Pesquisas recentes mostram a pertinência das técnicas de Mineração de Textos (MT) no tratamento desta enorme quantidade de informação para transformá-la em fonte de conhecimento. Atividades de organização da informação para a tomada de decisão têm sido impulsionadas pelo uso da MT. Este trabalho aborda o problema da geração de taxonomias a partir de um conjunto de textos. Taxonomia refere-se à organização hierárquica de objetos. O objetivo é prover subsídios aos especialistas de um determinado domínio para a criação de taxonomias a partir da aplicação de técnicas de análise de agrupamentos textuais. O estudo de caso aborda um problema real na área de classificação de mapas de solos do Cerrado. Este problema tem sua origem no final dos anos 70, quando diversas instituições realizaram, independentemente, classificações de solos na região servindose de um mesmo conjunto padronizado de descritores. Entretanto, cada instituição rotulou de forma distinta as classes encontradas, levando à proliferação de diferentes rótulos para as mesmas classes. A solução proposta neste trabalho é a aplicação de um processo cíclico de agrupamento sobre o conjunto das legendas. Esse processo constitui-se dos seguintes passos: (i) geração de configurações de agrupamentos de legendas; (ii) interação com especialistas do domínio para análise das configurações; (iii) reelaboração dos agrupamentos a partir da análise dos especialistas. O critério de parada do processo é a obtenção de uma taxonomia das legendas que, à luz do conhecimento dos especialistas em pedologia envolvidos, seja aceitável como um padrão de nomenclatura. A pertinência do método proposto foi parcialmente aferida com a geração de uma primeira taxonomia com base em um subconjunto das legendas. A continuidade do processo até um resultado plenamente satisfatório depende de um esforço considerável por parte dos especialistas envolvidos.
Abstract: The digital information available today is represented mostly in textual format. Recent polls show the relevance of the techniques of Text Mining (TM) in the treatment of this enormous amount of information to transform it into a source of knowledge. Activities of organizing information for decision making have been driven by the use of TM. This paper addresses the problem of the generation of taxonomies from a set of texts. Taxonomy refers to the hierarchical organization of objects. The goal is to provide grants to experts in a particular field for the creation of taxonomies from the application of techniques for textual clustering analysis. The case study addresses a real problem in the area of classification of soil maps of Cerrado. This problem has its origins in the late '70s, when several institutions conducted independently classifications of soils in the region relying on the same standardized set of descriptors. However, each institution has labeled as separate classes found, leading to a proliferation of different labels for the same classes. The solution proposed in this paper is the application of a cyclic process of grouping together on the soil maps. This process constitutes the following steps: (i) generation of configurations of clusters of soil maps; (ii) interaction with domain experts to review the settings; (iii) redesigning the groupings from the expert analysis. The criterion for stopping the process is to obtain a soil map taxonomy based on knowledge of experts in soil science involved, is acceptable as a standard nomenclature. The relevance of the proposed method was partially matched with the first generation of a taxonomy based on a subset of soil maps. The process continuity until a fully satisfactory result depends on a considerable effort on the part of concerned specialists.
Keywords: vegetação
classificação
mapeamento do solo
organização de arquivos
computação
text mining
taxonomy
soil maps
clustering analysis
CNPq: CNPQ::CIENCIAS SOCIAIS APLICADAS::CIENCIA DA INFORMACAO
Language: por
Parents: BR
Publisher: Universidade Católica de Brasília
Institution Abbreviation: UCB
Department: Informática
Program: Programa de Pós-Graduação em Gestão do Conhecimento e da Tecnologia da Informação
Citation: RODRIGUES, Francisco Carlos da Luz. Suporte à padronização das cartas de solos do cerrado utilizando mineração de textos. 2009. 73 f. Dissertação (Mestrado em Informática) - Universidade Católica de Brasília, Brasília, 2009.
Access Type: Acesso Aberto
URI:  https://bdtd.ucb.br:8443/jspui/handle/123456789/1323
Document date: 23-Apr-2009
Appears in Collections:Programa de Pós-Graduação em Gestão do Conhecimento e da Tecnologia da Informação

Files in This Item:
File Description SizeFormat 
Francisco Carlos da Luz Rodrigues.pdf1.48 MBAdobe PDFThumbnail

Download/Open Preview


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.