Posts com a Tag ‘Mineração de Dados’

Aplicações e tarefas desempenhadas

sexta-feira, 7 de novembro de 2008

Hoje praticamente não existe nenhuma área de conhecimento em que as técnicas de mineração de dados não possam ser usadas. Entretanto existem áreas onde o uso têm sido mais freqüente, FAYYAD et al. (1996) citam exemplos de aplicações nestas áreas:

Marketing: redução dos custos com o envio de correspondências através de sistemas de mala direta a partir da identificação de grupos de clientes potenciais, que é feito através do perfil, conforme já comentado no início deste capítulo.

Detecção de fraude: reclamações indevidas de seguro, chamadas clonadas de telefones celulares, compras fraudulentas com cartão de crédito e nomes duplicados em sistemas de Previdência Social.

Investimento: diversas empresas têm usado técnicas de mineração de dados, embora a maioria delas não as revela, para obter ganhos financeiros. São usados especialmente modelos de redes neurais no mercado de ações e na previsão da cotação do ouro e do dólar.

Produção: empresas desenvolvem sistemas para detectar e diagnosticar erros na fabricação de produtos. Estas falhas são normalmente agrupadas por técnicas de Análise de Agrupamentos.

As técnicas de mineração podem ser aplicadas a tarefas (neste contexto, um problema de descoberta de conhecimento a ser solucionado) como associação, classificação, predição/previsão, sumarização e clusterização. A seguir uma descrição resumida de cada uma delas (para maiores informações consulte FAYYAD e STOLORZ, 1997):

Associação: consiste em determinar quais fatos ou objetos tendem a ocorrer juntos num mesmo evento ou numa mesma transação.

Classificação: consiste em construir um modelo que possa ser aplicado a dados não classificados visando categorizar os objetos em classes. Todo objeto é examinado e classificado de acordo com a classe definida (HARRISON, 1998).

Predição/Previsão: predição é usada para definir um provável valor para uma ou mais variáveis. A previsão é utilizada quando se têm séries temporais (dados organizados cronologicamente), como por exemplo a previsão da cotação de uma ação na bolsa de valores.

Agrupamentos ou Clusterização: é um processo de partição, que visa dividir uma população em subgrupos mais heterogêneos entre si. É diferente da tarefa de classificação, pois não existem classes predefinidas, os objetos são agrupados de acordo com a similaridade.

Conceituando Data Mining

quinta-feira, 6 de novembro de 2008

Todas as etapas do processo de KDD são importantes para o sucesso do mesmo. Entretanto, é a etapa de Mineração de Dados (data mining) que recebe o maior destaque na literatura. Segundo FAYYAD et al. (1996), Mineração de Dados é o processo de reconhecimento de padrões válidos ou não, existentes nos dados armazenados em grandes bancos de dados.

Para BERRY e LINOFF (1997), Mineração de Dados é a exploração e análise, de forma automática ou semi-automática, de grandes bases de dados com objetivo de descobrir padrões e regras. O objetivo do processo de mineração é fornecer as corporações informações que as possibilitem montar melhores estratégias de marketing, vendas, suporte, melhorando assim os seus negócios.

A Mineração de Dados trás consigo uma série de idéias e técnicas para uma vasta variedade de campos. Estatísticos, pesquisadores de Inteligência Artificial (IA) e administradores de bancos de dados usam técnicas diferentes para chegar a um mesmo fim, ou seja, a informação.

A diferença entre estas áreas está nos termos utilizados, onde estatísticos vêem variáveis dependentes e independentes, pesquisadores de IA vêem características e atributos e administradores de bancos de dados vêem registros e campos (BERRY e LINOFF, 1997). Independente da linha de pesquisa a que estão ligadas, as técnicas fazem uso de métodos computacionais para a Descoberta de Conhecimento em Bancos de Dados.