Arquivo da Categoria ‘Mineração de Dados’

Projeto de Pesquisa: Algoritmos de Análise de Agrupamentos Autobalanceados (A4)

sexta-feira, 6 de março de 2009

Na próxima semana iniciaremos, oficialmente, no campus ULBRA em Santa Maria - RS o Projeto de Pesquisa “Algoritmos de Análise de Agrupamentos Autobalanceados”, ou simplesmente A4.

O Projeto foi registrado na Universidade sobre o número 672/2008 e será executado ao longo do ano de 2009 e, se os resultados obtidos forem satisfatórios, poderá ser renovado indefinidamente. Segue abaixo o resumo do projeto:

“Num mundo globalizado e competitivo como o atual, as empresas buscam aumentar a competitividade para prosseguir em seus negócios. Para isso, precisam promover inovações constantes, de forma a atender às mudanças exigidas pelo mercado.

As técnicas de Data Mining assumem grande importância para neste processo, uma vez que permitem encontrar novos nichos de mercados para os produtos. Dentre as diversas técnicas de Data Mining destaca-se a Análise de Agrupamento (Cluster Analysis) que, através de sucessivas iterações, forma grupos de acordo com uma determinada medida de similaridade.

O algoritmo de Análise de Agrupamentos mais conhecido e usado é o k-means, cuja funcionalidade simples permite um bom índice de acertos. Entretanto o algoritmo de k-means e seus descendentes possuem uma falha, executam o balanceamento (ajuste) dos agrupamentos apenas após a formação dos mesmos, o que faz com que nem sempre os grupos formados sejam os ideais.

Esse trabalho propõe a criação de um novo algoritmo de Análise de Agrupamentos, que faça o balanceamento dos grupos em tempo real, o que irá fazer com que o processo de mineração seja mais rápido e eficiente.

Aplicações e tarefas desempenhadas

sexta-feira, 7 de novembro de 2008

Hoje praticamente não existe nenhuma área de conhecimento em que as técnicas de mineração de dados não possam ser usadas. Entretanto existem áreas onde o uso têm sido mais freqüente, FAYYAD et al. (1996) citam exemplos de aplicações nestas áreas:

Marketing: redução dos custos com o envio de correspondências através de sistemas de mala direta a partir da identificação de grupos de clientes potenciais, que é feito através do perfil, conforme já comentado no início deste capítulo.

Detecção de fraude: reclamações indevidas de seguro, chamadas clonadas de telefones celulares, compras fraudulentas com cartão de crédito e nomes duplicados em sistemas de Previdência Social.

Investimento: diversas empresas têm usado técnicas de mineração de dados, embora a maioria delas não as revela, para obter ganhos financeiros. São usados especialmente modelos de redes neurais no mercado de ações e na previsão da cotação do ouro e do dólar.

Produção: empresas desenvolvem sistemas para detectar e diagnosticar erros na fabricação de produtos. Estas falhas são normalmente agrupadas por técnicas de Análise de Agrupamentos.

As técnicas de mineração podem ser aplicadas a tarefas (neste contexto, um problema de descoberta de conhecimento a ser solucionado) como associação, classificação, predição/previsão, sumarização e clusterização. A seguir uma descrição resumida de cada uma delas (para maiores informações consulte FAYYAD e STOLORZ, 1997):

Associação: consiste em determinar quais fatos ou objetos tendem a ocorrer juntos num mesmo evento ou numa mesma transação.

Classificação: consiste em construir um modelo que possa ser aplicado a dados não classificados visando categorizar os objetos em classes. Todo objeto é examinado e classificado de acordo com a classe definida (HARRISON, 1998).

Predição/Previsão: predição é usada para definir um provável valor para uma ou mais variáveis. A previsão é utilizada quando se têm séries temporais (dados organizados cronologicamente), como por exemplo a previsão da cotação de uma ação na bolsa de valores.

Agrupamentos ou Clusterização: é um processo de partição, que visa dividir uma população em subgrupos mais heterogêneos entre si. É diferente da tarefa de classificação, pois não existem classes predefinidas, os objetos são agrupados de acordo com a similaridade.

Conceituando Data Mining

quinta-feira, 6 de novembro de 2008

Todas as etapas do processo de KDD são importantes para o sucesso do mesmo. Entretanto, é a etapa de Mineração de Dados (data mining) que recebe o maior destaque na literatura. Segundo FAYYAD et al. (1996), Mineração de Dados é o processo de reconhecimento de padrões válidos ou não, existentes nos dados armazenados em grandes bancos de dados.

Para BERRY e LINOFF (1997), Mineração de Dados é a exploração e análise, de forma automática ou semi-automática, de grandes bases de dados com objetivo de descobrir padrões e regras. O objetivo do processo de mineração é fornecer as corporações informações que as possibilitem montar melhores estratégias de marketing, vendas, suporte, melhorando assim os seus negócios.

A Mineração de Dados trás consigo uma série de idéias e técnicas para uma vasta variedade de campos. Estatísticos, pesquisadores de Inteligência Artificial (IA) e administradores de bancos de dados usam técnicas diferentes para chegar a um mesmo fim, ou seja, a informação.

A diferença entre estas áreas está nos termos utilizados, onde estatísticos vêem variáveis dependentes e independentes, pesquisadores de IA vêem características e atributos e administradores de bancos de dados vêem registros e campos (BERRY e LINOFF, 1997). Independente da linha de pesquisa a que estão ligadas, as técnicas fazem uso de métodos computacionais para a Descoberta de Conhecimento em Bancos de Dados.