Conhecer o perfil do cliente traz uma série de benefícios para a empresa, sendo o principal deles, a capacidade de melhorar a qualidade de seus serviços prestados. Conhecendo o público alvo é possível montar uma melhor estratégia de marketing e com isto obter resultados mais significativos com a venda de produtos e/ou serviços.
O problema é que estes registros, muitas vezes, representam apenas dados e não conhecimento. Visando transformar estes dados em conhecimento, surge o processo chamado de Descoberta de Conhecimento em Bancos de Dados (Knowledge Discovery in Databases - KDD), que FAYYAD et al. (1996) definem como sendo “o processo, não trivial, de extração de informações implícitas, previamente desconhecidas e potencialmente úteis, a partir dos dados armazenados em um banco de dados”.
O processo é não trivial já que alguma técnica de busca ou inferência é envolvida, ou seja, não é apenas um processo de computação direta. Os padrões descobertos devem ser válidos com algum grau de certeza, novos (para o sistema e de preferência também para o usuário), potencialmente úteis (trazer algum
benefício) e compreensíveis (se não imediatamente então depois da interpretação).
FAYYAD et al. (1996) dizem ainda que o KDD contém uma série de passos: seleção, pré-processamento e limpeza, transformação, mineração de dados (data mining) e interpretação/avaliação. Simplificando, pode-se dizer que o processo de KDD compreende, na verdade, todo o ciclo que o dado percorre a té virar informação, conforme pode ser visto na figura.

Processo de Knowledge Discovery in Databases - KDD
DINIZ e LOUZADA NETO (2000) afirmam que, embora esses passos devam ser executados na ordem apresentada, o processo é interativo e iterativo. Diz-se que o processo é interativo, pois o usuário pode, e por vezes necessita, continuamente intervir e controlar o curso das atividades. Diz-se também que é iterativo, por ser uma seqüência finita de operações em que o resultado de cada uma é dependente dos resultados das que a precedem.
Baseado na definição é possível ver que KDD é uma tarefa intensiva de descoberta de conhecimento. Possui interações complexas, feitas ao longo do tempo, entre o homem e o banco de dados através de um conjunto heterogêneo de ferramentas.
Dada uma visão geral sobre o processo de KDD, nos próximos pots examinaremos os conceitos a respeito das suas fases.