O mundo mapeado em apenas três letras

Que tal saber o endereço de qualquer lugar do mundo com apenas três palavras? Acha impossível, pois saiba que isto já existe desde 2013 (isto mesmo desde 2013), trata-se do What3Words.com.

O autores do projeto afirmam que 75% da população do mundo, o que representa cerca de 4 bilhões de pessoas, possuem endereços inadequados (incompletos ou pelo menos não precisos). As consequências disto são óbvias como a dificuldade para receber correspondências e para serem atendidas pelo poder público.

Você deve estar pensando, mas o mapeamento por latitude e longitude já resolve o problema? Não. Não resolve porque envolve números de difícil memorização, algo como: -29.686365 e -53.807233 (centro de Santa Maria). O sistema do What3Words mapeia o mesmo endereço como leitor.busto.frade. Qual é mais fácil de decorar?

“Como isto funciona?” você deve estar se perguntando. De uma maneira muito simples, como aliás são praticamente todas as ideias geniais.

O globo terrestre foi dividido em 57 trilhões de quadrados de nove metros quadros cada (3×3). Para cada um destes quadrados foram atribuídas 3 palavras, que representam o endereço.

O sistema está disponível em inglês, espanhol, alemão, russo, sueco e agora também em português. Para cada idioma há um conjunto distinto de palavras, para o exemplo usado acima a versão em inglês traz “projects.bicker.persuade“. Foram usadas cerca de 25 mil palavras para cada idioma, palavras estas que foram avaliadas por algoritmos e por pessoas para que não causassem confusão ou dupla interpretação.

Mas o que isto tem haver com BI? Imagine o quanto isto pode mudar os sistemas de georeferenciamento no futuro…

Cinco comandos que todo o programador R deve saber

O R é uma das linguagens mais usadas em Data Mining (usei ela no meu mestrado). Segue uma pequena relação de cinco comandos essenciais que todo o programador R deve saber:

library(): mostra todas as bibliotecas

is(): mostra os objetos carregados em memória

union(): faz a operação de união entre conjuntos

x <- c(1,2,3)
y <- c(3,4)
union(x,y)
[1] 1 2 3 4

intersect(): faz a operação de intersecção entre conjuntos

x <- c(1,2,3)
y <- c(3,4)
intersect(x,y)
[1] 3

download.file(): lê um arquivo remoto

Data Science na Casa Branca

“Finalmente é oficial”. O texto do Wired não poderia começar melhor. Não é de hoje que sabemos que Barack Obama gosta de tecnologia, a campanha para o seu primeiro mandato em 2008 foi iniciada/baseada nas redes sociais (uma novidade na época).

Também não é de hoje que sabemos que o Tio Sam mantêm um verdadeiro exército de cientistas analizando bilhões de terabytes de dados nas mais diversas áreas, em especial na caça a terroristas.

Mas agora a brincadeira é oficial. Obama nomeou DJ Patil como o primeiro Cientista-Chefe de Dados do governo. Gravou até um vídeo oficial para dar as boas vindas e explicar os motivos da criação do “novo” cargo.

Em resumo, Obama disse que o país precisava de uma ajuda especializada sobre o assunto para entender essa quantidade absurda de dados que existe a disposição. Disse também que acredita que isto pode levar o governo a tomar melhores decisões, acelerando tratamentos de saúde, resolvendo problemas do dia-a-dia, estimulando a inovação e assim criar novas oportunidades e empregos.

Curso EAD de BI gratuito: IBM Cognos Business Intelligence

IBM Cognos Business IntelligenceA Oficina do Futuro está com inscrições abertas para o curso de “Conceitos e Fundamentos do IBM Cognos Business Intelligence”. O curso, EAD,  inicia em 16 de março e vai até 16 de abril.

Segue a descrição:

Através de vídeo-aulas é esperado que o aluno obtenha uma visão geral sobre a plataforma IBM Cognos Business Intelligence e conheça seus principais componentes para visualização de relatórios e dashboards, análises dimensionais e consultas ad-hoc e também o componente para construção dos modelos de metadados. Ao assistir todos vídeos da série, o aluno será capaz de reconhecer os principais elementos das interfaces gráficas do software e poderá construir seus primeiros relatórios, dashboards e modelos de metadados. Ao dominar os recursos fundamentais que são apresentados nestes vídeos o aluno será capaz de continuar seu desenvolvimento através de consultas aos manuais do software e documentos disponíveis no IBM DeveloperWorks..

Cuidado: a Vivo está seguindo os seus passos (literalmente)

Leia a nota publica por Lauro Jardim no blog Radar on-Line da revista Veja ontem:

Vivo Notificada

A Secretaria Nacional do Consumidor, do Ministério da Justiça, notificou hoje a Vivo para cobrar explicações sobre o impacto do sistema Smart Steps, vendido pela operadora, na privacidade dos clientes.

O sistema produz relatórios, baseados em dados de localização de seus clientes na rede de celular, sobre o fluxo de pedestres em determinadas regiões e até ruas.

A suspeita da secretaria é que a informação, valiosa para qualquer planejamento de mercado, não seria repassada com autorização dos consumidores. A Vivo tem dez dias para responder.

Smart Steps monitora os passos dos clientes, consolidando estimativas de fluxos populacionais de forma generalizada e não individualizada. O sistema foi desenvolvido em parceria com o instituto de pesquisa de mercado GfK (que está querendo substituir o IBOPE no Brasil).

Qual a intenção disto? Vender os dados para governos e grandes redes varejista. O primeiro poderia os mesmos para planajemento urbano (os fins justificam os meios?), o segundo para o desenvolvimento de ações segmentadas, de acordo com o comportamento dos usuários de celular em determinados horários e local.

Você permitiria que os seus dados fossem vendidos? Você se sente conformatável ao saber que a sua operadora fica monitorando por onde você anda?

PS:  não pense que a Vivo é a única a fazer isto

O big data chega ao museu

Um artigo do jornal madrilenho Expansion (clique aqui para ler – em espanhol) me chamou a atenção para mais um case que mostra que o armazenamento de dados sobre clientes cresce em todas as áreas, inclusive naquelas onde normalmente não há nada a venda.

O artigo mostra exemplos de museus norte americanos que estão coletando dados de seus visitantes, entre eles o Guggenheim (New York), o Museu de Arte de Dallas e o Instituto de Arte de Minneapolis.

A pergunta é óbvia: para que um museu, onde normalmente se vai para observar e não para ser observado como bem lembrou o professor Marc Rotenberg citado no artigo, precisa de informações a cerca de seus visitantes?

  1. Para saber que tipo de obra gostaram mais
  2. Para saber quais as galerias mais visitadas
  3. Para saber quais são os artistas favoritos

Todas as respostas acimas estão corretas e aí surge uma nova pergunta: o que eles vão fazer com estas informações?

Se você respondeu algo como “planejar a próxima exposição”, convém pensar um pouco mais. Este até pode ser um dos motivos, mas há outro: vendê-las a mecenas ou a galerias comerciais.

Portanto, se você tiver a oportunidade de ir a um destes museus, não se espante se alguns dias depois receber uma oferta de um quadro ou de uma escultura.

Estudo comparativo ajuda a escolher a sua próxima plataforma de BI

Escolher uma plataforma de BI não é tarefa simples. São tantas as variáveis a serem levadas em contas, que mesmo um profissional experiente enfrenta dificuldades em apontar a(s) melhor(es) opção(ões).

O consultor independente Gour Nath criou uma matriz que ajuda bastante na hora de tomar essa decisão.

Nath compara sete produtos (Panorama Necto, SAP Lumira, QlikView, Qlik Sense, Tableau Software, Microstrategy e Tibco Spotfire) sobre aspectos como: acesso unificado, fontes de dados e conectividade, modelagem dinâmica, criação de dashboard, versão mobile, segurança e administração, instalação e implementação, entre outros.

O resultado final está na tabela abaixo:

Comparativo de ferramentas de BI

A planilha comparativa (completa) pode ser baixada clicando aqui.