Postagens

Tomada de Decisão sob Incerteza também é Analytics !

Imagem
Nos últimos anos tem-se visto no Mercado uma explosão de ofertas para serviços de Analytics . A maioria esmagadora desses serviços gira em torno de Business Intelligence e Machine Learning . Ocorre que Analytics não é só isso. Há um ramo muito importante chamado Tomada de Decisão sob Incerteza. Na Ciência de Dados você tem dados históricos, usa-os para gerar um modelo preditivo, usa o modelo para fazer predições, e usa as predições para tomar decisões. Exemplo: você tem os dados históricos dos pedidos feitos pelos clientes, tem os dados históricos das variáveis macroeconômicas do país e da região etc., e usa esses dados para criar um modelo de Machine Learning e com ele estimar o volume de vendas no próximo trimestre, e com base nessa estimativa decidir a quantidade de insumos que irá comprar. Na Tomada de Decisão sob Incerteza, pegando o exemplo acima, você parte de um modelo – tipicamente não criado por técnicas de Machine Learning , mas pela sua experiência de

Verdades, Estatísticas e Probabilidades

Imagem
  William Eduards Deming foi um estatístico norteamericano que nos anos 1950 trabalhou no Japão, onde, segundo alguns autores, teria contribuído de forma independente para a introdução dos princípios que mais tarde viriam a ser conhecidos como TPS – Toyota Production System (os quais historicamente estão mais ligados a Shoichiro Toyoda que a Deming). A frase mais famosa de Deming é: “ Eu acredito em Deus; todos os demais devem me trazer dados ”. Com isso Deming pretendia ressaltar o fato de que argumentações devem ser baseadas em dados, não em fé. Para não envolver questões religiosas, eu costumo usar uma frase inspirada em Deming, que é: não me tragam “verdades”, tragam-me estatísticas ou probabilidades. A palavra “verdades” nessa frase vem entre aspas porque eu penso que não existem verdades absolutas. As verdades absolutas são matéria de fé, não de debate. Fora do escopo religioso os debates devem ser embasados em dados e fatos: suportados pelo número de vezes em que cada situaç

As Leis de Newton adaptadas às Ciências Sociais e Políticas

Imagem
Primeira Lei: Todo Establishment continua em seu estado atual (status quo), a menos que ele seja forçado a mudar aquele estado por ações aplicadas sobre ele. Segunda Lei: A mudança no Establishment é proporcional à ação sobre ele aplicada, e é produzida na mesma direção daquela ação. Terceira Lei: Ao aplicar-se uma ação sobre o Establishment, recebe-se deste uma reação em sentido oposto, na mesma direção, mas com módulo multiplicado por uma constante maior que 2.

Invocando funções Matlab a partir do Python

Imagem
  Se você possui dezenas de funções em Matlab acumuladas ao longo dos anos e deseja aproveitá-las no Python sem precisar reescrever tudo, e ainda com a vantagem tomar proveito da performance superior do Matlab sem abrir mão da flexibilidade do Python, seus problemas acabaram. Existe uma biblioteca que permite exatamente isso, inclusive com passagem de parâmetros Python  ↔ Matlab. A instalação é feita seguindo as orientações contidas em:   https://www.mathworks.com/help/matlab/matlab_external/install-the-matlab-engine-for-python.html ,  com a ressalva que se você usa Python em Windows com ambientes virtuais (" virtual envs "), como é o caso do Anaconda e do Django, esse procedimento só funcionará se for executado dentro de um " virtual env ", caso contrário você receberá um erro de "acesso negado" (mesmo executando como Administrador e possuindo permissões nas pastas de destino). Por que invocar funções do Matlab a partir do Python? Bem, isso é útil princi

Teria a pandemia de COVID-19 sido um “negócio da China” ?

Imagem
A expressão “ negócio da China ” se popularizou nos países lusófonos com o significado de negócio fabuloso. No que concerne à pandemia de COVID-19, abstraindo-se das suposições que ela tenha se iniciado na China , fica ainda a pergunta: para a China, essa pandemia teria sido um “negócio da China”?   Fonte: https://china.usc.edu/gdp-growth-2020 A China vinha de um crescimento anual da ordem de 6% em seu PIB. No acumulado de 2020 esse número baixou para 1.9% ( ou 2.3% dependendo da fonte ). Foi uma redução grande, mas ainda assim representou um desempenho muito melhor que o resto do mundo . E no último trimestre de 2020 o crescimento da economia chinesa já havia recuperado a tradicional pujança . Esse forte crescimento (relativo) fez com que as projeções de a China ultrapassar os EUA como primeira economia do planeta tenham sido antecipadas para 2026 ( ou 2024, dependendo da fonte ). Quanto às consequências não econômicas para a população, os números oficiais reportam apenas 463

O Escritório de Ciência de Dados

Imagem
  (Texto adaptado do capítulo 6 do eBook " Ciência de Dados para Executivos e Tomadores de Decisão ", deste autor) O Escritório de Ciência de Dados é um conceito proposto por este autor, inspirado nos tradicionais Escritórios de Gerenciamento de Projetos que desde o início da década de 2000 vêm auxiliando milhares de empresas na consecução de projetos internos e externos. Trata-se de delegar a uma área específica (própria ou terceirizada) a responsabilidade pelas iniciativas de Ciência de Dados da organização. Nas empresas de pequeno porte essa responsabilidade tipicamente é delegada à área de Tecnologia da Informação, mas provavelmente essa não será uma boa estratégia para empresas de médio e grande porte devido à sobreposição de tarefas, que pode acabar tirando prioridade das atividades de Ciência de Dados. Dentre as atribuições de um ECD, destacam-se essas quatro (além daquelas mostradas na figura abaixo, com exceção das duas camadas inferiores, que são típicas da área d

Um Tributo ao Artigo Quinto da Constituição Federal

Imagem
  Se o brasileiro conhecesse [de verdade] o Art. 5 o  da nossa Constituição Federal e a história das constituições que a precederam  – daqui  e principalmente de outros países mais antigos  –, assim como os  sacrifícios dos heróis que deram suas vidas na luta pelos direitos universais do cidadão, certamente não abaixaria a cabeça para atos de tirania que recentemente têm se tornado tão comuns por aqui.

Confissão

Imagem
  Antes de iniciar o texto, aviso logo de cara e em letras garrafais: PARA ESTUPRADORES EU DESEJO MORTE LENTA E DOLOROSA, E DE PREFERÊNCIA PELAS MÃOS DO PAI DA VÍTIMA. Dito isso, vamos ao texto. Acabei de saber através da live do jornalista Rodrigo Constantino que ele foi demitido da Jovem Pan por supostamente ter se pronunciado a favor do acusado no caso da influencer Mariana Ferrer (o caso foi este: https://jc.ne10.uol.com.br/brasil/2020/11/11993025-com-sentenca-inedita-de-estupro-culposo--empresario-acusado-de-violentar-influencer-e-inocentado.html ). O pronunciamento que deu origem à polêmica e à demissão acontece a partir do ponto 53:25 deste vídeo: https://youtu.be/aQYM15giTvs?t=3205 . Já o vídeo em que o jornalista apresenta a sua revolta com o acontecido é este: https://www.youtube.com/watch?v=qtY9Yj78sYo . Pois bem. Ontem, após tomar conhecimento do fato de que o promotor do caso havia pedido absolvição por “estupro culposo” – um crime que sequer existe na lei brasi

Ciência de Dados?

Imagem
  Presentemente há um movimento intenso em torno do assunto “Ciência de Dados”. Cursos, treinamentos, plataformas de software (principalmente na “nuvem”), webinars , palestras, e até uma nova profissão surgiu a reboque dessa onda: a de “Cientista de Dados”. Mas o que é um “cientista”? De acordo com o site sciencecouncil.org , “ um cientista é alguém que sistematicamente coleta e usa pesquisas e evidências para construir hipóteses e testá-las, para obter e compartilhar compreensão e conhecimento .” [1] Poder-se-ia afirmar simplesmente que o “cientista” é alguém que pratica “ciência”. Neste caso, resta necessário estabelecer o que é “ciência”. Para não se adentrar o campo filosófico, pode-se lançar mão de definições pragmáticas do que seja “ciência”. Carl Sagan, em seu livro “O Romance da Ciência”, à página 27 da segunda edição brasileira, descreve: “ A Ciência é antes de tudo um modo de pensar do que propriamente um conjunto de conhecimentos. Seu objetivo é compreender de que forma

"Algo hicimos mal"

Imagem
Palavras do Presidente Oscar Arias, da Costa Rica, na Cúpula das Américas em Trinidad e Tobago, a 18 de abril de 2009, na presença do então presidente do Brasil e demais presidentes latino-americanos, incluído o do Equador, Rafael Corrêa (abaixo nominalmente citado). Tradução livre minha.  "ALGO FIZEMOS ERRADO" "Tenho a impressão de que cada vez que os países caribenhos e latino-americanos se reúnem com o presidente dos Estados Unidos da América, é para pedir-lhe coisas ou para reclamar coisas.  Quase sempre, é para culpar os Estados Unidos de nossos males passados, presentes e futuros.  Não creio que isso seja de todo justo.  Não podemos esquecer que a América Latina teve universidades antes de que os Estados Unidos criassem Harvard e William & Mary, que são as primeiras universidades desse país.  Não podemos esquecer que nesse continente, como no mundo inteiro, pelo menos até 1750 todos os americanos eram mais ou menos iguais: todos eram pobres.  Ao aparecer a Revo

Erlang B: Uma Interpretação Alternativa

Imagem
  Agner Krarup Erlang era um sujeito interessante: como funcionário da Companhia Telefônica de Copenhague, solucionou analiticamente dois problemas clássicos (mas pragmáticos) na segunda década de 1900: a) calcular quantos troncos (linhas) seriam necessários para prover um serviço telefônico de qualidade aos assinantes, e b) calcular quantas telefonistas seriam necessárias para atender com qualidade a um determinhado volume de chamadas. Até hoje as soluções encontradas por Erlang são aceitas como as corretas para ambos os problemas e utilizadas amplamente por operadoras de telecomunicações, serviços de call-center, serviços de help-desk, dentre outros usos de ordem prática. Ele é considerado o fundador de um ramo do conhecimento chamado de Engenharia de Teletráfego. A fórmula encontrada por Erlang para o primeiro problema é conhecida como “Erlang B”: B é a probabilidade de que chamadas sejam bloqueadas por ausência de troncos livres, dentro de uma unidade de tempo, quando a intensidade

Gerenciar é Estimar

Imagem
Algumas pessoas, principalmente aquelas que são excessivamente apegadas a minúcias técnicas em suas profissões, tendem a não gostar (ou têm medo) de fazer estimativas numéricas ou expressar suas opiniões profissionais sem fazer cálculo. Isso não tem razão de ser. Quanto mais experiente você for em sua profissão, mais será capaz de fazer boas estimativas sem cálculos. Você pratica o ato de fazer estimativas a cada momento de sua vida, inconscientemente: quando ultrapassa outro veículo na estrada, quando joga bolas de papel na lixeira a 5 metros de você (e acerta!), ou mesmo quando brinca com sua filha lançando-a e agarrando-a no ar acima da sua cabeça (se você é pai e nunca fez isso, eu lhe asseguro que seu/sua filho(a) perdeu grandes momentos de diversão com você!). Em alguma dessas situações você para e faz cálculos matemáticos antes de executar tais ações? Claro que não. Por quê? Porque a sua experiência e as suas heurísticas acumuladas permitem que você faça tais coisas sem muito es

O Impacto das Base Rates em Evidências

Imagem
                                                      No artigo “Evidential Impact of Base Rates” (Tversky, 1982), Tversky and Kahneman propõem o seguinte problema (tradução livre minha):  Um táxi se envolveu num acidente à noite e fugiu do local. Duas companhias de táxis, a Verde e a Azul, operam na cidade. Você é apresentado com os seguintes dados:  (a) 85% dos táxis da cidade são verdes e 15% são azuis;  (b) Uma testemunha identificou o táxi do acidente como sendo azul;  (c) A Justiça testou a confiabilidade da testemunha sob as mesmas circunstâncias da noite do acidente e concluiu que a testemunha identifica corretamente cada uma das duas cores em 80% das vezes e erra em 20% das vezes.  Qual é a probabilidade dessa testemunha ter identificado corretamente a cor do taxi nesse acidente?  Seja B o universo de possibilidades de o táxi ser identificado como Azul, e G o universo de possibilidades de o táxi ser identificado como Verde, e seja R o universo de possibilidades de a te