#0003: Ter uma tonelada de dados não significa muita coisa se você não souber o que fazer com eles, que caminhos podemos seguir quando falamos de dados em AEC?
#0003: Ter uma tonelada de dados não significa muita coisa se você não souber o que fazer com eles, que caminhos podemos seguir quando falamos de dados em AEC? | ||
A Comoditização dos Dados (1/7) | ||
Não é muito segredo que atualmente dados é uma das commodities mais valiosas do mundo, mas o caminho para transformar dados em informação não é tão simples quanto parece, o que vale é informação (só olhar o valor de mercado somado de FAANG), principalmente em um mercado em que o contexto é extremamente importante para ser acurado. | ||
| ||
Já falamos de como a fragmentação da informação na indústria AEC é o principal problema a ser resolvido na minha opinião e em projetos de Big Data isto não é muito diferente. | ||
Se a complexidade no desenvolvimento de soluções de tecnologia de projetos e construções tem um impacto direto na experiência do usuário, em projetos de Big Data a complexidade é fator que joga contra o entendimento do que é possível fazer e, principalmente, se isto tem valor ao olhos do sponsor do projeto. | ||
Por isso é sempre importante definir o conceito: | ||
O que é Big Data? | ||
conjuntos de dados extremamente grandes que podem ser analisados computacionalmente para revelar padrões, tendências e associações, especialmente em relação ao comportamento e interações humanas. | ||
Os projetos de Big Data em que trabalhei no passado tiveram três linhas de raciocinio: a primeira em relação ao time de vendas (busca por aumento de faturamento, vender mais), a segunda em relação aos dados de mercado (inteligência de negócio, insights) e a terceira nunca saiu do papel, mas o desenho foi realizado (analytics de projeto / construção, análise de risco). | ||
Em todos os casos a maior dificuldade foi dosar as expectativas das pessoas, pelo poder que esse tipo de conceito tem, manter os pés no chão é fundamental para o sucesso. | ||
expectativa é o maior mal da humanidade, é mãe de todas as frustrações | ||
Qual a razão disto? Simples, quando você começar a cruzar dados e operar ferramentas inteligentes que já te entregam os filtros que você quer prontos, a coisa mais comum que pode acontecer é as pessoas acharem que elas não tem que analisar nada do que esta sendo entregue e pular do precipício sem um paraquedas. | ||
A área de negócio só vai ter insights relevantes extraídas das ferramentas de Big Data quando houver um time capacitado para tirar esses insights e ajudar na construção da estratégia. | ||
Neste caso existe uma dor muito forte que é fazer esta galera trabalhar em conjunto pois a área de negócio possui algumas demandas específicas que o time de inteligência pode não ter todo o contexto para entregar as respostas. | ||
O sururu fica pior se essas pessoas forem de times diferentes com um papel de área demandante e área demandada, ai não tem tecnologia que resolva o problema social e de colaboração que esta divisão pode causar. | ||
O que fazer? Simples, coloque todo mundo para remar no mesmo barco e direção chamando isso de time, squad, meu bem ou o nome que achar mais bonito, mas essa galera tem que ter metas compartilhadas e trabalhar em conjunto em prol do sucesso do projeto e da organização. | ||
As entranhas das ferramentas (2/7) | ||
Falamos de ferramentas de Big Data, mas como elas operam? | ||
O conceito é simples, mas a operação é um inferno na terra e tenho muito respeito pelos vários cientistas de dados e arquitetos de solução destas empresas, o que essas pessoas fazem e possibilitam os clientes fazerem é uma das coisas que mais me empolgam quando falamos de tecnologia. | ||
Basicamente, o que as empresas de Big Data fazem é consultar fontes públicas de informação tais como Receita Federal, OAB, CREA,CAU, Juntas Comerciais, Registros de Prefeituras, IBGE, Ministérios e Secretarias de esferas municipais, estaduais e federais e cruzar tudo isto para entregar em uma interface simples tudo o que você poderia querer saber sobre um indivíduo ou empresa. | ||
Se você esta pensando no documentário o Dilema da Redes não é este o caminho que estou seguindo nesta edição desta Newsletter. Aliás, o documentário é muito fraco e tendencioso, tem coisa melhor para ver neste sentido. | ||
Não é sobre coleta dos seus dados utilizando uma ferramenta, é sobre coleta de dados públicos para fins de consulta, mas que algumas empresas coletam através de mais de 3000 robôs varrendo a internet, salvando isto em banco de dados na nuvem e utilizando o poder do cloud computing para conseguir ligar as coisas. | ||
O processo completo pode ser resumido pela imagem abaixo: | ||
| ||
Coleta: aqui já explicamos, é varrer a internet em busca de fontes públicas de informação. | ||
Tratamento: uma vez que você tem toneladas de dados em bancos de dados distintos é hora de correlacionar as coisas e criando chaves únicas, geralmente um CPF ou CNPJ, na construção civil pode-se utilizar ainda SKU de produto ou código de composição de custos unitários. | ||
Enriquecimento: geralmente vem de dados coletados de fontes particulares (lícitas) como banco de dados de empresas que contratam esses serviços (não compartilhados com outros clientes). | ||
Análise: existem modelos estatísticos em que é possível calcular score de crédito, faturamento, nível de atividade de uma empresa, risco de orçamento, desvio de planejamento, entre várias outras coisas. | ||
Insights / Ação: depois de transformar teras de dados em algo minimamente maleável a operação, é hora de pensar em como isto pode ajudar o seu negócio. | ||
Dados da indústria AEC (3/7) | ||
Na indústria AEC existem algumas fontes públicas de pesquisas e vários indíces que importantes centros de pesquisas acabam divulgando de tempos em tempos. | ||
O ponto que gostaria de trazer aqui é que o maior ensinamento desses projetos de Big Data é que as próprias empresas (a sua empresa) são as maiores fontes de dados de informação, é dentro delas que o calibramento através do enriquecimento de dados ocorre e fazer isto bem-feito já te coloca em uma posição de bater um pênalti sem goleiro. | ||
O que isto quer dizer? É que aquele mesmo processo de coleta de dados, tratamento, enriquecimento, análise e insights / ações pode existir internamente na sua empresa, basta saber aonde pesquisar e o quais dores você quer resolver. | ||
| ||
Algumas perguntas para serem feitas aqui em termos de reflexão: | ||
| ||
Entenda, podemos falar de indicadores globais ou individuais dos projetos e profissionais, mas a ideia central é a potencialização dos resultados através da organização, cruzamento e disponibilização de informações de maneira eficiente. | ||
Encontrar informações de projetos que já terminaram não deveria ser um martírio, se existe uma coisa que deveria ser muito organizada dentro das empresas de projeto e construção são as informações do que aconteceu. | ||
Um aprendizado desta história é que não adianta nada você coletar dados de tudo e qualquer fonte se você faz isto manualmente, repetitivamente, desorganizadamente. | ||
!@#$% entra e !@#$% sai (4/7) | ||
Desculpe o francês, mas merda entra, merda sai. | ||
A arte de coletar dados passa por uma padronização e conscientização por parte das pessoas de que aquilo que ela esta escrevendo possui um valor muito grande para as empresas. | ||
Quer um exemplo simples de como isso pode dificultar enormente as coisas quando não há nenhum senso de responsabilidade naquilo que é cadastrado nos sistemas da vida? | ||
Você sabe escrever por extenso o nome da Avenida JK se precisar cadastrar isso em um banco de dados que necessite ter o endereço de uma obra? | ||
| ||
E aí? Qual opção você acha que é a correta? Nenhuma, o correto é Juscelino Kubitschek. | ||
Pode parecer óbvio para algumas pessoas, mas o óbvio não existe. O simples cadastramento de um endereço pode ocasionar um pandemônio em termos de dados e impossibilitar, sem um grande saneamento dos dados, qualquer análise na sua empresa. | ||
É por este motivo que ter fontes de informações públicas padronizadas ajuda muito no ganho de eficiência das empresas. | ||
Aqui dei um exemplo simples de um endereço em um banco de dados, mas expanda isso para nome de clientes, fornecedores, materiais, arquivos, produtos, etc. | ||
O próprio regionalismo pode ser um problema, ai na sua cidade é batente ou alisar (ou outra coisa)? | ||
Claro que também precisamos tomar um cuidado absurdo ao comparar dados para uma tomada de decisão. Exemplo: é preciso fazer um serviço de fundações em um empreendimento e temos 3 empresas concorrendo. | ||
No histórico de contratações da construtora foi possível identificar que a empresa A tem o melhor desempenho histórico em relação as empresas B e C, sendo em média 20% mais rápida do que as suas concorrentes. | ||
O ponto é: estamos comparando banana com banana? A empresa A sempre atuou naquele campo de futebol e pasto de gado uruguaio, sem aclives ou declives. As empresas B e C atuam sempre nos barrancos da vida, é justo esta comparação? | ||
Tirando o fator complexidade das condições existentes do terreno da equação, estamos comparando banana com maçã. Nem sempre os dados que você tem em mãos contam toda a verdade sobre as coisas. | ||
O contexto em que as coisas ocorrem já é algo muito importante em outras indústria, na indústria AEC é para multiplicar isto por 1000. Uma vez que o time perde a confiança nos dados é praticamente impossível resgatar a credibilidade do projeto. | ||
Análise multicritério (5/7) | ||
A beleza de ter em mãos várias fontes de dados distintas para auxílio na tomada de decisão é a possibilidade de criar análises multicritérios. | ||
Se você já reservou um hotel para suas férias você já aplicou por diversas vezes análises multicritérios na sua vida sem perceber. O conceito é mais simples do que parece, mas isto só é possível pelo cruzamento de diversas informações e geração dos filtros corretos. | ||
| ||
Em arquitetura e engenharia o que seria a análise multicritério? | ||
Exemplo em edificações: um cliente internacional chega na cidade e precisa se estabelecer em um edifício que tenha o selo LEED e laje superior a X m², seja perto do metrô, tenha X vagas de garagem disponíveis, abrigue todos os colaboradores em um único prédio, disponibilidade de internet por fibra, segurança nos arredores e outros fatores que podem vir a ser importantes como serviços oferecidos na região. | ||
Exemplo em infraestrutura: considerando critérios de mercado, operacional, socioambiental, logístico e de engenharia qual seria o melhor traçado para uma nova ferrovia? Diversos desses dados são públicos com consultas possíveis para os profissionais que estão participando do EVTL. | ||
| ||
Essa capacidade de conseguir transformar um volume insano de dados em algo que traga embasamento para tomadas de decisão é fundamental para aumentar a maturidade das empresas em relação a tecnologia. | ||
Big Data não é sobre coletar um volume insano de dados e precisar de computadores e times de cientistas de dados da NASA para tirar o melhor resultado possível, podemos moldar o que queremos para que as coisas se adequem a nossa realidade. | ||
Eu diria que o simples fato de você pegar todos os endereços dos seus projetos / obras e colocar no Google Maps já vai te possibilitar ter vários insights. | ||
O mais comum é perceber que provavelmente você terá uma concentração de clientes em alguma área ou edifício da cidade, a partir daí se pergunte a razão disto estar acontecendo e se é possível replicar / escalar este fator de sucesso para outras regiões. | ||
Deveria ser obrigatório haver uma consulta prévia no banco de dados das empresas para conhecer o histórico do cliente, região, fornecedores, mercado e profissionais quando arquitetos e engenheiros começarem um novo projeto. | ||
Pode parecer uma conversa amadora, mas a coisa que mais acontece são as pessoas começarem do zero um projeto e realizar pesquisas / consultas que outras pessoas já realizaram, é gol contra atrás de gol contra. | ||
Ética nos dados (6/7) | ||
Claro que quando falamos de Big Data não podemos deixar de falar na questão ética da coleta, manejo e manutenção de dados. | ||
A indústria AEC é seguramente uma das mais amadoras quando falamos na questão de tratamento e armazenamento de dados, algumas empresas no segmento de incorporação, até por estarem mais expostas, já estão adequadas a Lei Geral de Proteção de Dados (famosa LGPD), mas no geral a grande maioria das empresas de projeto e construção não tem minimamente uma política de privacidade de dados instituída. | ||
Se uma entidade privada esta indo nesta linha o que dizer então de quem esta coletando esses dados e tornando-os público? Nosso querido governo e entidades de classe. | ||
A receita federal, por exemplo, disponibiliza arquivos públicos de todas as mais de 40 milhões de empresas do país: | ||
Os próprios conselhos de engenharia disponibilizam milhões de dados das ARTs para consulta pública. O conselho de arquitetura possui uma base de gigantesca e acabou de publicar o novo portal IGEO com dados das RRTs (menos invasivas que as ARTs). | ||
Quantas vezes você já não ouviu falar de vazamento de dados nas empresas de telefonia? Os correios vendem toda a base de dados de endereços: | ||
| ||
Mineirando dados de uma ART você consegue de forma até fácil saber que tipo de serviços as empresas costumam prestar e ter uma forma de avaliação de risco de fornecedor, meio que para pegar aquele cara que vai pegar um tipo de serviço pela primeira vez e esta falando que já executou milhões de metros quadrados no assunto. | ||
Enfim, são exemplos e mais exemplos que posso dar aqui de instituições públicas e privadas coletando nossos dados e disponibilizando para venda e/ou consulta. | ||
Na construção civil isso não é muito diferente. Acredito que a pergunta mais importante nesta questão não é se as empresas e instituições públicas podem ou não fazer isto e sim se é eticamente aceito fazer este tipo de coleta e tratamento de dados? | ||
Eu tendo a acreditar que deveria ao menos ter uma conscientização do que esta sendo coletado, como esta sendo armazenado e se eu aceito ou não ter meus dados disponíveis nessas plataformas, sejam elas públicas ou privadas, mas não é uma opinião final e definitiva. | ||
"Prefiro ser.. esta metamorfose ambulante.." a cada vez que leio algo sobre algum vazamento ou forma como as empresas gerenciam as coisas eu mudo o meu conceito sobre o assunto. | ||
Diria que esta parte da Newsletter é mais de conscientização, evite sair daqui batendo o martelo sobre o que é certo ou errado, principalmente neste mundo de Big Data nada é tão simples até porque a tecnologia esta evoluindo muito mais rápida do que nossa capacidade de parar e pensar se as coisas são benéficas ou não para a sociedade, existe uma grande chance de estarmos criando alguns monstros que vão nos engolir no futuro e outros que vão nos salvar. | ||
Prova disso é que não existe nenhum dado que seja a prova de pessoas, se esta sendo coletado e guardado, algum bípede possui acesso ao banco de dados de forma lícita (pode ser o trabalho do cara cuidar da disponibilidade, por exemplo). | ||
Quis custodiet ipsos custodes? (quem vigia os vigilantes?) | ||
Maturidade (7/7) | ||
É muito fácil cair em contradições neste assunto uma vez que podemos ter milhões de possiblidades em aberto através da coleta, tratamento, enriquecimento e análise de dados e fazer uma relação disso com a ética desta ações. | ||
A única certeza que eu tenho neste assunto é que não ter um time na sua empresa dedicado a este tema, se você possui estas condições obviamente, é um erro. | ||
"Em deus eu acredito, para todo o resto traga dados" | ||
Quem melhor souber trabalhar os seus próprios dados e encontrar as melhores respostas em relação as questões éticas neste assunto terá uma vantagem competitiva absurda em relação a concorrência. | ||
Cuidado também para não passar dos limites em relação a este tema, tudo é um equilibro, não adianta nada criar 50 indicadores e coletar fontes de 300 lugares diferentes se você vai precisar de um exército para gerenciar tudo isto e a área de negócio não sabe o que fazer com o que esta sendo entregue. | ||
Outro fator importante para ser levado em consideração e admiro o estoicismo por conta disso: o questionamento dos dados que estão sendo apresentados. | ||
Exemplo prático: No CRM da empresa, ao invés de cadastrar o endereço correto com base em uma consulta aos cadastros oficiais dos Correios, a pessoa tem preguiça e escreve qualquer coisa na hora de criar um novo cadastro de cliente só para acelerar o processo. | ||
(plot twist) você esta utilizando esta fonte de dados para suas análises e na hora de apresentar seus estudos a mesma pessoa que cadastrou o endereço errado no CRM argumenta que não dá para confiar nos dashboards porque os endereços estão errados. | ||
qualquer pessoa capaz de te irritar se torna o seu mestre | ||
Outro ponto nesta história é que não dá para refutar fatos com opiniões, muitas vezes o insight não agrada ao status quo que acredita estar fazendo um ótimo trabalho (só que não), nestes casos matar o mensageiro é mais fácil do que acreditar na mensagem. | ||
Por isto é importante desenvolver e/ou criar uma cultura de colaboração entre as áreas, com metas compartilhadas o jogo muda. | ||
Coisas da vida, espero que este artigo tenha lhe trazido reflexões e possibilidades importantes para sua trajetória profissional ou caminhos para sua empresa. | ||
Dado é tech, dado é pop, dado é tudo :) | ||
Obrigado, | ||
Abs. | ||
Tiago Ricotta | ||
Publicado em 5 de Maio de 2021 às 14:30 |