Big Data no mercado AEC
11
0

Big Data no mercado AEC

#0003: Ter uma tonelada de dados não significa muita coisa se você não souber o que fazer com eles, que caminhos podemos seguir quando falamos de dados em AEC?

Tiago Ricotta
15 min
11
0

#0003: Ter uma tonelada de dados não significa muita coisa se você não souber o que fazer com eles, que caminhos podemos seguir quando falamos de dados em AEC?

A Comoditização dos Dados (1/7)

Não é muito segredo que atualmente dados é uma das commodities mais valiosas do mundo, mas o caminho para transformar dados em informação não é tão simples quanto parece, o que vale é informação (só olhar o valor de mercado somado de FAANG), principalmente em um mercado em que o contexto é extremamente importante para ser acurado.

qual imagem vem na sua cabeça quando falamos de big data?
qual imagem vem na sua cabeça quando falamos de big data?

Já falamos de como a fragmentação da informação na indústria AEC é o principal problema a ser resolvido na minha opinião e em projetos de Big Data isto não é muito diferente.

Se a complexidade no desenvolvimento de soluções de tecnologia de projetos e construções tem um impacto direto na experiência do usuário, em projetos de Big Data a complexidade é fator que joga contra o entendimento do que é possível fazer e, principalmente, se isto tem valor ao olhos do sponsor do projeto.

Por isso é sempre importante definir o conceito:

O que é Big Data?

conjuntos de dados extremamente grandes que podem ser analisados ​​computacionalmente para revelar padrões, tendências e associações, especialmente em relação ao comportamento e interações humanas.

Os projetos de Big Data em que trabalhei no passado tiveram três linhas de raciocinio: a primeira em relação ao time de vendas (busca por aumento de faturamento, vender mais), a segunda em relação aos dados de mercado (inteligência de negócio, insights) e a terceira nunca saiu do papel, mas o desenho foi realizado (analytics de projeto / construção, análise de risco).

Em todos os casos a maior dificuldade foi dosar as expectativas das pessoas, pelo poder que esse tipo de conceito tem, manter os pés no chão é fundamental para o sucesso.

expectativa é o maior mal da humanidade, é  mãe de todas as frustrações

Qual a razão disto? Simples, quando você começar a cruzar dados e operar ferramentas inteligentes que já te entregam os filtros que você quer prontos, a coisa mais comum que pode acontecer é as pessoas acharem que elas não tem que analisar nada do que esta sendo entregue e pular do precipício sem um paraquedas.

A área de negócio só vai ter insights relevantes extraídas das ferramentas de Big Data quando houver um time capacitado para tirar esses insights e ajudar na construção da estratégia.

Neste caso existe uma dor muito forte que é fazer esta galera trabalhar em conjunto pois a área de negócio possui algumas demandas específicas que o time de inteligência pode não ter todo o contexto para entregar as respostas.

O sururu fica pior se essas pessoas forem de times diferentes com um papel de área demandante e área demandada, ai não tem tecnologia que resolva o problema social e de colaboração que esta divisão pode causar.

O que fazer? Simples, coloque todo mundo para remar no mesmo barco e direção chamando isso de time, squad, meu bem ou o nome que achar mais bonito, mas essa galera tem que ter metas compartilhadas e trabalhar em conjunto em prol do sucesso do projeto e da organização.

As entranhas das ferramentas (2/7)

Falamos de ferramentas de Big Data, mas como elas operam?

O conceito é simples, mas a operação é um inferno na terra e tenho muito respeito pelos vários cientistas de dados e arquitetos de solução destas empresas, o que essas pessoas fazem e possibilitam os clientes fazerem é uma das coisas que mais me empolgam quando falamos de tecnologia.

Basicamente, o que as empresas de Big Data fazem é consultar fontes públicas de informação tais como Receita Federal, OAB, CREA,CAU, Juntas Comerciais, Registros de Prefeituras, IBGE, Ministérios e Secretarias de esferas municipais, estaduais e federais e cruzar tudo isto para entregar em uma interface simples tudo o que você poderia querer saber sobre um indivíduo ou empresa.

Se você esta pensando no documentário o Dilema da Redes não é este o caminho que estou seguindo nesta edição desta Newsletter. Aliás, o documentário é muito fraco e tendencioso, tem coisa melhor para ver neste sentido.

Não é sobre coleta dos seus dados utilizando uma ferramenta, é sobre coleta de dados públicos para fins de consulta, mas que algumas empresas coletam através de mais de 3000 robôs varrendo a internet, salvando isto em banco de dados na nuvem e utilizando o poder do cloud computing para conseguir ligar as coisas.

O processo completo pode ser resumido pela imagem abaixo:

Simplificando muito, o processo é esse.
Simplificando muito, o processo é esse.

Coleta: aqui já explicamos, é varrer a internet em busca de fontes públicas de informação.

Tratamento: uma vez que você tem toneladas de dados em bancos de dados distintos é hora de correlacionar as coisas e criando chaves únicas, geralmente um CPF ou CNPJ, na construção civil pode-se utilizar ainda SKU de produto ou código de composição de custos unitários.

Enriquecimento: geralmente vem de dados coletados de fontes particulares (lícitas) como banco de dados de empresas que contratam esses serviços (não compartilhados com outros clientes).

Análise: existem modelos estatísticos em que é possível calcular score de crédito, faturamento, nível de atividade de uma empresa, risco de orçamento, desvio de planejamento, entre várias outras coisas.

Insights / Ação: depois de transformar teras de dados em algo minimamente maleável a operação, é hora de pensar em como isto pode ajudar o seu negócio.

Dados da indústria AEC (3/7)

Na indústria AEC existem algumas fontes públicas de pesquisas e vários indíces que importantes centros de pesquisas acabam divulgando de tempos em tempos.

O ponto que gostaria de trazer aqui é que o maior ensinamento desses projetos de Big Data é que as próprias empresas (a sua empresa) são as maiores fontes de dados de informação, é dentro delas que o calibramento através do enriquecimento de dados ocorre e fazer isto bem-feito já te coloca em uma posição de bater um pênalti sem goleiro.

O que isto quer dizer? É que aquele mesmo processo de coleta de dados, tratamento, enriquecimento, análise e insights / ações pode existir internamente na sua empresa, basta saber aonde pesquisar e o quais dores você quer resolver.

Exemplo de cruzamento de dados em AEC, ache o erro!
Exemplo de cruzamento de dados em AEC, ache o erro!

Algumas perguntas para serem feitas aqui em termos de reflexão:

  • Você consegue ter uma visão de portfólio na sua empresa?
  • Você consegue ter uma visão de cada projeto?
  • Quanto tempo você gasta para encontrar uma informação consolidada do portfólio e/ou projeto?
  • Qual o risco que a sua empresa consegue absorver com base no histórico de execução?

Entenda, podemos falar de indicadores globais ou individuais dos projetos e profissionais, mas a ideia central é a potencialização dos resultados através da organização, cruzamento e disponibilização de informações de maneira eficiente.

Encontrar informações de projetos que já terminaram não deveria ser um martírio, se existe uma coisa que deveria ser muito organizada dentro das empresas de projeto e construção são as informações do que aconteceu.

Um aprendizado desta história é que não adianta nada você coletar dados de tudo e qualquer fonte se você faz isto manualmente, repetitivamente, desorganizadamente.

!@#$% entra e !@#$% sai (4/7)

Desculpe o francês, mas merda entra, merda sai.

A arte de coletar dados passa por uma padronização e conscientização por parte das pessoas de que aquilo que ela esta escrevendo possui um valor muito grande para as empresas.

Quer um exemplo simples de como isso pode dificultar enormente as coisas quando não há nenhum senso de responsabilidade naquilo que é cadastrado nos sistemas da vida?

Você sabe escrever por extenso o nome da Avenida JK se precisar cadastrar isso em um banco de dados que necessite ter o endereço de uma obra?

  • 1. Jucelino Kubitchek 
  • 2.Juscelino Kubischek 
  • 3. Jusselino Kubitshek 
  • 4. Juscelino Kubitchek 
  • 5. Juscelino Kubitshek

E aí? Qual opção você acha que é a correta? Nenhuma, o correto é Juscelino Kubitschek.

Pode parecer óbvio para algumas pessoas, mas o óbvio não existe. O simples cadastramento de um endereço pode ocasionar um pandemônio em termos de dados e impossibilitar, sem um grande saneamento dos dados, qualquer análise na sua empresa.

É por este motivo que ter fontes de informações públicas padronizadas ajuda muito no ganho de eficiência das empresas.

Aqui dei um exemplo simples de um endereço em um banco de dados, mas expanda isso para nome de clientes,  fornecedores, materiais, arquivos, produtos, etc.

O próprio regionalismo pode ser um problema, ai na sua cidade é batente ou alisar (ou outra coisa)?

Claro que também precisamos tomar um cuidado absurdo ao comparar dados para uma tomada de decisão. Exemplo: é preciso fazer um serviço de fundações em um empreendimento e temos 3 empresas concorrendo.

No histórico de contratações da construtora foi possível identificar que a empresa A tem o melhor desempenho histórico em relação as empresas B e C, sendo em média 20% mais rápida do que as suas concorrentes.

O ponto é: estamos comparando banana com banana? A empresa A sempre atuou naquele campo de futebol e pasto de gado uruguaio, sem aclives ou declives. As empresas B e C atuam sempre nos barrancos da vida, é justo esta comparação?

Tirando o fator complexidade das condições existentes do terreno da equação, estamos comparando banana com maçã. Nem sempre os dados que você tem em mãos contam toda a verdade sobre as coisas.

O contexto em que as coisas ocorrem já é algo muito importante em outras indústria, na indústria AEC é para multiplicar isto por 1000. Uma vez que o time perde a confiança nos dados é praticamente impossível resgatar a credibilidade do projeto.

Análise multicritério (5/7)

A beleza de ter em mãos várias fontes de dados distintas para auxílio na tomada de decisão é a possibilidade de criar análises multicritérios.

Se você já reservou um hotel para suas férias você já aplicou por diversas vezes análises multicritérios na sua vida sem perceber. O conceito é mais simples do que parece, mas isto só é possível pelo cruzamento de diversas informações e geração dos filtros corretos.

Escolhendo o melhor local para ficar em Sampa
Escolhendo o melhor local para ficar em Sampa

Em arquitetura e engenharia o que seria a análise multicritério?

Exemplo em edificações: um cliente internacional chega na cidade e precisa se estabelecer em um edifício que tenha o selo LEED e laje superior a X m², seja perto do metrô, tenha X vagas de garagem disponíveis, abrigue todos os colaboradores em um único prédio, disponibilidade de internet por fibra, segurança nos arredores e outros fatores que podem vir a ser importantes como serviços oferecidos na região.

Exemplo em infraestrutura: considerando critérios de mercado, operacional, socioambiental, logístico e de engenharia qual seria o melhor traçado para uma nova ferrovia? Diversos desses dados são públicos com consultas possíveis para os profissionais que estão participando do EVTL.

Fonte: Geração do corredor multicriterial de menor custo - VALEC
Fonte: Geração do corredor multicriterial de menor custo - VALEC

Essa capacidade de conseguir transformar um volume insano de dados em algo que traga embasamento para tomadas de decisão é fundamental para aumentar a maturidade das empresas em relação a tecnologia.

Big Data não é sobre coletar um volume insano de dados e precisar de computadores e times de cientistas de dados da NASA para tirar o melhor resultado possível, podemos moldar o que queremos para que as coisas se adequem a nossa realidade.

Eu diria que o simples fato de você pegar todos os endereços dos seus projetos / obras e colocar no Google Maps já vai te possibilitar ter vários insights.

O mais comum é perceber que provavelmente você terá uma concentração de clientes em alguma área ou edifício da cidade, a partir daí se pergunte a razão disto estar acontecendo e se é possível replicar / escalar este fator de sucesso para outras regiões.

Deveria ser obrigatório haver uma consulta prévia no banco de dados das empresas para conhecer o histórico do cliente, região, fornecedores, mercado e profissionais quando arquitetos e engenheiros começarem um novo projeto.

Pode parecer uma conversa amadora, mas a coisa que mais acontece são as pessoas começarem do zero um projeto e realizar pesquisas / consultas que outras pessoas já realizaram, é gol contra atrás de gol contra.

Ética nos dados (6/7)

Claro que quando falamos de Big Data não podemos deixar de falar na questão ética da coleta, manejo e manutenção de dados.

A indústria AEC é seguramente uma das mais amadoras quando falamos na questão de tratamento e armazenamento de dados, algumas empresas no segmento de incorporação, até por estarem mais expostas, já estão adequadas a Lei Geral de Proteção de Dados (famosa LGPD), mas no geral a grande maioria das empresas de projeto e construção não tem minimamente uma política de privacidade de dados instituída.

Se uma entidade privada esta indo nesta linha o que dizer então de quem esta coletando esses dados e tornando-os público? Nosso querido governo e entidades de classe.

A receita federal, por exemplo, disponibiliza arquivos públicos de todas as mais de 40 milhões de empresas do país:

Os próprios conselhos de engenharia disponibilizam milhões de dados das ARTs para consulta pública. O conselho de arquitetura possui uma base de gigantesca e acabou de publicar o novo portal IGEO com dados das RRTs (menos invasivas que as ARTs).

Quantas vezes você já não ouviu falar de vazamento de dados nas empresas de telefonia? Os correios vendem toda a base de dados de endereços:

Fonte: CorreiosNet
Fonte: CorreiosNet

Mineirando dados de uma ART você consegue de forma até fácil saber que tipo de serviços as empresas costumam prestar e ter uma forma de avaliação de risco de fornecedor, meio que para pegar aquele cara que vai pegar um tipo de serviço pela primeira vez e esta falando que já executou milhões de metros quadrados no assunto.

Enfim, são exemplos e mais exemplos que posso dar aqui de instituições públicas e privadas coletando nossos dados e disponibilizando para venda e/ou consulta.

Na construção civil isso não é muito diferente. Acredito que a pergunta mais importante nesta questão não é se as empresas e instituições públicas podem ou não fazer isto e sim se é eticamente aceito fazer este tipo de coleta e tratamento de dados?

Eu tendo a acreditar que deveria ao menos ter uma conscientização do que esta sendo coletado, como esta sendo armazenado e se eu aceito ou não ter meus dados disponíveis nessas plataformas, sejam elas públicas ou privadas, mas não é uma opinião final e definitiva.

"Prefiro ser.. esta metamorfose ambulante.." a cada vez que leio algo sobre algum vazamento ou forma como as empresas gerenciam as coisas eu mudo o meu conceito sobre o assunto.

Diria que esta parte da Newsletter é mais de conscientização, evite sair daqui batendo o martelo sobre o que é certo ou errado, principalmente neste mundo de Big Data nada é tão simples até porque a tecnologia esta evoluindo muito mais rápida do que nossa capacidade de parar e pensar se as coisas são benéficas ou não para a sociedade, existe uma grande chance de estarmos criando alguns monstros que vão nos engolir no futuro e outros que vão nos salvar.

Prova disso é que não existe nenhum dado que seja a prova de pessoas, se esta sendo coletado e guardado, algum bípede possui acesso ao banco de dados de forma lícita (pode ser o trabalho do cara cuidar da disponibilidade, por exemplo).

Quis custodiet ipsos custodes? (quem vigia os vigilantes?)

Maturidade (7/7)

É muito fácil cair em contradições neste assunto uma vez que podemos ter milhões de possiblidades em aberto através da coleta, tratamento, enriquecimento e análise de dados e fazer uma relação disso com a ética desta ações.

A única certeza que eu tenho neste assunto é que não ter um time na sua empresa dedicado a este tema, se você possui estas condições obviamente, é um erro.

"Em deus eu acredito, para todo o resto traga dados"

Quem melhor souber trabalhar os seus próprios dados e encontrar as melhores respostas em relação as questões éticas neste assunto terá uma vantagem competitiva absurda em relação a concorrência.

Cuidado também para não passar dos limites em relação a este tema, tudo é um equilibro, não adianta nada criar 50 indicadores e coletar fontes de 300 lugares diferentes se você vai precisar de um exército para gerenciar tudo isto e a área de negócio não sabe o que fazer com o que esta sendo entregue.

Outro fator importante para ser levado em consideração e admiro o estoicismo por conta disso: o questionamento dos dados que estão sendo apresentados.

Exemplo prático: No CRM da empresa, ao invés de cadastrar o endereço correto com base em uma consulta aos cadastros oficiais dos Correios, a pessoa tem preguiça e escreve qualquer coisa na hora de criar um novo cadastro de cliente só para acelerar o processo.

(plot twist) você esta utilizando esta fonte de dados para suas análises e na hora de apresentar seus estudos a mesma pessoa que cadastrou o endereço errado no CRM argumenta que não dá para confiar nos dashboards porque os endereços estão errados.

qualquer pessoa capaz de te irritar se torna o seu mestre

Outro ponto nesta história é que não dá para refutar fatos com opiniões, muitas vezes o insight não agrada ao status quo que acredita estar fazendo um ótimo trabalho (só que não), nestes casos matar o mensageiro é mais fácil do que acreditar na mensagem.

Por isto é importante desenvolver e/ou criar uma cultura de colaboração entre as áreas, com metas compartilhadas o jogo muda.

Coisas da vida, espero que este artigo tenha lhe trazido reflexões e possibilidades importantes para sua trajetória profissional ou caminhos para sua empresa.

Dado é tech, dado é pop, dado é tudo :)

Obrigado,

Abs.

Tiago Ricotta

Publicado em 5 de Maio de 2021 às 14:30