{"id":39905,"date":"2019-11-01T13:49:21","date_gmt":"2019-11-01T13:49:21","guid":{"rendered":"https:\/\/rockcontent.com\/br\/blog\/qualidade-de-dados\/"},"modified":"2019-11-01T13:49:21","modified_gmt":"2019-11-01T13:49:21","slug":"qualidade-de-dados","status":"publish","type":"post","link":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/","title":{"rendered":"A qualidade de dados na era da intelig\u00eancia artificial"},"content":{"rendered":"\n<h2 class=\"wp-block-heading\">Projetos com uso intensivo de dados t\u00eam uma \u00fanica falha: a qualidade dos dados<\/h2>\n\n\n\n<p>Como diretor de sistemas de suporte \u00e0 decis\u00e3o de dados, entreguei mais de 80 projetos com uso intensivo de dados em v\u00e1rios setores de grandes corpora\u00e7\u00f5es. Isso inclui <strong>armazenamento de dados, integra\u00e7\u00e3o, intelig\u00eancia de neg\u00f3cios, desempenho de conte\u00fado<\/strong> e <strong>modelos preditivos<\/strong>. Na maioria dos casos, a qualidade dos dados provou ser um fator cr\u00edtico para o sucesso do projeto.<\/p>\n\n\n\n<p>O desafio \u201c\u00f3bvio\u201d em todos os casos era consultar efetivamente fontes heterog\u00eaneas e <strong>extrair<\/strong> e <strong>transformar<\/strong> os dados em um ou mais <strong>modelos de dados<\/strong>.<\/p>\n\n\n\n<p>O desafio \u201cn\u00e3o \u00f3bvio\u201d foi a <strong>identifica\u00e7\u00e3o precoce<\/strong> de problemas, que \u2014 na maioria dos casos \u2014 eram desconhecidos tamb\u00e9m pelos propriet\u00e1rios das informa\u00e7\u00f5es.<\/p>\n\n\n\n<p>Iniciamos estrategicamente todos os projetos com uma fase de avalia\u00e7\u00e3o da qualidade dos dados \u2014 que, em muitos casos, leva \u00e0 modifica\u00e7\u00f5es no escopo do projeto e at\u00e9 \u00e0 iniciativas e projetos adicionais de limpeza dessas informa\u00e7\u00f5es.<\/p>\n\n\n[rock-convert-pdf id=&#8221;4867&#8243;]\n\n\n\n<h2 class=\"wp-block-heading\">Definindo a qualidade dos dados&nbsp;<\/h2>\n\n\n\n<p>Existem muitos aspectos na qualidade dos dados, incluindo <strong>consist\u00eancia<\/strong>, <strong>integridade<\/strong>, <strong>precis\u00e3o <\/strong>e<strong> conformidade<\/strong>. De acordo com a <a rel=\"noreferrer noopener\" href=\"https:\/\/en.wikipedia.org\/wiki\/Data_quality\" target=\"_blank\">Wikipedia<\/a>, os dados geralmente s\u00e3o considerados de alta qualidade se \u201cforem adequados para [seus] usos pretendidos nas opera\u00e7\u00f5es, o processo decis\u00f3rio e o planejamento. Al\u00e9m disso, s\u00e3o considerados de alta qualidade se apresentarem corretamente a constru\u00e7\u00e3o do mundo real a que se referem\u201d.<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\"><p>Defino a qualidade como o n\u00edvel de conformidade de um conjunto de dados em normalidade contextual.<\/p><\/blockquote>\n\n\n\n<p>Essa <strong>normalidade<\/strong> \u00e9 estabelecida por regras definidas pelo usu\u00e1rio e\/ou derivadas estatisticamente. \u00c9 contextual, no sentido de que as regras refletem a l\u00f3gica de determinados processos de neg\u00f3cios, conhecimento corporativo, condi\u00e7\u00f5es ambientais, sociais, etc. Por exemplo, uma propriedade da mesma entidade pode ter regras de valida\u00e7\u00e3o diferentes em diferentes empresas, mercados, idiomas ou moedas.<\/p>\n\n\n\n<p>Os sistemas modernos precisam conhecer a qualidade dos dados. Eles devem identificar instantaneamente poss\u00edveis problemas e <strong>evitar a exposi\u00e7\u00e3o<\/strong> de dados sujos, imprecisos ou incompletos aos componentes de produ\u00e7\u00e3o\/clientes conectados.<\/p>\n\n\n\n<p>Isso implica que, mesmo se houver uma situa\u00e7\u00e3o repentina e problem\u00e1tica que resulte na capta\u00e7\u00e3o de dados de baixa qualidade, o sistema poder\u00e1 lidar com esse problema e <strong>notificar prontamente<\/strong> os usu\u00e1rios certos.<\/p>\n\n\n\n<p>Dependendo de qu\u00e3o cr\u00edticos sejam os problemas, ele tamb\u00e9m pode <strong>negar a veicula\u00e7\u00e3o de dados<\/strong> para seus clientes \u2014 ou veicular enquanto alerta e sinaliza os poss\u00edveis problemas.<\/p>\n\n\n\n<table class=\"wp-block-table\"><tbody><tr><td><strong><em>Leia tamb\u00e9m<br><br><\/em><\/strong><a href=\"https:\/\/rockcontent.com\/mit-frontiers-1\/\"><strong><em>Androides sonham? \u2013 Frontiers #1, evento da MIT Sloan Review Brasil, discute Intelig\u00eancia Artificial<\/em><\/strong><\/a><\/td><\/tr><\/tbody><\/table>\n\n\n\n<h2 class=\"wp-block-heading\">A import\u00e2ncia da qualidade dos dados<\/h2>\n\n\n\n<p>A qualidade dos dados \u00e9 de <strong>import\u00e2ncia cr\u00edtica<\/strong>, especialmente na era das decis\u00f5es automatizadas, da IA e da otimiza\u00e7\u00e3o cont\u00ednua do processo. As <a rel=\"noreferrer noopener\" href=\"https:\/\/medium.freecodecamp.org\/the-data-driven-corporation-259b5b84f9c9\" target=\"_blank\">empresas precisam ser data driven<\/a> e a qualidade dos dados \u00e9 uma condi\u00e7\u00e3o essencial para alcan\u00e7ar isso.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Confus\u00e3o, confian\u00e7a limitada, m\u00e1s decis\u00f5es<\/h3>\n\n\n\n<p>Na maioria dos casos, os problemas de qualidade dos dados explicam a confian\u00e7a limitada nesses ativos pelos usu\u00e1rios corporativos, desperd\u00edcio de recursos ou mesmo <strong>decis\u00f5es ruins<\/strong>.<\/p>\n\n\n\n<p>Considere uma equipe de analistas tentando descobrir se um erro externo \u00e9 uma descoberta cr\u00edtica de neg\u00f3cios ou um problema de dados desconhecido ou mal tratado. Pior ainda, considere decis\u00f5es em tempo real sendo tomadas por um sistema incapaz de identificar e manipular dados ruins que acidentalmente \u2014 ou mesmo intencionalmente \u2014 foram alimentados no processo.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Falhas devido \u00e0 baixa qualidade dos dados<\/h3>\n\n\n\n<p>Vi grandes iniciativas de intelig\u00eancia de neg\u00f3cios, gest\u00e3o de dados e outras alternativas falhando devido ao <strong>baixo envolvimento<\/strong> dos principais usu\u00e1rios e partes interessadas. Na maioria dos casos, o envolvimento limitado foi o resultado direto da <strong>falta de confian\u00e7a<\/strong>. Os usu\u00e1rios precisam confiar nos dados. Caso contr\u00e1rio, abandonar\u00e3o gradualmente o sistema, afetando seus principais KPIs e crit\u00e9rios de sucesso.<\/p>\n\n\n\n<p>Sempre que achar que realizou uma grande descoberta, verifique primeiro se existem problemas de qualidade!<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Tipos e sintomas<\/h3>\n\n\n\n<p>Os problemas de qualidade de dados podem assumir v\u00e1rias formas, por exemplo:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>propriedades particulares em um objeto espec\u00edfico t\u00eam valores inv\u00e1lidos ou ausentes;<\/li><li>um valor que vem em um formato inesperado ou corrompido;<\/li><li>inst\u00e2ncias duplicadas;<\/li><li>refer\u00eancias inconsistentes ou unidade de medidas;<\/li><li>casos incompletos;<\/li><li>URLs quebrados;<\/li><li>dados bin\u00e1rios corrompidos;<\/li><li>pacotes de dados ausentes;<\/li><li>lacunas nos feeds;<\/li><li>propriedades incorretamente mapeadas.<\/li><\/ul>\n\n\n\n<h3 class=\"wp-block-heading\">A causa raiz<\/h3>\n\n\n\n<p>Os problemas de qualidade dos dados geralmente s\u00e3o o resultado de:<\/p>\n\n\n\n<ul class=\"wp-block-list\"><li>implementa\u00e7\u00f5es ruins de software: erros ou manuseio inadequado de casos particulares<\/li><li>problemas no n\u00edvel do sistema: falhas em certos processos<\/li><li>altera\u00e7\u00f5es nos formatos de dados, impactando os armazenamentos de dados de origem e de destino<\/li><\/ul>\n\n\n\n<p>Os sistemas modernos devem ser projetados assumindo que em algum momento haver\u00e1 feeds de dados problem\u00e1ticos e problemas inesperados de qualidade.<\/p>\n\n\n\n<p>A validade das propriedades dos dados pode ser avaliada em rela\u00e7\u00e3o a [a] regras conhecidas e predefinidas e [b] regras e padr\u00f5es derivados dinamicamente, com base no processamento estat\u00edstico.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Uma estrat\u00e9gia para a qualidade dos dados<\/h2>\n\n\n\n<p>Um projeto moderno de uso intensivo de dados geralmente envolve fluxos de dados, processos ETL (Extract, Transform, Load ou Extrar, Transformar e Carregar) complexos, l\u00f3gica de p\u00f3s-processamento e uma variedade de componentes anal\u00edticos ou cognitivos.<\/p>\n\n\n\n<p>A principal entrega em tais cen\u00e1rios \u00e9 um pipeline de processamento de dados de alto desempenho, alimentando e mantendo pelo menos um reposit\u00f3rio. Isso define um &#8220;ambiente de dados&#8221;, que capacita modelos anal\u00edticos avan\u00e7ados, tomadas de decis\u00f5es em tempo real, extra\u00e7\u00e3o de conhecimento e possivelmente aplicativos de IA. A seguir, \u00e9 apresentada uma estrat\u00e9gia para garantir a qualidade dos dados ao longo desse processo.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Identifique, entenda e documente as fontes de dados<\/h3>\n\n\n\n<p>Voc\u00ea precisa identificar suas fontes de dados e, para cada uma, documentar brevemente o seguinte:<\/p>\n\n\n\n<p>1. <strong>Tipo de dados contidos<\/strong> \u2014 por exemplo, registros de clientes, tr\u00e1fego da Web, documentos do usu\u00e1rio, atividade de um dispositivo conectado (em um contexto de IoT).<\/p>\n\n\n\n<p>2. <strong>Tipo de armazenamento<\/strong> \u2014 por exemplo, \u00e9 um arquivo simples, um banco de dados relacional, um armazenamento de documentos ou um fluxo de eventos?<\/p>\n\n\n\n<p>3. <strong>Prazos <\/strong>\u2014 por quanto tempo temos os dados?<\/p>\n\n\n\n<p>4. <strong>Frequ\u00eancia e tipos de atualiza\u00e7\u00f5es<\/strong> \u2014 voc\u00ea est\u00e1 recebendo deltas, eventos, atualiza\u00e7\u00f5es, dados agregados? Tudo isso pode impactar significativamente o design do pipeline e a capacidade de identificar e lidar com problemas de qualidade.<\/p>\n\n\n\n<p>5. <strong>A fonte e os sistemas envolvidos<\/strong> \u2014 os dados s\u00e3o provenientes de outro sistema? \u00c9 um feed cont\u00ednuo de eventos ou um processo em lote extra\u00eddo de outro sistema integrado? H\u00e1 entrada e valida\u00e7\u00e3o manual de dados envolvidos?<\/p>\n\n\n\n<p>6. <strong>Problemas de dados <\/strong>e limita\u00e7\u00f5es conhecidas podem ajudar a acelerar a fase inicial do exame de dados \u2014 se fornecida antecipadamente.<\/p>\n\n\n\n<p>7. <strong>Os modelos de dados envolvidos<\/strong> na fonte espec\u00edfica \u2014 por exemplo, um modelo de ER que representa clientes, uma estrutura de arquivo simples, um objeto, um esquema em estrela.<\/p>\n\n\n\n<p>8. <strong>Partes interessadas envolvidas<\/strong> \u2014 isso \u00e9 muito importante para interpretar quest\u00f5es e casos extremos e tamb\u00e9m para validar o estado geral dos dados, com aqueles que t\u00eam um entendimento mais profundo dos dados, dos neg\u00f3cios e dos processos relacionados.<\/p>\n\n\n\n<table class=\"wp-block-table\"><tbody><tr><td><strong><em>Leia tamb\u00e9m<br><br><\/em><\/strong><a href=\"https:\/\/rockcontent.com\/dados-da-disney\/\"><strong><em>Sem m\u00e1gicas: descubra como funciona a estrat\u00e9gia de dados da Disney<\/em><\/strong><\/a><\/td><\/tr><\/tbody><\/table>\n\n\n\n<h3 class=\"wp-block-heading\">Comece com a cria\u00e7\u00e3o de perfil de dados<\/h3>\n\n\n\n<p>A <a rel=\"noreferrer noopener\" href=\"https:\/\/en.wikipedia.org\/wiki\/Data_profiling\" target=\"_blank\">cria\u00e7\u00e3o de perfil de dados<\/a> \u00e9 o processo de descri\u00e7\u00e3o, executando uma an\u00e1lise estat\u00edstica descritiva b\u00e1sica e um resumo. A <strong>chave <\/strong>\u00e9 documentar brevemente as descobertas, criando assim uma linha de base \u2014 um ponto de refer\u00eancia a ser usado para valida\u00e7\u00e3o de dados ao longo do processo.<\/p>\n\n\n\n<p>A cria\u00e7\u00e3o de um perfil depende do tipo dos dados subjacentes e do contexto comercial, mas em um cen\u00e1rio geral, voc\u00ea deve considerar o seguinte:<\/p>\n\n\n\n<ol class=\"wp-block-list\"><li>Identifique as principais <strong>entidades<\/strong>, como cliente, usu\u00e1rio, produto, os <strong>eventos <\/strong>envolvidos, como registro, login, compra, <strong>prazo<\/strong>, <strong>geografia <\/strong>e outras dimens\u00f5es importantes dos seus dados.<\/li><li>Selecione o <strong>per\u00edodo de tempo t\u00edpico<\/strong> a ser usado para sua an\u00e1lise. Pode ser um dia, semana, m\u00eas e assim por diante, dependendo dos neg\u00f3cios.<\/li><li>Analise <strong>tend\u00eancias <\/strong>de alto n\u00edvel envolvendo as entidades e eventos identificados. Gere s\u00e9ries temporais com rela\u00e7\u00e3o aos principais eventos e \u00e0s principais entidades. Identifique tend\u00eancias, sazonalidade, picos e tente interpret\u00e1-los no contexto de uma empresa em particular. Consulte o propriet\u00e1rio dos dados e capture \/ documente essas &#8220;hist\u00f3rias de dados&#8221;.<\/li><li><strong>Analise <\/strong>os dados. Para cada uma das propriedades de suas principais entidades, fa\u00e7a um resumo estat\u00edstico para capturar a <strong>forma <\/strong>dos dados. Para valores num\u00e9ricos, voc\u00ea pode come\u00e7ar com o b\u00e1sico \u2014 m\u00ednimo, m\u00e9dio, m\u00e1ximo, desvio padr\u00e3o, quartis \u2014 e, em seguida, visualizar a distribui\u00e7\u00e3o dos dados. Feito isso, examine a forma da distribui\u00e7\u00e3o e descubra se faz sentido para os neg\u00f3cios. Para valores categ\u00f3ricos, voc\u00ea pode resumir o n\u00famero distinto de valores por frequ\u00eancia e, por exemplo, documentar os principais valores x que explicam z% dos casos.<\/li><li>Reveja alguns <strong>pontos fora da curva<\/strong>. Pela distribui\u00e7\u00e3o dos valores de uma propriedade espec\u00edfica \u2014 digamos, a idade do cliente \u2014 tente descobrir valores &#8220;suspeitos&#8221; no contexto de uma empresa em particular. Selecione alguns deles e recupere as inst\u00e2ncias reais das entidades. Em seguida, revise seu perfil e atividade \u2014 dos usu\u00e1rios espec\u00edficos, neste exemplo \u2014 e tente interpretar os valores suspeitos. Consulte o propriet\u00e1rio dos dados para obter orienta\u00e7\u00e3o sobre essas descobertas.<\/li><li><strong>Documente <\/strong>seus resultados. Crie um documento ou relat\u00f3rio compacto com uma estrutura clara para atuar como sua linha de base e refer\u00eancia de dados. Voc\u00ea deve anexar as descobertas de cada uma das fontes de dados a esse documento \u00fanico \u2014 com a mesma estrutura, refer\u00eancias de tempo e metadados para garantir uma interpreta\u00e7\u00e3o mais f\u00e1cil.<\/li><li><strong>Revise<\/strong>, <strong>interprete<\/strong>, <strong>valide<\/strong>. Essa \u00e9 a fase em que voc\u00ea precisa da entrada do propriet\u00e1rio dos dados para fornecer uma interpreta\u00e7\u00e3o geral dos dados e explicar casos extremos, outliers ou outros padr\u00f5es inesperados. O resultado do processo pode ser confirmar o estado dos dados, explicar problemas conhecidos e registrar novos. \u00c9 aqui que poss\u00edveis solu\u00e7\u00f5es para problemas conhecidos de dados podem ser discutidas e \/ ou decididas. Al\u00e9m disso, as regras de valida\u00e7\u00e3o podem ser documentadas.<\/li><\/ol>\n\n\n\n<p>Em um <strong>cen\u00e1rio ideal<\/strong>, o processo de cria\u00e7\u00e3o de perfil de dados deve ser automatizado. Existem v\u00e1rias ferramentas que permitem a cria\u00e7\u00e3o r\u00e1pida de perfis, conectando sua fonte de dados e passando por uma configura\u00e7\u00e3o r\u00e1pida.<\/p>\n\n\n\n<p>A sa\u00edda do processo em tais cen\u00e1rios \u00e9 geralmente um relat\u00f3rio interativo, permitindo f\u00e1cil an\u00e1lise dos dados e compartilhamento do conhecimento com a equipe.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Estabele\u00e7a um reposit\u00f3rio de refer\u00eancia de qualidade de dados<\/h3>\n\n\n\n<p>Os objetivos do armazenamento de refer\u00eancia de qualidade de dados (DQR) s\u00e3o capturar e manter regras de <strong>metadados <\/strong>e <strong>validade <\/strong>sobre seus dados e disponibiliz\u00e1-los para processos externos.<\/p>\n\n\n\n<p>Esse poderia ser um sistema altamente sofisticado para derivar automaticamente regras sobre a validade de seus dados e avaliar continuamente os (lotes de) casos recebidos, com a capacidade de identificar padr\u00f5es relacionados a tempo e outros sobre seus dados. Esse poderia ser um conjunto de regras mantido manualmente, que permite a r\u00e1pida valida\u00e7\u00e3o dos dados recebidos, e essa poderia ser uma configura\u00e7\u00e3o h\u00edbrida.<\/p>\n\n\n\n<p>De qualquer forma, o processo ETL deve poder consultar o reposit\u00f3rio DQR e carregar as regras e padr\u00f5es de valida\u00e7\u00e3o de dados, acompanhado das diretivas de fixa\u00e7\u00e3o. As regras de valida\u00e7\u00e3o de dados devem ser <strong>din\u00e2micas <\/strong>em vez de um conjunto fixo de regras ou pe\u00e7as de l\u00f3gica codificadas.<\/p>\n\n\n\n<p>O reposit\u00f3rio DQR tamb\u00e9m deve ser acess\u00edvel por meio de relat\u00f3rios interativos e pain\u00e9is padronizados \u2014 para capacitar os propriet\u00e1rios e analistas a entenderem os dados, o processo, as tend\u00eancias e os problemas.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Implemente uma valida\u00e7\u00e3o de dados inteligentes<\/h3>\n\n\n\n<p>Ative seu <strong>pipeline <\/strong>de processamento de dados para carregar regras de valida\u00e7\u00e3o de dados do reposit\u00f3rio DQR descrito acima. O reposit\u00f3rio DQR pode ser projetado como um subsistema ETL interno ou externo ao servi\u00e7o ETL. De qualquer forma, a l\u00f3gica para validar dados, juntamente da a\u00e7\u00e3o sugerida, deve ser din\u00e2mica no seu processo ETL.<\/p>\n\n\n\n<p>O pipeline de processamento de dados deve validar continuamente (lotes de) casos com base na vers\u00e3o mais recente das regras de valida\u00e7\u00e3o.<\/p>\n\n\n\n<p>O sistema deve ser capaz de sinalizar e possivelmente enriquecer os dados recebidos originais com o resultado da valida\u00e7\u00e3o e dos metadados relacionados, al\u00e9m de fornecer retorno ao reposit\u00f3rio DQR. Os dados originais s\u00e3o armazenados, com sinaliza\u00e7\u00e3o adequada pelo ETL, <strong>a menos que<\/strong> seja indicado de outra forma pela pol\u00edtica de valida\u00e7\u00e3o atual.<\/p>\n\n\n\n<p>Com essa abordagem, a qualidade dos dados pode ser medida e analisada contra o tempo, por exemplo, por fonte de dados, pipeline de processamento. Os relat\u00f3rios interativos podem ajudar a explorar facilmente o estado geral do processo ETL e identificar e explorar rapidamente preocupa\u00e7\u00f5es com a qualidade dos dados ou problemas espec\u00edficos.<\/p>\n\n\n\n<p>O sistema tamb\u00e9m poderia suportar um &#8220;\u00cdndice de qualidade de dados&#8221; geral. Isso consideraria v\u00e1rios aspectos da qualidade e atribuir mais import\u00e2ncia a entidades e eventos espec\u00edficos. Por exemplo, um registro de transa\u00e7\u00e3o incorreto pode ser muito mais importante do que um hiperlink quebrado para uma imagem.<\/p>\n\n\n\n<p>O \u00cdndice de Qualidade de Dados tamb\u00e9m pode ter <strong>elasticidade <\/strong>espec\u00edfica \u2014 diferente por entidade e evento. Por exemplo, isso pode permitir atrasos no recebimento de dados para uma entidade espec\u00edfica e n\u00e3o para outra.<\/p>\n\n\n\n<p>Ter um \u00edndice geral de qualidade dos dados pode ajudar a empresa a medir a qualidade ao longo do tempo e nas principais dimens\u00f5es dos neg\u00f3cios. Tamb\u00e9m pode ajudar a definir metas e quantificar o impacto de poss\u00edveis melhorias da estrat\u00e9gia ETL.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Uma camada de notifica\u00e7\u00e3o inteligente<\/h3>\n\n\n\n<p>O processo geral deve estar ciente de quaisquer problemas de qualidade, tend\u00eancias e mudan\u00e7as repentinas. Al\u00e9m disso, o sistema precisa saber a import\u00e2ncia \u2014 qu\u00e3o cr\u00edtica \u00e9 uma quest\u00e3o. Com base nessa conscientiza\u00e7\u00e3o e em uma camada de configura\u00e7\u00e3o inteligente, o sistema sabe quando notificar quem e por qual canal espec\u00edfico.<\/p>\n\n\n\n<p>Os sistemas modernos devem estar cientes da qualidade dos dados recebidos e capazes de identificar, relatar e lidar com casos errados de acordo.<\/p>\n\n\n\n<p><em>Este conte\u00fado \u00e9 uma tradu\u00e7\u00e3o e adapta\u00e7\u00e3o do <\/em><a href=\"https:\/\/www.freecodecamp.org\/news\/data-quality-era-of-ai\/\"><em>texto originalmente produzido pela freeCodeCamp<\/em><\/a><em>.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>A qualidade de dados \u00e9 muito importante, principalmente na era da intelig\u00eancia artificial e da automa\u00e7\u00e3o de decis\u00f5es. Voc\u00ea tem uma estrat\u00e9gia de dados?<\/p>\n","protected":false},"author":1,"featured_media":40555,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[13],"tags":[],"class_list":["post-39905","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-gestao"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v25.3.1 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>A qualidade de dados na era da intelig\u00eancia artificial<\/title>\n<meta name=\"description\" content=\"A qualidade de dados ganha cada vez mais import\u00e2ncia. A intelig\u00eancia artificial exige cuidado com os dados para que possa atingir resultados melhores.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/\" \/>\n<meta property=\"og:locale\" content=\"pt_BR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"A qualidade de dados na era da intelig\u00eancia artificial\" \/>\n<meta property=\"og:description\" content=\"A qualidade de dados ganha cada vez mais import\u00e2ncia. A intelig\u00eancia artificial exige cuidado com os dados para que possa atingir resultados melhores.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/\" \/>\n<meta property=\"og:site_name\" content=\"Pingback\" \/>\n<meta property=\"article:published_time\" content=\"2019-11-01T13:49:21+00:00\" \/>\n<meta name=\"author\" content=\"Pingback\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@pingbackoficial\" \/>\n<meta name=\"twitter:site\" content=\"@pingbackoficial\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Pingback\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. tempo de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"12 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/\",\"url\":\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/\",\"name\":\"A qualidade de dados na era da intelig\u00eancia artificial\",\"isPartOf\":{\"@id\":\"https:\/\/pingback.com\/br\/resources\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#primaryimage\"},\"thumbnailUrl\":\"\",\"datePublished\":\"2019-11-01T13:49:21+00:00\",\"author\":{\"@id\":\"https:\/\/pingback.com\/br\/resources\/#\/schema\/person\/170478128352e2f21e2360c2e4944a66\"},\"description\":\"A qualidade de dados ganha cada vez mais import\u00e2ncia. A intelig\u00eancia artificial exige cuidado com os dados para que possa atingir resultados melhores.\",\"breadcrumb\":{\"@id\":\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#breadcrumb\"},\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#primaryimage\",\"url\":\"\",\"contentUrl\":\"\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"In\u00edcio\",\"item\":\"https:\/\/pingback.com\/br\/resources\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"A qualidade de dados na era da intelig\u00eancia artificial\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/pingback.com\/br\/resources\/#website\",\"url\":\"https:\/\/pingback.com\/br\/resources\/\",\"name\":\"Pingback Blog\",\"description\":\"Marketing for builders\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/pingback.com\/br\/resources\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pt-BR\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/pingback.com\/br\/resources\/#\/schema\/person\/170478128352e2f21e2360c2e4944a66\",\"name\":\"Pingback\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/pingback.com\/br\/resources\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/70cde532238b4f8bf4a6e7e589ff0a259eda38fa966564ca7ed7d23e61c27774?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/70cde532238b4f8bf4a6e7e589ff0a259eda38fa966564ca7ed7d23e61c27774?s=96&d=mm&r=g\",\"caption\":\"Pingback\"},\"description\":\"Pingback: Marketing for builders.\",\"sameAs\":[\"https:\/\/pingback.com\",\"https:\/\/www.instagram.com\/pingbackoficial\/\",\"https:\/\/www.linkedin.com\/company\/pingbackoficial\/\",\"https:\/\/x.com\/pingbackoficial\",\"https:\/\/www.youtube.com\/@pingbackoficial\"],\"url\":\"https:\/\/pingback.com\/br\/resources\/author\/adm1n\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"A qualidade de dados na era da intelig\u00eancia artificial","description":"A qualidade de dados ganha cada vez mais import\u00e2ncia. A intelig\u00eancia artificial exige cuidado com os dados para que possa atingir resultados melhores.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/","og_locale":"pt_BR","og_type":"article","og_title":"A qualidade de dados na era da intelig\u00eancia artificial","og_description":"A qualidade de dados ganha cada vez mais import\u00e2ncia. A intelig\u00eancia artificial exige cuidado com os dados para que possa atingir resultados melhores.","og_url":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/","og_site_name":"Pingback","article_published_time":"2019-11-01T13:49:21+00:00","author":"Pingback","twitter_card":"summary_large_image","twitter_creator":"@pingbackoficial","twitter_site":"@pingbackoficial","twitter_misc":{"Escrito por":"Pingback","Est. tempo de leitura":"12 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/","url":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/","name":"A qualidade de dados na era da intelig\u00eancia artificial","isPartOf":{"@id":"https:\/\/pingback.com\/br\/resources\/#website"},"primaryImageOfPage":{"@id":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#primaryimage"},"image":{"@id":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#primaryimage"},"thumbnailUrl":"","datePublished":"2019-11-01T13:49:21+00:00","author":{"@id":"https:\/\/pingback.com\/br\/resources\/#\/schema\/person\/170478128352e2f21e2360c2e4944a66"},"description":"A qualidade de dados ganha cada vez mais import\u00e2ncia. A intelig\u00eancia artificial exige cuidado com os dados para que possa atingir resultados melhores.","breadcrumb":{"@id":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#breadcrumb"},"inLanguage":"pt-BR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/"]}]},{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#primaryimage","url":"","contentUrl":""},{"@type":"BreadcrumbList","@id":"https:\/\/pingback.com\/br\/resources\/qualidade-de-dados\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"In\u00edcio","item":"https:\/\/pingback.com\/br\/resources\/"},{"@type":"ListItem","position":2,"name":"A qualidade de dados na era da intelig\u00eancia artificial"}]},{"@type":"WebSite","@id":"https:\/\/pingback.com\/br\/resources\/#website","url":"https:\/\/pingback.com\/br\/resources\/","name":"Pingback Blog","description":"Marketing for builders","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/pingback.com\/br\/resources\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pt-BR"},{"@type":"Person","@id":"https:\/\/pingback.com\/br\/resources\/#\/schema\/person\/170478128352e2f21e2360c2e4944a66","name":"Pingback","image":{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/pingback.com\/br\/resources\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/70cde532238b4f8bf4a6e7e589ff0a259eda38fa966564ca7ed7d23e61c27774?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/70cde532238b4f8bf4a6e7e589ff0a259eda38fa966564ca7ed7d23e61c27774?s=96&d=mm&r=g","caption":"Pingback"},"description":"Pingback: Marketing for builders.","sameAs":["https:\/\/pingback.com","https:\/\/www.instagram.com\/pingbackoficial\/","https:\/\/www.linkedin.com\/company\/pingbackoficial\/","https:\/\/x.com\/pingbackoficial","https:\/\/www.youtube.com\/@pingbackoficial"],"url":"https:\/\/pingback.com\/br\/resources\/author\/adm1n\/"}]}},"_links":{"self":[{"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/wp\/v2\/posts\/39905","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/wp\/v2\/comments?post=39905"}],"version-history":[{"count":0,"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/wp\/v2\/posts\/39905\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/"}],"wp:attachment":[{"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/wp\/v2\/media?parent=39905"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/wp\/v2\/categories?post=39905"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/pingback.com\/br\/resources\/wp-json\/wp\/v2\/tags?post=39905"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}