Combinando dados com Joins
0
0

Combinando dados com Joins

As you analyze your data, you may discover that you do not have all the fields you need in order to answer your analytic questions. You may want to combine your data with additional data sets. Joining is a method for combining data based on c...

Jesse James Matos Soares
5 min
0
0

O que são joins (junções)?

O objetivo das junções

Ao analisar seus dados, você pode descobrir que não possui todos os campos de que precisa para responder às suas perguntas analíticas. Você pode querer combinar seus dados com conjuntos de dados adicionais. A união é um método para combinar dados com base em campos comuns.

O resultado da combinação de dados usando uma junção é uma tabela que normalmente é estendida horizontalmente com a adição de campos de dados.

Fluxo com uma junção (join 1)
Fluxo com uma junção (join 1)

Casos de uso

Use junções quando você tiver:

Fontes de dados diferentes que possuem informações separadamente que você deseja reunir para análise ou uma visão melhor / mais profunda. Dados em diferentes tabelas relacionados por campos específicos.

Por exemplo, ambas as tabelas abaixo contêm o campo Fornecedor. A tabela Localização à esquerda contém informações de localização do fornecedor e a tabela Vendas à direita contém dados de vendas do fornecedor. Se você deseja ter uma única fonte de dados que mostre informações de vendas e localização para os fornecedores, unir as tabelas seria uma boa escolha.

Essas duas tabelas compartilham o campo Fornecedor.
Essas duas tabelas compartilham o campo Fornecedor.

Tipos mais comuns de junções

Os tipos de junção referem-se à maneira como as tabelas são unidas. Alterar a lógica de junção entre as tabelas altera a maneira como o Tableau Prep Builder exibe os resultados.

Vejamos como o tipo de junção selecionado impacta os resultados da junção para as tabelas Localização e Vendas.

Uma junção interna é a junção padrão no Tableau Prep Builder.

Inner Joins

Uma junção interna (inner join) é a junção padrão no Tableau Prep Builder.

No exemplo a seguir, uma junção interna retorna dados que foram registrados nas tabelas Local e Vendas. Isso permite que você veja os fornecedores que possuem informações de vendas e de localização. O uso de uma junção interna para relacionar as tabelas retorna apenas os registros em que uma correspondência é encontrada para o campo Fornecedor.

Email image

Left Joins

Uma junção à esquerda (left join) retorna todas as linhas da tabela Location (à esquerda) e apenas as linhas correspondentes da tabela Sales (à direita). Isso permite que você veja todos os fornecedores para os quais você tem uma localização, mesmo que eles ainda não tenham vendas.

Neste exemplo, Ming's Minty Meringues estão incluídos nos dados combinados, embora este fornecedor não esteja listado na tabela Sales à direita.

Como esse fornecedor não está listado na tabela Vendas, há um valor nulo para o campo Total de vendas desse fornecedor nos dados combinados.

Email image

Right Joins

Uma junção à direita (right join) usa uma lógica semelhante a uma junção à esquerda, mas muda a direção da junção. Isso permite que você veja todos os fornecedores para os quais tem vendas, mesmo que eles não tenham um local listado.

Neste exemplo, uma junção à direita retorna todas as linhas da tabela Sales e apenas as linhas correspondentes da tabela Location. Neste exemplo, Simon's Snappy Taffy está incluído nos dados agregados, embora este fornecedor não esteja listado na tabela Local à esquerda.

Como esse fornecedor não está listado na tabela Local, há valores nulos para os campos Cidade e Estado desse fornecedor nos dados associados.

Email image

Full Outer Joins

Uma junção externa completa retorna todos os registros de ambas as tabelas e deixa nulos onde não há correspondência entre os dois. Isso permite que você veja todos os fornecedores para os quais você tem um local, mesmo que eles ainda não tenham vendas, e todos os fornecedores para os quais você tem vendas, mesmo que eles não tenham um local listado.

Email image

Outros tipos de junções

Agora que você entende como as opções de tipo de junção mais comuns impactam os resultados da junção para as tabelas Localização e Vendas, vamos explorar os resultados da junção para tipos de junção menos comuns.

Left Unmatched only

O tipo de junção, à esquerda apenas sem correspondência, retorna apenas as linhas da tabela à esquerda que não têm correspondência na tabela à direita. Isso permite que você veja apenas os fornecedores para os quais você possui locais, mesmo que eles ainda não tenham vendas.

Neste exemplo, uma junção apenas à esquerda sem correspondência retorna apenas resultados para os Meringues Mingues do fornecedor, porque esse fornecedor era o único listado na tabela Location, mas não na tabela Sales.

Email image

Righ Unmatched only

O tipo de junção, apenas à direita sem correspondência, usa lógica semelhante a uma junção apenas à esquerda sem correspondência, mas altera a direção da junção. Isso permite que você veja apenas os fornecedores para os quais você tem vendas, mesmo que eles não tenham um local listado.

Neste exemplo, uma junção apenas à direita sem correspondência retorna apenas resultados para o fornecedor Simon's Snappy Taffy porque esse fornecedor era o único listado na tabela Vendas, mas não na tabela Localização.

Email image

Unmatched only

Uma junção apenas sem correspondência retorna todos os registros sem correspondência de ambas as tabelas. Isso permite que você veja apenas os fornecedores para os quais você tem um local, mesmo que eles ainda não tenham vendas, e os fornecedores para os quais você tenha vendas, mesmo que eles não tenham um local listado.

A tabela destacada mostra o resultado de uma junção unmatched only
A tabela destacada mostra o resultado de uma junção unmatched only

Self Joins

Você também pode associar  uma tabela a ela mesma usando uma self join. Uma self join é útil quando há um relacionamento entre as linhas armazenadas na mesma tabela.

Por exemplo, a tabela abaixo mostra as datas de contratação e gerentes de vários funcionários. Imagine que você também queira ver o nome e a data de contratação da pessoa que gerencia o gerente de cada funcionário. Uma associação automática seria uma boa escolha.

Tabela de funcionários, data de contratação e gerentes
Tabela de funcionários, data de contratação e gerentes

Após juntar a tabela a si mesma, é possível visualizar a data de contratação e gerente para cada gerente de cada funcionário.

A tabela destacada mostra o resultado do self join
A tabela destacada mostra o resultado do self join

As junções funcionam melhor quando as tabelas têm o mesmo nível de agregação. Você pode usar uma etapa de agregação para agregar uma tabela a um nível diferente de granularidade.