As you analyze your data, you may discover that you do not have all the fields you need in order to answer your analytic questions. You may want to combine your data with additional data sets. Joining is a method for combining data based on c...
O que são joins (junções)? | ||
O objetivo das junções | ||
Ao analisar seus dados, você pode descobrir que não possui todos os campos de que precisa para responder às suas perguntas analíticas. Você pode querer combinar seus dados com conjuntos de dados adicionais. A união é um método para combinar dados com base em campos comuns. | ||
O resultado da combinação de dados usando uma junção é uma tabela que normalmente é estendida horizontalmente com a adição de campos de dados. | ||
| ||
Casos de uso | ||
Use junções quando você tiver: | ||
Fontes de dados diferentes que possuem informações separadamente que você deseja reunir para análise ou uma visão melhor / mais profunda. Dados em diferentes tabelas relacionados por campos específicos. | ||
Por exemplo, ambas as tabelas abaixo contêm o campo Fornecedor. A tabela Localização à esquerda contém informações de localização do fornecedor e a tabela Vendas à direita contém dados de vendas do fornecedor. Se você deseja ter uma única fonte de dados que mostre informações de vendas e localização para os fornecedores, unir as tabelas seria uma boa escolha. | ||
| ||
Tipos mais comuns de junções | ||
Os tipos de junção referem-se à maneira como as tabelas são unidas. Alterar a lógica de junção entre as tabelas altera a maneira como o Tableau Prep Builder exibe os resultados. | ||
Vejamos como o tipo de junção selecionado impacta os resultados da junção para as tabelas Localização e Vendas. | ||
Uma junção interna é a junção padrão no Tableau Prep Builder. | ||
Inner Joins | ||
Uma junção interna (inner join) é a junção padrão no Tableau Prep Builder. | ||
No exemplo a seguir, uma junção interna retorna dados que foram registrados nas tabelas Local e Vendas. Isso permite que você veja os fornecedores que possuem informações de vendas e de localização. O uso de uma junção interna para relacionar as tabelas retorna apenas os registros em que uma correspondência é encontrada para o campo Fornecedor. | ||
Left Joins | ||
Uma junção à esquerda (left join) retorna todas as linhas da tabela Location (à esquerda) e apenas as linhas correspondentes da tabela Sales (à direita). Isso permite que você veja todos os fornecedores para os quais você tem uma localização, mesmo que eles ainda não tenham vendas. | ||
Neste exemplo, Ming's Minty Meringues estão incluídos nos dados combinados, embora este fornecedor não esteja listado na tabela Sales à direita. | ||
Como esse fornecedor não está listado na tabela Vendas, há um valor nulo para o campo Total de vendas desse fornecedor nos dados combinados. | ||
Right Joins | ||
Uma junção à direita (right join) usa uma lógica semelhante a uma junção à esquerda, mas muda a direção da junção. Isso permite que você veja todos os fornecedores para os quais tem vendas, mesmo que eles não tenham um local listado. | ||
Neste exemplo, uma junção à direita retorna todas as linhas da tabela Sales e apenas as linhas correspondentes da tabela Location. Neste exemplo, Simon's Snappy Taffy está incluído nos dados agregados, embora este fornecedor não esteja listado na tabela Local à esquerda. | ||
Como esse fornecedor não está listado na tabela Local, há valores nulos para os campos Cidade e Estado desse fornecedor nos dados associados. | ||
Full Outer Joins | ||
Uma junção externa completa retorna todos os registros de ambas as tabelas e deixa nulos onde não há correspondência entre os dois. Isso permite que você veja todos os fornecedores para os quais você tem um local, mesmo que eles ainda não tenham vendas, e todos os fornecedores para os quais você tem vendas, mesmo que eles não tenham um local listado. | ||
Outros tipos de junções | ||
Agora que você entende como as opções de tipo de junção mais comuns impactam os resultados da junção para as tabelas Localização e Vendas, vamos explorar os resultados da junção para tipos de junção menos comuns. | ||
Left Unmatched only | ||
O tipo de junção, à esquerda apenas sem correspondência, retorna apenas as linhas da tabela à esquerda que não têm correspondência na tabela à direita. Isso permite que você veja apenas os fornecedores para os quais você possui locais, mesmo que eles ainda não tenham vendas. | ||
Neste exemplo, uma junção apenas à esquerda sem correspondência retorna apenas resultados para os Meringues Mingues do fornecedor, porque esse fornecedor era o único listado na tabela Location, mas não na tabela Sales. | ||
Righ Unmatched only | ||
O tipo de junção, apenas à direita sem correspondência, usa lógica semelhante a uma junção apenas à esquerda sem correspondência, mas altera a direção da junção. Isso permite que você veja apenas os fornecedores para os quais você tem vendas, mesmo que eles não tenham um local listado. | ||
Neste exemplo, uma junção apenas à direita sem correspondência retorna apenas resultados para o fornecedor Simon's Snappy Taffy porque esse fornecedor era o único listado na tabela Vendas, mas não na tabela Localização. | ||
Unmatched only | ||
Uma junção apenas sem correspondência retorna todos os registros sem correspondência de ambas as tabelas. Isso permite que você veja apenas os fornecedores para os quais você tem um local, mesmo que eles ainda não tenham vendas, e os fornecedores para os quais você tenha vendas, mesmo que eles não tenham um local listado. | ||
| ||
Self Joins | ||
Você também pode associar uma tabela a ela mesma usando uma self join. Uma self join é útil quando há um relacionamento entre as linhas armazenadas na mesma tabela. | ||
Por exemplo, a tabela abaixo mostra as datas de contratação e gerentes de vários funcionários. Imagine que você também queira ver o nome e a data de contratação da pessoa que gerencia o gerente de cada funcionário. Uma associação automática seria uma boa escolha. | ||
| ||
Após juntar a tabela a si mesma, é possível visualizar a data de contratação e gerente para cada gerente de cada funcionário. | ||
| ||
As junções funcionam melhor quando as tabelas têm o mesmo nível de agregação. Você pode usar uma etapa de agregação para agregar uma tabela a um nível diferente de granularidade. |