我想在 MySQL 中做一个 full outer join。这可能吗? MySQL 是否支持完全外连接?
您在 MySQL 中没有完全连接,但您可以确定 emulate them。
对于从 this Stack Overflow question 转录的代码sample,您有:
有两个表 t1, t2:
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
上面的查询适用于 full outer join 操作不会产生任何重复行的特殊情况。上面的查询依赖于 UNION
集合运算符来删除查询模式引入的重复行。我们可以通过对第二个查询使用 anti-join 模式来避免引入重复行,然后使用 UNION ALL 集合运算符来组合这两个集合。在更一般的情况下,完全外连接会返回重复的行,我们可以这样做:
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION ALL
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
WHERE t1.id IS NULL
Pablo Santa Cruz 给出的答案是正确的;但是,如果有人偶然发现此页面并希望获得更多说明,这里有一个详细的细分。
示例表
假设我们有以下表格:
-- t1
id name
1 Tim
2 Marta
-- t2
id name
1 Tim
3 Katarina
内连接
内部连接,如下所示:
SELECT *
FROM `t1`
INNER JOIN `t2` ON `t1`.`id` = `t2`.`id`;
只会让我们得到出现在两个表中的记录,如下所示:
1 Tim 1 Tim
内连接没有方向(如左或右),因为它们是明确的双向的——我们需要两边都匹配。
外连接
另一方面,外部联接用于查找在另一个表中可能不匹配的记录。因此,您必须指定允许连接的哪一侧有缺失记录。
LEFT JOIN
和 RIGHT JOIN
是 LEFT OUTER JOIN
和 RIGHT OUTER JOIN
的简写;我将在下面使用它们的全名来强化外连接与内连接的概念。
左外连接
左外连接,如下所示:
SELECT *
FROM `t1`
LEFT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`;
...会从左表中获取所有记录,无论它们在右表中是否有匹配项,如下所示:
1 Tim 1 Tim
2 Marta NULL NULL
右外连接
右外连接,如下所示:
SELECT *
FROM `t1`
RIGHT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`;
...会从右表中获取所有记录,无论它们在左表中是否有匹配项,如下所示:
1 Tim 1 Tim
NULL NULL 3 Katarina
全外连接
完全外连接将为我们提供两个表中的所有记录,无论它们在另一个表中是否有匹配项,在没有匹配项的两边都有 NULL。结果将如下所示:
1 Tim 1 Tim
2 Marta NULL NULL
NULL NULL 3 Katarina
然而,正如 Pablo Santa Cruz 所指出的,MySQL 不支持这一点。我们可以通过对左连接和右连接进行 UNION 来模拟它,如下所示:
SELECT *
FROM `t1`
LEFT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`
UNION
SELECT *
FROM `t1`
RIGHT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`;
您可以将 UNION
视为“运行这两个查询,然后将结果堆叠在一起”;一些行将来自第一个查询,一些来自第二个查询。
应该注意的是,MySQL 中的 UNION
将消除完全重复的内容:Tim 将出现在此处的两个查询中,但 UNION
的结果只列出了他一次。我的数据库专家同事认为不应依赖这种行为。所以为了更明确一点,我们可以在第二个查询中添加一个 WHERE
子句:
SELECT *
FROM `t1`
LEFT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`
UNION
SELECT *
FROM `t1`
RIGHT OUTER JOIN `t2` ON `t1`.`id` = `t2`.`id`
WHERE `t1`.`id` IS NULL;
另一方面,如果您出于某种原因希望查看重复项,则可以使用 UNION ALL
。
FULL OUTER JOIN
生成。以这种方式进行查询并使用 UNION 删除这些重复项并没有错。但要真正复制 FULL OUTER JOIN
,我们需要其中一个查询是反连接。
UNION
操作确实会删除这些重复项;但它也会删除所有重复的行,包括将由 FULL OUTER JOIN 返回的重复行。要模拟 a FULL JOIN b
,正确的模式是 (a LEFT JOIN b) UNION ALL (b ANTI JOIN a)
。
使用联合查询将删除重复项,这与从不删除任何重复项的完全外连接的行为不同:
[Table: t1] [Table: t2]
value value
----------- -------
1 1
2 2
4 2
4 5
这是完全外连接的预期结果:
value | value
------+-------
1 | 1
2 | 2
2 | 2
Null | 5
4 | Null
4 | Null
这是将左连接和右连接与联合一起使用的结果:
value | value
------+-------
Null | 5
1 | 1
2 | 2
4 | Null
我建议的查询是:
select
t1.value, t2.value
from t1
left outer join t2
on t1.value = t2.value
union all -- Using `union all` instead of `union`
select
t1.value, t2.value
from t2
left outer join t1
on t1.value = t2.value
where
t1.value IS NULL
上述查询的结果与预期结果相同:
value | value
------+-------
1 | 1
2 | 2
2 | 2
4 | NULL
4 | NULL
NULL | 5
@Steve Chambers:[来自评论,非常感谢!]
注意:这可能是最好的解决方案,既能提高效率,又能产生与 FULL OUTER JOIN
相同的结果。 This blog post 也很好地解释了它 - 引用方法 2:“这可以正确处理重复的行,并且不包含任何不应该包含的内容。必须使用 UNION ALL
而不是普通的 UNION
,这将消除我想保留的重复项。这在大型结果集上可能会显着提高效率,因为不需要排序和删除重复项。"
我决定添加另一个来自完全外部连接可视化和数学的解决方案。它并不比上面的好,但它更具可读性:
全外连接意味着 (t1 ∪ t2):全部在 t1 或 t2 中 (t1 ∪ t2) = (t1 ∩ t2) + t1_only + t2_only:全部在 t1 和 t2 中加上所有在 t1 中但不在 t2 和加上t2 中所有不在 t1 中的:
-- (t1 ∩ t2): all in both t1 and t2
select t1.value, t2.value
from t1 join t2 on t1.value = t2.value
union all -- And plus
-- all in t1 that not exists in t2
select t1.value, null
from t1
where not exists( select 1 from t2 where t2.value = t1.value)
union all -- and plus
-- all in t2 that not exists in t1
select null, t2.value
from t2
where not exists( select 1 from t1 where t2.value = t1.value)
FULL OUTER JOIN
相同的结果。 This blog post 也很好地解释了它 - 引用方法 2:“这可以正确处理重复的行,并且不包含任何不应该包含的内容。有必要使用 UNION ALL 而不是普通的 UNION,这将消除重复我想保留。这在大型结果集上可能会更有效,因为不需要排序和删除重复项。"
MySQL 没有 FULL-OUTER-JOIN 语法。您必须通过执行 LEFT JOIN 和 RIGHT JOIN 来模拟它,如下所示:
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
但是 MySQL 也没有 RIGHT JOIN 语法。根据 MySQL 的 outer join simplification,通过在查询中的 FROM
和 ON
子句中切换 t1 和 t2 将右连接转换为等效的左连接。因此,MySQL 查询优化器将原始查询转换为以下内容 -
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT * FROM t2
LEFT JOIN t1 ON t2.id = t1.id
现在,按原样编写原始查询并没有什么坏处,但是如果您有诸如 WHERE 子句之类的谓词,它是一个 before-join 谓词,或者是 ON
子句上的一个 AND 谓词,它是一个 during-join 谓词,那么你可能想看看魔鬼;这是详细的。
MySQL 查询优化器会定期检查谓词是否被 null 拒绝。
https://i.stack.imgur.com/NioBX.png
现在,如果您已经完成了 RIGHT JOIN,但在 t1 的列上使用了 WHERE 谓词,那么您可能会面临遇到 null 拒绝情况的风险。
例如,查询
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
UNION
SELECT * FROM t1
RIGHT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
由查询优化器翻译成以下内容:
SELECT * FROM t1
LEFT JOIN t2 ON t1.id = t2.id
WHERE t1.col1 = 'someValue'
UNION
SELECT * FROM t2
LEFT JOIN t1 ON t2.id = t1.id
WHERE t1.col1 = 'someValue'
所以表的顺序发生了变化,但谓词仍然适用于 t1,但 t1 现在位于 'ON' 子句中。如果 t1.col1 被定义为 NOT NULL
列,那么这个查询将被 null-rejected。
任何被 null 拒绝的外连接(左、右、全)都会被 MySQL 转换为内连接。
因此,您可能期望的结果可能与 MySQL 返回的结果完全不同。你可能认为它是 MySQL 的 RIGHT JOIN 的一个错误,但这是不对的。它就是 MySQL 查询优化器的工作方式。因此,负责的开发人员在构建查询时必须注意这些细微差别。
之前的答案都不是真正正确的,因为当存在重复值时它们不遵循语义。
对于诸如(来自 this duplicate)的查询:
SELECT * FROM t1 FULL OUTER JOIN t2 ON t1.Name = t2.Name;
正确的等价物是:
SELECT t1.*, t2.*
FROM (SELECT name FROM t1 UNION -- This is intentionally UNION to remove duplicates
SELECT name FROM t2
) n LEFT JOIN
t1
ON t1.name = n.name LEFT JOIN
t2
ON t2.name = n.name;
如果您需要它与 NULL
值一起使用(这也可能是必需的),则使用 NULL
安全比较运算符 <=>
而不是 =
。
name
列为空,它可能会给出与 FULL OUTER JOIN
不同的结果。具有反连接模式的 union all
查询应该正确地再现外连接行为,但哪种解决方案更合适取决于上下文和表上的活动约束。
union all
是正确的,但该答案在第一个或第二个查询中错过了一个反连接模式,该模式将保留现有的重复项,但阻止添加新的重复项。根据上下文,其他解决方案(例如这个)可能更合适。
在 SQLite 中,你应该这样做:
SELECT *
FROM leftTable lt
LEFT JOIN rightTable rt ON lt.id = rt.lrid
UNION
SELECT lt.*, rl.* -- To match column set
FROM rightTable rt
LEFT JOIN leftTable lt ON lt.id = rt.lrid
您可以执行以下操作:
(SELECT
*
FROM
table1 t1
LEFT JOIN
table2 t2 ON t1.id = t2.id
WHERE
t2.id IS NULL)
UNION ALL
(SELECT
*
FROM
table1 t1
RIGHT JOIN
table2 t2 ON t1.id = t2.id
WHERE
t1.id IS NULL);
为了更清楚,我修改了 shA.t's query:
-- t1 left join t2
SELECT t1.value, t2.value
FROM t1 LEFT JOIN t2 ON t1.value = t2.value
UNION ALL -- include duplicates
-- t1 right exclude join t2 (records found only in t2)
SELECT t1.value, t2.value
FROM t1 RIGHT JOIN t2 ON t1.value = t2.value
WHERE t1.value IS NULL
SELECT
a.name,
b.title
FROM
author AS a
LEFT JOIN
book AS b
ON a.id = b.author_id
UNION
SELECT
a.name,
b.title
FROM
author AS a
RIGHT JOIN
book AS b
ON a.id = b.author_id
您可以只转换完整的外部联接,例如
SELECT fields
FROM firsttable
FULL OUTER JOIN secondtable ON joincondition
进入:
SELECT fields
FROM firsttable
LEFT JOIN secondtable ON joincondition
UNION ALL
SELECT fields (replacing any fields from firsttable with NULL)
FROM secondtable
WHERE NOT EXISTS (SELECT 1 FROM firsttable WHERE joincondition)
或者,如果您在 firsttable
中至少有一列(例如 foo
)不为 NULL,则可以执行以下操作:
SELECT fields
FROM firsttable
LEFT JOIN secondtable ON joincondition
UNION ALL
SELECT fields
FROM firsttable
RIGHT JOIN secondtable ON joincondition
WHERE firsttable.foo IS NULL
我修复了响应,并且工作包括所有行(基于 Pavle Lekic 的响应):
(
SELECT a.* FROM tablea a
LEFT JOIN tableb b ON a.`key` = b.key
WHERE b.`key` is null
)
UNION ALL
(
SELECT a.* FROM tablea a
LEFT JOIN tableb b ON a.`key` = b.key
where a.`key` = b.`key`
)
UNION ALL
(
SELECT b.* FROM tablea a
right JOIN tableb b ON b.`key` = a.key
WHERE a.`key` is null
);
tablea
中在 tableb
中没有匹配的行,反之亦然。您尝试 UNION ALL
,这仅在这两个表具有等价列的情况下才有效,这不能保证。
利用:
SELECT * FROM t1 FULL OUTER JOIN t2 ON t1.id = t2.id;
它可以重新创建如下:
SELECT t1.*, t2.*
FROM (SELECT * FROM t1 UNION SELECT name FROM t2) tmp
LEFT JOIN t1 ON t1.id = tmp.id
LEFT JOIN t2 ON t2.id = tmp.id;
使用 UNION 或 UNION ALL 答案不涵盖基表具有重复条目的边缘情况。
解释:
有一个 UNION 或 UNION ALL 无法覆盖的边缘情况。我们无法在 MySQL 上测试它,因为它不支持完全外连接,但我们可以在支持它的数据库上说明这一点:
WITH cte_t1 AS
(
SELECT 1 AS id1
UNION ALL SELECT 2
UNION ALL SELECT 5
UNION ALL SELECT 6
UNION ALL SELECT 6
),
cte_t2 AS
(
SELECT 3 AS id2
UNION ALL SELECT 4
UNION ALL SELECT 5
UNION ALL SELECT 6
UNION ALL SELECT 6
)
SELECT * FROM cte_t1 t1 FULL OUTER JOIN cte_t2 t2 ON t1.id1 = t2.id2;
This gives us this answer:
id1 id2
1 NULL
2 NULL
NULL 3
NULL 4
5 5
6 6
6 6
6 6
6 6
UNION 解决方案:
SELECT * FROM cte_t1 t1 LEFT OUTER JOIN cte_t2 t2 ON t1.id1 = t2.id2
UNION
SELECT * FROM cte_t1 t1 RIGHT OUTER JOIN cte_t2 t2 ON t1.id1 = t2.id2
给出一个错误的答案:
id1 id2
NULL 3
NULL 4
1 NULL
2 NULL
5 5
6 6
UNION ALL 解决方案:
SELECT * FROM cte_t1 t1 LEFT OUTER join cte_t2 t2 ON t1.id1 = t2.id2
UNION ALL
SELECT * FROM cte_t1 t1 RIGHT OUTER JOIN cte_t2 t2 ON t1.id1 = t2.id2
也是不正确的。
id1 id2
1 NULL
2 NULL
5 5
6 6
6 6
6 6
6 6
NULL 3
NULL 4
5 5
6 6
6 6
6 6
6 6
而这个查询:
SELECT t1.*, t2.*
FROM (SELECT * FROM t1 UNION SELECT name FROM t2) tmp
LEFT JOIN t1 ON t1.id = tmp.id
LEFT JOIN t2 ON t2.id = tmp.id;
给出以下内容:
id1 id2
1 NULL
2 NULL
NULL 3
NULL 4
5 5
6 6
6 6
6 6
6 6
顺序不同,但在其他方面与正确答案匹配。
UNION ALL
解决方案。此外,它还提供了一个使用 UNION
的解决方案,由于需要重复数据删除,该解决方案在大型源表上会变慢。最后,它不会编译,因为子查询 tmp
中不存在字段 id
。
UNION ALL
解决方案:……也不正确。”您提供的代码省略了必须在 UNION ALL
中提供的右连接 (where t1.id1 is null
) 的交集排除。也就是说,您的解决方案胜过所有其他解决方案,只有当其中一个解决方案实施不正确时。关于“可爱”的观点。那是无缘无故的,我很抱歉。
使用 cross join 解决方案:
SELECT t1.*, t2.*
FROM table1 t1
INNER JOIN table2 t2
ON 1=1;
select (select count(*) from t1) * (select count(*) from t2))
行。
这也是可能的,但您必须在选择中提及相同的字段名称。
SELECT t1.name, t2.name FROM t1
LEFT JOIN t2 ON t1.id = t2.id
UNION
SELECT t1.name, t2.name FROM t2
LEFT JOIN t1 ON t1.id = t2.id
SQL 标准说 full join on
是 inner join on
行 union all
由空值扩展的不匹配左表行 union all
由空值扩展的右表行。即 left join on
中的 inner join on
行 union all
行但不是 inner join on
right join on
中的 union all
行但不是 inner join on
。
即 left join on
行 union all
right join on
行不在 inner join on
中。或者,如果您知道您的 inner join on
结果在特定的右表列中不能为 null,则“right join on
行不在 inner join on
中”是 right join on
中的行,其中 on
条件由 and
扩展is null
列。
即同样right join on
union all
适当的left join on
行。
从 What is the difference between “INNER JOIN” and “OUTER JOIN”?:
(SQL Standard 2006 SQL/Foundation 7.7 语法规则 1、一般规则 1 b、3 c & d、5 b。)
(SELECT ... FROM tbl1 LEFT JOIN tbl2 ...) UNION ALL (SELECT ... FROM tbl1 RIGHT JOIN tbl2 ... WHERE tbl1.col IS NULL)
t1
和t2
中没有重复的行,则此答案中的查询会返回一个模拟 FULL OUTER JOIN 的结果集。但在更一般的情况下,例如,SELECT 列表不包含足够的列/表达式来使返回的行唯一,那么这个查询模式 insufficient 来重现将由FULL OUTER JOIN
。为了获得更忠实的模拟,我们需要一个UNION ALL
集合运算符,其中一个查询需要一个 anti-join 模式。 Pavle Lekic 的评论(上图)给出了 正确的 查询模式。