ChatGPT解决这个技术问题 Extra ChatGPT

每个表都应该有一个主键吗?

我正在创建一个数据库表,但没有为其分配逻辑主键。每个表都应该有一个主键吗?

你能提供更多关于这张桌子的细节吗?答案可能是“是”。
是的,每个表都应该有主键。

C
Constantino Tsarouhas

简短的回答:是的。

长答案:

你需要你的桌子可以加入一些东西

如果您希望您的表被聚集,您需要某种主键。

如果您的表设计不需要主键,请重新考虑您的设计:很可能,您遗漏了一些东西。为什么要保留相同的记录?

在 MySQL 中,如果您没有明确指定主键,InnoDB 存储引擎总是会创建一个主键,从而产生一个您无权访问的额外列。

请注意,主键可以是复合的。

如果您有一个多对多链接表,则在链接中涉及的所有字段上创建主键。因此,您可以确保没有两条或更多条记录描述一个链接。

除了逻辑一致性问题之外,大多数 RDBMS 引擎将受益于将这些字段包含在唯一索引中。

而且由于任何主键都涉及创建唯一索引,因此您应该声明它并获得逻辑一致性和性能。

请参阅我的博客中的这篇文章,了解为什么您应该始终为唯一数据创建唯一索引:

使索引唯一

PS 有一些非常非常特殊的情况,您不需要主键。

大多数情况下,它们包括出于性能原因没有任何索引的日志表。


@annakata:他们应该有一个复合主键
“并且由于任何 PRIMARY KEY 都涉及创建唯一索引”对于 Oracle 来说是不正确的。可以使用非唯一索引来强制执行主键。事实上,有时要求唯一和 PK 约束使用非唯一索引。
只是对反问“为什么要保留相同的记录?”的评论。请注意,仅添加 PK 并不能确保没有重复。 PK 通常对用户不可见,因此重要的是可见字段,其中可能包含重复数据。根据您的设计,这可能是可取的,也可能不是。
键与可连接性无关。集群参数取决于您使用的 DBMS,并混合了逻辑和物理考虑。
@JonHeggland 是对的,缺少键并不会阻止您加入表(当然,通常希望有某种索引可以加快加入速度)。
M
Michael Wheeler

总是最好有一个主键。这样它会遇到 first normal form 并允许您继续沿 database normalization 路径前进。

正如其他人所说,没有主键有一些原因,但如果有主键,大多数都不会受到伤害


@PaulSuart 数据不必总是采用正常形式。事实上,当数据变得庞大时,它不应该保持其正常形式,否则对于进行表连接等查询的访问数据将非常缓慢。正常形式是一种“理想化”,实际上只有在数据预计不会增长时才有可能巨大的。
T
Theodore Zographos

不同意建议的答案。最简洁的答案是不。

主键的目的是唯一标识表上的一行,以便与另一个表形成关系。传统上,自动递增的整数值用于此目的,但对此有一些变化。

但是在某些情况下,例如记录时间序列数据,根本不需要这样的密钥,只会占用内存。使一行独一无二只是......不是必需的!

一个小例子:表 A:LogData

Columns:  DateAndTime, UserId, AttribA, AttribB, AttribC etc...

不需要主键。

表 B:用户

Columns: Id, FirstName, LastName etc. 

需要主键 (Id) 才能用作 LogData 表的“外键”。


我同意这一点。
m
marc_s

除了极少数情况(可能是多对多关系表,或者临时用于批量加载大量数据的表),我会说:

如果它没有主键,它就不是表!

马克


严格来说,这句话是错误的。表格可以是由您的查询语言创建的“查看表格”。 RDBMS 由关系而不是表组成。那句话应该说:“如果它没有主键,那就不是关系!”。
或者,“如果没有候选键,那么它就不是关系表”。但是请参阅非常罕见的情况,可以使用不代表关系的表。
为什么多对多表没有主键?您可以创建一个单独的主键,然后为外键的代理创建一个唯一索引。我认为最好在每个表上都有一个主键。即使在批量加载表上,您也可能希望单独标识不包含正在导入的数据的主键,因为它可以帮助您识别 ETL 过程中的重复记录。在我看来,每个表仍然应该有一个主键,即使它是多一点存储。由视图创建的表是表的子集,而不是表本身。
在多对多关系表中,您可以创建一个由关系的两个 ID 组成的复合主键。
t
tvanfosson

几乎任何时候我创建了一个没有主键的表,以为我不需要一个,我最终返回并添加了一个。我现在甚至使用自动生成的身份字段创建连接表,我将其用作主键。


连接表是一个主键 - 一个复合键,由被连接的两条记录的 PK 组成。例如创建表 PersonOrder (PersonId int, OrderId int, PRIMARY KEY(PersonId, OrderId))。
是的,但是如果链接表也有第三个属性,比如说“OrderDate”。您是否也将其添加到复合键中?恕我直言,否 - 因为它可以进一步简化并且不提供主键应具有的不可简化特征。
r
raphaëλ

加就行了


H
HLGEM

您是否需要将此表连接到其他表?您需要一种唯一标识记录的方法吗?如果答案是肯定的,您需要一个主键。假设您的数据类似于客户表,其中包含作为客户的人员的姓名。可能没有自然键,因为您需要地址、电子邮件、电话号码等来确定这个 Sally Smith 是否与那个 Sally Smith 不同,并且您将把该信息存储在相关表中,因为这个人可以有多个电话,addesses 、电子邮件等。假设 Sally Smith 与 John Jones 结婚并成为 Sally Jones。如果您的桌子上没有人工钥匙,那么当您更新名称时,您只需将 7 个 Sally Smiths 更改为 Sally Jones,即使其中只有一个结婚并更改了她的名字。当然,在这种情况下,如果没有人工钥匙,你怎么知道哪个 Sally Smith 住在芝加哥,哪个住在洛杉矶?

您说您没有自然密钥,因此您也没有任何字段组合可以使其唯一,这使得人工密钥至关重要。

我发现任何时候我没有自然密钥,人工密钥是维护数据完整性的绝对必要条件。如果您确实有一个自然键,则可以将其用作键字段。但就个人而言,除非自然键是一个字段,否则我还是更喜欢人工键和自然键上的唯一索引。如果你不放一个,你以后会后悔的。


e
endo64

在每张桌子上都有一个 PK 是一个很好的做法,但这不是必须的。很可能您将需要一个唯一索引和/或聚集索引(是否为 PK),具体取决于您的需要。

查看联机丛书中的主键和聚集索引部分(适用于 SQL Server)

“PRIMARY KEY 约束标识具有唯一标识表中行的值的列或列集。表中的任何两行都不能具有相同的主键值。您不能为主键中的任何列输入 NULL。我们建议使用小的整数列作为主键。每个表都应该有一个主键。符合主键值的列或列组合称为候选键。

但也请检查一下:http://www.aisintl.com/case/primary_and_foreign_key.html


该页面非常愚蠢。首先,出于性能原因需要主键。通过阅读他的页面,我了解到在书表中添加 ID 是没有用的,因为书的文本是独一无二的;显然,这家伙从未使用过数据库。但他在理解他所批评的内容方面也存在问题。页面写道 1)PK 值引用一行 2)您可以通过任何一组列连接 2 个表。没有矛盾。令人惊讶的是,学术文章作者不了解关系理论的基本原理。
“首先,出于性能原因需要主键”这是不正确的,PK不会直接影响性能。没有 PK 可能会导致许多问题(识别一行、加入等),但性能不是其中之一。当您在表上创建 PK 时,SQL 服务器会创建一个唯一聚集索引,该索引会影响性能而不是 PK 本身。作为一个真实的例子,我的表在日期列上有一个聚集索引,在 GUID 字段上有一个 PK,因为我的行应该在表中的日期列上进行物理排序,因为所有查询都有一个日期范围(在我的情况下)。
该聚集索引是主键的一种形式,由 SQL Server 和其他几个 DBMS 创建。您确定使用它是个好主意吗?例如,在 MySQL 中,它不是出于几个未记录的原因。
请记住,在 InnoDB 中,GUID 不是 PK 的最佳类型。所有索引都包含对 PK 的引用,因此 PK 越大,所有其他索引就越大。
S
StewNoble

为了让它成为未来的证明,你真的应该这样做。如果你想复制它,你需要一个。如果你想把它加入另一张桌子,你的生活(以及明年必须维护它的可怜傻瓜的生活)会容易得多。


我不相信这是必要的,但是“这样做是因为否则以后有人将不得不处理后果”足以让我在这样做时犯错。如果看起来值得尝试缩小它,我总是可以稍后删除该列......
T
The Impaler

聚会迟到了,但我想加两分钱:

每个表都应该有一个主键吗?

如果您在谈论“关系 Albegra”,答案是肯定的。以这种方式对数据建模需要实体和表具有主键。关系代数的问题(除了它有 20 种不同的、不匹配的风格之外),它只存在于纸面上。您无法使用关系代数构建现实世界的应用程序。

现在,如果您正在谈论来自现实世界应用程序的数据库,它们部分/大部分都遵循关系代数,充分利用它并忽略它的其他部分。此外,现在数据库引擎提供了大量的非关系功能(现在是 2020 年)。所以在这种情况下,答案是否定的。无论如何,我 99.9% 的现实世界表都有主键,但也有合理的例外。恰当的例子:事件/日志表(多个索引,但看不到一个键)。

底线是,在遵循实体/关系模型的事务应用程序中,几乎(如果不是)所有表都有主键是很有意义的。如果您决定跳过表的主键,请确保您有充分的理由,并且准备好为您的决定辩护。


T
Tacoman667

我知道为了在 .NET 中使用 gridview 的某些功能,您需要一个主键才能让 gridview 知道哪一行需要更新/删除。一般的做法应该是有一个主键或主键簇。我个人更喜欢前者。


S
Shiva

我的职责是维护离岸开发团队创建的应用程序。现在我在应用程序中遇到了各种问题,因为原始数据库模式在某些表上不包含主键。所以请不要因为你糟糕的设计而让其他人受苦。在表上拥有主键总是一个好主意。


r
rvarcher

我总是有一个主键,即使一开始我还没有考虑到它的目的。有几次我最终需要在一个没有 PK 的表中进行 PK,并且以后再放入它总是比较麻烦。我认为总是包含一个有更多的好处。


S
Schildmeijer

如果您使用的是 Hibernate,则无法创建没有主键的实体。如果您使用的是使用普通 sql/ddl 脚本创建的现有数据库,并且没有添加主键,则此问题可能会产生问题


R
Rich.Carpenter

简而言之,没有。但是,您需要记住,某些客户端访问 CRUD 操作需要它。为了将来打样,我倾向于总是使用主键。


k
kyakya

我想找到像这样的官方文件 - 15.6.2.1 Clustered and Secondary Indexes - MySQL

如果 table 没有 PRIMARY KEY 或合适的 UNIQUE 索引,InnoDB 在内部生成一个名为 GEN_CLUST_INDEX 的隐藏聚集索引,该索引包含行 ID 值的合成列。这些行按 InnoDB 分配给此类表中的行的 ID 排序。行 ID 是一个 6 字节的字段,随着新行的插入而单调增加。因此,按行 ID 排序的行在物理上是按插入顺序排列的。

那么,为什么不自己创建主键或类似的东西呢?此外,ORM 无法识别这个隐藏的 ID,这意味着您不能在代码中使用 ID。