ChatGPT解决这个技术问题 Extra ChatGPT

脚本标记中何时需要 CDATA 部分?

脚本标记中是否需要 CDATA 标记,如果需要,何时需要?

换句话说,这是何时何地:

<script type="text/javascript">
//<![CDATA[
...code...
//]]>
</script>

比这更可取:

<script type="text/javascript">
...code...
</script>
现在 XHTML 基本上已经死了,这不再是一个相关的问题吗?
@allyourcode:是什么让您认为 XHTML 已死? HTML5?有 XHTML5 与它一起使用 :)
@DoktorJ AFAIK xHTML 是第 1 版。它的 HTML 等价物是第 4 版。xHTML 2.0 集中了努力,旨在将 xform、xlink、time 和 svg 命名空间推入规范,作为改进 HTML 5 相同功能的一种方式。添加 - xform/input-validation, time/animations, svg/canvas - 但 xHTML 2 规范的努力重新集中在 HTML 5 功能上。这并不是说 xHTML 2 已被放弃或过时,但在不久的将来并没有计划。
XHTML 在 Java Seam / JSF / Facelets 开发中并未消亡。
@Mihai Stancu - 这并不完全正确。根据 W3C 的规定,有一个 XML syntax for HTML5:“可用于 HTML5 的另一种语法是 XML。这种语法与 XHTML1 文档和实现兼容。使用这种语法的文档需要使用 XML 媒体类型提供,并且元素需要按照 XML 规范规定的规则放在 w3.org/1999/xhtml 命名空间中。”

C
Cody Gray

如果您需要将文档解析为 XML(例如,当 XHTML 页面被解释为 XML)并且您希望能够编写文字 i<10a && b 而不是 i&lt;10a &amp;&amp; b,因为默认情况下 XHTML 会将 JavaScript 代码解析为已解析的字符数据,而不是字符数据。对于存储在外部源文件中的脚本,这不是问题,但是对于 XHTML 中的任何内联 JavaScript,您可能想要使用 CDATA 部分。

请注意,许多 XHTML 页面从未打算被解析为 XML,在这种情况下这不会成为问题。

有关该主题的优秀文章,请参阅 https://web.archive.org/web/20140304083226/http://javascript.about.com/library/blxhtml.htm


它不仅仅是“验证”。如果遇到非法字符,大多数严格的 XML 解析器将不会通过页面。这不仅仅是为了让 W3C 开心,并且变得绿色而不是红色。
如果避免使用 &< 字符,则不需要 CDATA 部分;它在 HTML 和 XHTML 中都能正常工作。您可以通过将所有重要代码放入外部脚本并仅使用内联脚本来轻松实现这一点。初始化变量(如果需要,将字符串文字中的 &/< 转义为 \x26/\x3C)。
那么在 HTML5 的情况下呢?
@Mathew Attle - 这是一个很好的问题。在单独的线程上提出一个很好的问题,以确保它得到所需的关注。
@Loren:那么它仍然完全是关于验证。用户代理拒绝无效 XML 的程度是正交的。
S
Shadow2531

当浏览器将标记视为 XML 时:

<script>
<![CDATA[
    ...code...
]]>
</script>

当浏览器将标记视为 HTML 时:

<script>
    ...code...
</script>

当浏览器将标记视为 HTML 并且您希望 XHTML 1.0 标记(例如)进行验证时。

<script>
//<![CDATA[
    ...code...
//]]>
</script>

出于代码安全的考虑,最好用块注释 /* ... */ 将 CDATA 括起来,否则如果删除换行符,代码就会中断
第一部分中的“...作为 XML”不应该是“...作为非解释文本”吗?在 stackoverflow.com/questions/2784183/what-does-cdata-in-xml-mean 中,我们看到“...这些字符串包含可以被解释为 XML 标记但不应该被解释的数据。”
@mattwilkie,我对“as XML”的意思是“当浏览器使用其 XML 解析器(而不是 HTML 解析器)来解析标记时,因为文档是使用基于 XML 的 mime 类型发送的,或者包含标记的文件有基于 XML 的文件扩展名”。
A
Ayo K

HTML

HTML 解析器会将 <script></script> 之间的所有内容视为脚本的一部分。 有些实现甚至不需要正确的结束标签;他们在“</”处停止脚本解释,根据 specs 是正确的。

更新在 HTML5 和当前的浏览器中,情况不再如此。

因此,在 HTML 中,这是不可能的:

<script>
var x = '</script>';
alert(x)
</script>

CDATA 部分完全没有影响。这就是为什么你需要写

var x = '<' + '/script>'; // or
var x = '<\/script>';

或类似的。

这也适用于用作 text/html 的 XHTML 文件。 (因为 IE 不支持 XML 内容类型,所以大部分情况都是如此。)

XML

在 XML 中,适用不同的规则。请注意,(非 IE)浏览器仅在 XHMTL 文档以 XML 内容类型提供时才使用 XML 解析器。

对于 XML 解析器,script 标记并不比任何其他标记更好。特别地,脚本节点可能包含非文本子节点,由“<”触发; “&”符号表示字符实体。

因此,在 XHTML 中,这是不可能的:

<script>
if (a<b && c<d) {
    alert('Hooray');
}
</script>

要解决此问题,您可以将整个脚本包装在 CDATA 部分中。这告诉解析器:“在本节中,不要将“<”和“&”视为控制字符。为防止 JavaScript 引擎解释“<![CDATA[”和“]]>”标记,您可以将它们包装在注释中。

如果您的脚本不包含任何“<”或“&”,则无论如何都不需要 CDATA 部分。


对于(建议的)HTML5 来说,“CDATA 部分根本没有效果”的说法是不正确的,它可以识别结构。 w3.org/TR/html5/syntax.html#cdata-sections
@danorton 有趣。我认为这是一个非常丑陋的组合。尽管如此,脚本内容仍然没有影响。
不知道脚本标签内的 any </ 是坏的。
@SalmanA 这是 HTML 的奇怪之处之一,正式名称为 ETGO。了解更多:mathiasbynens.be/notes/etago(虽然文章指出没有浏览器实现过该功能,但我很确定这给我带来了一些麻烦。也许在其他一些工具中)
实际上我遇到了验证问题 - <script>var b = "<b>bold</b>";</script> 无法验证,但在阅读您的答案并更改为 <script>var b = "<b>bold<\/b>";</script> 后修复了它。
C
Chris Middleton

基本上它是允许编写一个既是 XHTML 又是 HTML 的文档。问题是在 XHTML 中,XML 解析器会解释脚本标签中的 &,<,> 字符并导致 XML 解析错误。因此,您可以使用实体编写 JavaScript,例如:

if (a &gt; b) alert('hello world');

但这是不切实际的。更大的问题是,如果您以 HTML 格式阅读页面,则标记脚本“默认”被视为 CDATA,这样的 JavaScript 将不会运行。因此,如果您希望同一个页面既可以使用 XHTML 也可以使用 HTML 解析器,您需要将脚本标记包含在 XHTML 中的 CDATA 元素中,而不是将其包含在 HTML 中。

这个技巧将 CDATA 元素的开始标记为 JavaScript 注释;在 HTML 中,JavaScript 解析器会忽略 CDATA 标记(它是注释)。在 XHTML 中,XML 解析器(在 JavaScript 之前运行)检测到它并将直到 CDATA 结束的其余部分视为 CDATA。


F
Franz

这是一个 X(HT)ML 的东西。当您在 JavaScript 中使用 <> 之类的符号时,例如比较两个整数时,必须像 XML 一样对其进行解析,因此它们将标记为标签的开始或结束。

CDATA 表示以下行(直到 ]]> 的所有内容都不是 XML,因此不应以这种方式解析。


L
Loren Segal

不要在 HTML4 中使用 CDATA,但您应该在 XHTML 中使用 CDATA,并且如果您有像 < 和 > 这样的非转义符号,则必须在 XML 中使用 CDATA。


CDATA 在 HTML4 中无效。简而言之,它不是语法的一部分。 CDATA 是 XML 的语法,而 XHTML 是 XML 的子集。因此它应该只在 XML(及其子集)中使用。另一方面,HTML 不是 XML。
i
informatik01

当您在页面中嵌入 JavaScript 而不是外部引用时,它可以确保 XHTML 验证正常工作。

XHTML 要求您的页面严格符合 XML 标记要求。由于 JavaScript 可能包含具有特殊含义的字符,因此您必须将其包装在 CDATA 中以确保验证不会将其标记为格式错误。

对于 Web 上的 HTML 页面,您只需在 和 标记之间包含所需的 JavaScript。当您验证网页上的 HTML 时,JavaScript 内容被认为是 CDATA(字符数据),因此被验证器忽略。如果您在设置网页时遵循更新的 XHTML 标准,则情况并非如此。对于 XHTML,脚本标签之间的代码被认为是 PCDATA(已解析的字符数据),因此由验证器处理。因此,您不能只在页面上的脚本标记之间包含 JavaScript 而不会“破坏”您的网页(至少就验证器而言)。

您可以学习 more about CDATA heremore about XHTML here


A
Andre Lombaard

CDATA 表示其中的内容不是 XML。

这是关于 wikipedia 的解释


C
Chris Shaffer

当您要严格遵守 XHTML 时,您需要 CDATA 小于,并且不会将 & 标记为无效字符。


g
gehsekky

以避免在 xhtml 验证期间出现 xml 错误。


I
Ikaso

CDATA 告诉浏览器按原样显示文本,而不是将其呈现为 HTML。


J
Jim

CDATA 表示其中的内容不是 XML。


C
Community

CDATA 在任何 XML 方言中都是必需的,因为 XML 节点中的文本在被评估为 JavaScript 之前被视为子元素。这也是为什么 JSLint complains 关于正则表达式中的 < 字符的原因。

参考

创建声明性 XML UI 语言

Web 的未来:富客户端、富浏览器、富门户


C
Community

When you want it to validate(XML/XHTML - 谢谢,Loren Segal)。


T
Tyler Carter

这样旧的浏览器就不会解析 Javascript 代码并且页面不会中断。

向后兼容。一定会喜欢的。