频道导航

首选HTML元标记或HTTP标头中的字符集声明？

2019-05-06 HTML 前端之家

前端之家收集整理的这篇文章主要介绍了首选HTML元标记或HTTP标头中的字符集声明？，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我正在解析很多网站.一切正常,我正在读取转换编码的字符集声明.现在我遇到了 http://celleheute.de/sonntagsfuhrung-3/的问题.

HTML元标记说,内容编码为ISO-8859-2,但HTTP标头说,它是UTF-8.实际上,内容是UTF编码的,所以当我的解析器尝试将内容转换为ISO时,它会破坏一些字符.

现在我的问题是,我更喜欢哪种声明？我可以忽略元标记,当我可以在HTTP标头中找到声明,反之亦然？大多数网络浏览器会做什么？

解决方法

要了解现代浏览器的功能,您应该从 http://dev.w3.org/html5/spec/parsing.html#determining-the-character-encoding开始阅读

第一步和第二步与问题最相关.他们说

If the user has explicitly instructed the user agent to override
the document’s character encoding with a specific encoding,optionally
return that encoding with the confidence certain and abort these
steps.

If the transport layer specifies an encoding,and it is supported,
return that encoding with the confidence certain,and abort these
steps.

这意味着真正的HTTP标头优先于除用户覆盖之外的所有内容.

除此之外,它可能变得复杂.例如,字节顺序标记可以优先于元标记.

更新：由于编写了这个答案,规范发生了变化(大约在2012年中期),因此字节顺序标记现在优先于HTTP标头.

上一篇：haskell – 为什么文本utf-16而不是下一篇：html – Foundation 5 Tabs和Accor

猜你在找的HTML相关文章

elasticsearch扩展ik分词器词库

操作步骤 1、进入elasticsearch的plugin，进入ik。进入config。 2、在config下面建立以.di...

作者：前端之家时间：2021-02-13

echarts中legend如何换行

lengend data数据中若存在''，则表示换行，用''切割。

作者：前端之家时间：2021-02-13

Echart常用效果（一）

代码实现 option = { backgroundColor: &#39;#080b30&#39;, tooltip: { t...

作者：前端之家时间：2021-02-13

freemarker中js里面取字符串，换行导致报错的解决办法

问题原因原因在于直接在js中取的变量并复制给var变量。于是就变成这样。解决办法 var d...

作者：前端之家时间：2021-02-13

Freemarker + xml 实现Java导出word

前言最近做了一个调查问卷导出的功能，需求是将维护的题目，答案，导出成word，参考了几种...

作者：前端之家时间：2021-02-13

【前端JSP思考】JSP中#{},${}和%{}的区别

JSP中#{},${}和%{}的区别： # #{}：对语句进行预编译，此语句解析的是占位符?，可以防止SQ...

作者：前端之家时间：2021-02-10

【前端HTML】常用标签及属性

对于很多人来说，用HTML标签都是熟能生巧，而不清楚为什么是那样的标签，所以我在这列了一...

作者：前端之家时间：2021-02-10

[前端]GOFLY项目-响应式登录页的设计和实现

登录界面如果要实现响应式 , 需要注意宽度的设置和media query的使用宽度一般都是按百分比...

作者：前端之家时间：2021-02-05

[前端] 设定为disabled的表单域值不能被提交

表单中的某个表单域被设定为disabled，则该表单域的值就不会被提交。但是我们需要提交这个...

作者：前端之家时间：2021-02-05

[前端] 代码中执行绑定元素的指定事件trigger方法

前面业务里有个搜索功能 , 入口比较深 , 现在想要把入口挪到有公共header的地方 , 在不想完...

作者：前端之家时间：2021-02-05

最新文章