奔跑中的奶酪

互联网的“套娃行为”有多凶残?

导读

互联网的“套娃行为”有多凶残?

几乎所有的中国网民都不会忘记 2010 年的“3Q大战”。

在腾讯做出那个“非常艰难的决定”之后,360 不但不能与 QQ 同时安装了,使用 360 浏览器的用户也不再能访问 QQ 空间,QQ 空间作为当时最受欢迎的社交网站,腾讯的这一操作就等同于宣判了 360 浏览器的死刑

在此次大战中,发挥着关键性作用的是「浏览器 UA」,我们今天就来好好讨论一下这个话题。

一、浏览器 UA 的诞生

要讲清楚这个话题,我们要从 1990 年说起。

1990 年,英国计算机科学家蒂姆·伯纳斯·李巧妙地提出了 HTTP 协议,然后又编写了世界上第一个浏览器 World Wide Web,万维网就此诞生。

1993 年,美国国家超级电脑应用中心(NCSA)推出了一款叫做 Mosaic(马赛克) 的浏览器,它第一次将图片与文字同时在一起展示。从此,浏览器就变得有趣且流行起来。

i27_UA起源

为了发挥 Mosaic 浏览器的优势,Mosaic 浏览器在访问网页时,会事先向网页服务器发送一段特定的字符串来标记自己,这样使用 Mosaic 的用户能收到有图片的内容了。

这个字符串 Mosaic/2.0(Windows 3.1) 就是 UserAgent,简称 UA,中文叫作“用户代理”。

i27_Mosaic

从此,浏览器 UA 作为一种“根据用户软硬件环境,进而采用不同内容策略”的技术,诞生了。

二、浏览器 UA 的伪装

1994 年,Mosaic 项目的核心成员马克·安德森离职,然后成立了自己的公司,并发布了一款全新的浏览器 Mozilla。Mozilla 除了是 Godzilla 的谐音外,它还是 Mosaic Killa 的缩写,意思是要做 Mosaic 的终结者

然而在 Mosaic 的压力之下, Mozilla 还是改名为了 Netscape(网景)浏览器。不过在设置浏览器 UA 时,Netscape 仍然使用了 Mozilla 的名字,也就是 Mozilla/1.0 (Win3.1)

i27_Nescape

接着,Netscape 浏览器率先支持了网页框架技术,而其他浏览器要么不支持,要么支持得不够好,Netscape 很快成为当时最流行的浏览器。

1995 年,微软宣布进军互联网,然后发布了 IE 浏览器。

尽管 IE 浏览器同样也支持框架技术,但总是收不到有框架的页面,原因是网页服务器会先检测浏览器 UA 中是否包含有 Mozilla,如果有,那就发送有框架的页面,如果没有,那就发送不含框架的页面。

微软等不及市场的反应,于是在 IE 浏览器的 UA 中加入了 Mozilla 的字样,也就是 Mozilla/1.22 (compatible; MSIE 2.0; Windows 95),这样 IE 浏览器就能正常接收到有框架的页面了。

i27_IE

于是,浏览器 UA 也成为了解决浏览器兼容性的一个重要手段。

三、浏览器 UA 的演变

没过多久,微软采用了将 IE 与 Windows 捆绑销售的策略,Netscape 浏览器被打败退出历史舞台,不甘失败的 Netscape 团队在 2004 年又推出了一款新的浏览器 Firefox

Firefox 浏览器使用的 Gecko 引擎非常优秀,为了告诉大家,我使用了这个引擎,于是就加入到了浏览器的 UA 里:Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.5) Gecko/20041108 Firefox/1.0

i27_Firefox

由于 Gecko 的出色和 IE 的止步不前,浏览器 UA 的探测规则发生了变化。

使用 Gecko 引擎的浏览器可以得到更好的网页代码,而其他的浏览器则没有这种待遇。Linux 的追随者对此很难过,因为他们开发了基于 KHTML 引擎的 Konqueror 浏览器,他们认为 KHTMLGecko 一样出色,但却因为不是 Gecko 而得不到好的页面。

于是他们宣布 KHTML 兼容 Gecko(like Gecko),浏览器 UA 就变成了:Mozilla/5.0 (compatible; Konqueror/3.2; FreeBSD) (KHTML, like Gecko)

i27_KHTML

一直使用自主 UA 的浏览器 Opera 也同样有这样的问题。

但 Opera 不是简单地把自己也标记为 Gecko,而是主张让用户来决定变成什么样的浏览器。于是 Opera 在菜单里增加了浏览器 UA 的选项,让用户来选择是变成 IE 还是 Firefox,又或者是它自己本体。

i27_Opera

2003 年,苹果公司从 KHTML 引擎中分支出来了 Webkit,然后开发了 Safari 浏览器。

为了兼容性的考虑,于是苹果将 KHTML 内核 UA 中 的 Mozilla、KHTML、Gecko 统统继承了下来,变成了:Mozilla/5.0 (Macintosh; U; PPC Mac OS X; en-US) AppleWebKit/85.7 (KHTML, like Gecko) Safari/85.5

i27_Safari

2008 年,谷歌使用了苹果的 Webkit 开发出了 Chrome 浏览器。

和 Safari 一样,Chrome 浏览器也想兼容那些为 Safari 专门编写的页面,于是就继承了 Safari 的 UA,然后再加入自己的 UA:Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.2.149.27 Safari/525.13

i27_Chrome

如果要问谁是“伪装之王”,那一定非 Edge 莫属了。

2020 年,微软转用谷歌的 Chromium 内核开发 Edge 浏览器,为了不再受兼容性的困扰,Edge 浏览器几乎将所浏览器的 UA 都加入了进来,于是就有了:

Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.70 Safari/537.36 Edg/90.0.818.38

i27_Edge

如果把 UA 的伪装比作是“俄罗斯套娃”的话,我们会发现:

Edge 伪装成 Chrome,Chrome 伪装成 Safari,Safari 伪装成 KHTML,KHTML 伪装成 Gecko,Gecko 和 IE 又伪装成 Mozilla,最终,所有浏览器的 UA 都以 Mozilla 开头

尽管 Mozilla 作为一个浏览器而言,早已从市场上消失。

i27_UA历史

四、自定义浏览器 UA

浏览器 UA 的利用,通常与浏览器的功能性相关,但也会有其他的因素。

比如当年的“3Q大战”,QQ 空间利用 360 浏览器 UA 中含有的“360SE”字样来屏蔽 360 浏览器,而 360 浏览器为了躲避封杀,则将“360SE”的字样从浏览器 UA 中移除。

i27_3Q大战

又比如一些视频网站,针对桌面浏览器和安卓手机浏览器,会推送视频贴片广告,而对苹果的 Safari 浏览器则不推送。还有如百度网盘,用一般的浏览器下载会大幅限速,而用自家的“百度云管家”则会小幅限速。

对于这类区别对待们有必要夺回浏览器 UA 的控制权

首先,我们检查一下当前使用浏览器的 UA,方法在地址栏中输入 :

Chrome:chrome://version

Edge:edge://version

Firefox:about:support

又或者打开下面三个网站来检测:

https://www.whatsmyua.info

https://passer-by.com/browser

http://useragentstring.com

然后,我们可以使用拓展 User-Agent Switcher and Manager 来自定义浏览器 UA,拓展同时还支持“白名单模式”,可以对不同的网站使用不同的浏览器 UA。

i27_Addon

又或者使用拓展 Header Editor 来修改浏览器 UA。

它的优点在于多功能合一,可以省去安装一个专门的浏览器 UA 拓展,支持 Chrome、Edge、Firefox 三款浏览器。(回复关键字 i27 获取奶酪配置)

i27_Addon3

就是要注意,使用完后要切换回默认的 UA 哦。

结尾

说到底,浏览器 UA 其实是“浏览器大战”的产物。

如果我们想要有一个更加畅通无阻的互联网,那么就很有必要去了解它。

而且,随着 Python 和大数据的火热,「爬虫技术」和「反爬虫技术」的入门也都离不开浏览器 UA。看完这篇文章后,相信你已经半只脚踏入这个领域了,至少在朋友面前装个 B 已经是没问题了。

i27_Reference

最后

  1. 欢迎关注奶酪 公众号 获取奶酪所有的原创资源,比如回复关键字 i27 可获取本文提到的资源。
  2. 欢迎订阅我的 “奶酪书签专业版”,15年沉淀,超过 5000 个分类井条有序的好用实用 html 网站书签。
  3. 本文由「奔跑中的奶酪」原创创作,欢迎订阅、留言和 打赏,也欢迎引用和转载,但要注明出处。
注:本文由 奔跑中的奶酪 作者:奔跑中的奶酪 发表,其版权均为作者所有,如需转载,请注明作者名字以及文章来源。
103
avatar

评论:

4 条评论,访客:4 条,站长:0 条
  1. ChuHai5
    ChuHai5发布于: 

    学习学习,必须的!谢谢!

  2. avatar
    Laddie发布于: 

    来几个反爬虫规则啊

  3. avatar
    深蓝发布于: 

    奶大终于想起了他还有个网站

  4. 扬帆大海
    扬帆大海发布于: 

    Header Editor也是支持域名匹配的,比如设置浏览微信公众号文章时伪装成IE浏览器,这样文章里面的图片就不是webp格式的了(利用IE不支持webp的特性)

发表评论