网络协议网络原理 - HTTP / HTTPS(5)——https协议

一、HTTPS是什么

为什么要进行加密

二、“加密” 是什么

三、HTTPS的工作过程

（1）引入对称加密

对称密钥的特点：

（2）引入非对称加密

非对称加密的特点：

（3）中间人攻击

（4）引入证书

1、证书的介绍

2、证书验证过程

3、几个关键问题（黑客不能篡改证书的原因）

1）黑客能不能修改证书里的公钥？

2）黑客能不能修改证书里的公钥，也尝试重新生成签名，替换原来的签名？

3）黑客能不能自己去公证机构申请一个证书，把服务器的证书替换成自己的？

一、HTTPS是什么

HTTPS也是应用层协议，它是基于HTTP，引入了加密层，S是safe（安全）的意思，HTTPS 就是 HTTP + SSL（加密层）。HTTP协议内容是按照文本的方式，进行明文传输的，这就可能导致在传输过程中，数据被篡改的情况，还有黑客如果黑进某个设备，就能窃取到这些传输数据，你的设备信息就会被泄露。

为什么要进行加密

这里介绍一个臭名昭著的运营商劫持，我们下载一个天天动听，如果未被劫持，就是天天动听的下载链接，如图：

但是被劫持后，就变成QQ浏览器的下载链接了，如图：

运营商能进行劫持，也是因为他们自身有能力进行劫持，各大企业、公司都会用到运营商提供的路由器 / 交换机，进行网络传输时，数据会经过这些设备，运营商就可以做一些程序，把经过这些设备的网络数据，截取到，然后再进行篡改里面的数据，比如说把上面天天动听的下载地址，改成QQ浏览器，这就是其所谓的运营商劫持了，其实还能劫持其他的信息，比如Referer，以前的偷流量事件。下图介绍一下更换下载链接的大概流程：

当前大部分网站设置成HTTPS就是拜运营商所赐的，因为HTTPS可以把数据进行加密，不容易把网络传输的数据进行篡改或者窃取。

思考一下，运营商为啥要这么搞呢？原因是因为被金钱蒙蔽了双眼。

其实不止运营商可以对网络数据进行劫持，黑客也可以，而且如果被黑客劫持了，后果会更加严重、危险，泄露了个人信息、手机的一些应用账号、密码等，这就更加危险了，所以，对HTTP数据包，进行加密，套上一层加密层非常重要。

二、“加密” 是什么

加密就是把明文（要传输的信息）进行一系列变换，生成密文；相反，解密就是把密文，进行一系列的变换，还原为明文。

在这个加密和解密过程中，往往需要一个或者多个中间数据，进行辅助转换，这个中间数据就称为 “密钥”（钥的正确读音是：yue，第四声；但平常我们都说成 yao，第四声）。

引入加密，是为了保证数据安全的有效手段；这里，我们只需要把加密的成本尽可能降低，使破解成本高于加密成本 + 数据本身价值，我们就称为数据是安全的。

这里举个83版《火烧圆明园》的例子，当时有人要谋反，干掉慈禧太后，这时候恭亲王奕诉就给慈禧太后传了个折子和有孔的纸张，折子里面表面就是聊聊家常，没有其他的内容，但是这时候，把有空的纸张和折子折叠后，就会出现：当心肃顺，端华，戴恒（这几个人都是当时的权臣，后来被慈溪一锅端了）。如图：

明文：

把带孔纸张和折子折叠后（密文）：

上面这就涉及到密码学，里面有三个比较重要的属性：明文、密文、秘钥。

明文：就是要传输的真实数据，要表达的实际意思。（折子）

密文：针对密文加密过后得到的结果，往往是不直观，不易理解的。（折子和带孔纸张重叠后）

密钥：在加密和解密过程中，非常重要的中间 “钥匙”，辅助加密、解密的转换。（带孔纸张）

加密、解密在现在，已经发展成一个独立的学科了：密码学。而密码学的奠基人，也正是计算机祖师爷之一：艾伦麦席森图灵。图灵大佬因遭英国皇家的迫害，41岁就英年早逝了；在2013年12月24日，英国女王伊丽莎白才终于向图灵大佬颁发皇家赦免。在计算机领域中，最高荣誉就是以他的名字命名的：图灵奖。（像大佬致敬！！！）

三、HTTPS的工作过程

其实，只要针对HTTPS数据进行解密，就能得到HTTP的数据格式；上面说的运营商劫持、黑客入侵，本质上都是明文传输惹的祸，所以我们需要对上述传输的数据，进行加密，使其变成 “密文”，对数据起到保护作用，加密就是HTTPS的工作过程。

加密的方式有很多，其主要分为两大类：对称加密和非对称加密。

（1）引入对称加密

通过加密的方式，针对http数据进行加密；而对称加密，就是客户端和服务器对加密后的http数据，进行解密，需要用到的密钥是一样的。

对称密钥的特点：

1、客户端和服务器使用的密钥一样。

2、不同的客户端，使用的密钥不同。

3、因为加密解密用的都是同一个密钥，所以运算速度快。

下面介绍加密解密的大概流程，如图：

注意：这里每个客户端的密钥都要不同，如果很多的客户端的密钥都相同，黑客还是能很容易的拿到密钥，对网络传输的数据进行解密，拿到明文。这也意味着，每个客户端连接服务器的时候，都需要自己生成一个随机密钥，并且把这个密钥告诉服务器（也可以是服务器生成，把密钥告诉客户端）。

但是，因为密钥生成的时候，只有单方知道，对面不知道，所以密钥也要进行网络传输，黑客就不能拿到吗？答案肯定是能的；所以，对称加密也是不安全的，黑客仍然能比较轻松的拿到密钥，那么，后续的加密一系列操作也都没用了，黑客有密钥，就能进行解密，获得明文。如图：

因此，针对密钥，我们还要再进行一次加密，这就是非对称加密的内容了。

（2）引入非对称加密

非对称加密：就是加密和解密的密钥不同，加密使用的一个密钥，解密使用的就是另一个密钥了。

非对称加密的特点：

1、加密和解密使用的密钥不同。

2、引入公钥和私钥，公钥加密对称密钥，会进行网络传输；私钥解密对称密钥，不会进行网络传输。

3、因为加密、解密使用的密钥不同，所以运算速度慢。

这里的非对称加密，不能针对后续传输的 header、body进行加密，因为header和body内容还是比较长、比较多的，如果针对这些进行加密、解密，就会消耗很多的CPU资源，如果只是加密、解密一些header、body，也还好，CPU扛得住，但我们知道，服务器是要面对很多用户的，这么多的用户，对这些的请求、返回的响应，都进行加密、解密，CPU必然是吃不消的，这消耗的CPU资源是非常庞大的。（这里使用公钥对对称密钥进行加密，保证对称密钥的安全性，服务器这边使用私钥对加密后的对称密钥进行解密，拿到对称密钥）

所以，我们是对http数据包使用对称密钥加密，保证http数据的安全性，再使用公钥把对称密钥进行加密，保证对称密钥的安全性，服务器会有一个私钥，这个私钥可以对加密后的对称密钥进行解密（拿到对称密钥）；私钥也不会进行网络传输，私钥也只有服务器才知道（公钥和私钥都是服务器生成的），客户端、黑客都不知道。这样黑客即使知道公钥，不知道私钥，就不能把加密后的对称密钥进行解密，就不能对加密数据进行解密，不能拿到明文。

注意：公钥和密钥都是服务器生成的，是成对出现的，私钥也不会进行网络传输；对称密钥把数据进行加密后，还会对对称密钥进行加密使用公钥进行加密，因为黑客没有私钥，无法把公钥还原成对称密钥，就无法对数据进行解密，拿到明文了。

下图介绍非对称加密，网络传输的大概流程，如图：

上图的首次连接，客户端随机生成对称密钥，然后向服务器索要公钥，客户端使用公钥加密对称密钥，传给服务器，服务器使用私钥，解密拿到对称密钥，再告知客户端我拿到对称密钥了；

这个过程就是交换密钥的过程，也是SSL内部完成的工作，因为HTTPS的底层也是TCP，当TCP的三次握手完成后，就要进行SSL的握手了（交换密钥的过程），后续的网络交互，才是真正的传输业务数据（http请求 / 响应）。

但上述引入了非对称加密，任然存在重大安全漏洞，黑客任然有机会拿到私钥，就是下面中间人攻击的内容了。

（3）中间人攻击

因为生成公钥和私钥的算法是公开的，所以黑客也能生成公钥和私钥，当黑客黑进某个设备后，客户端和服务器在建立连接，客户端向服务器索要公钥时，黑客黑进的设备在它们（客户端和服务器中间）中间，就可以把自己的公钥返回给客户端，服务器发给客户端的公钥，用自己的私钥解密加密后的对称密钥，被黑进的设备也能拿到就能拿到对称密钥了；

这时候，客户端和服务器进行网络交互时，被黑进的设备就能通过黑客的私钥，解密密文（加密后的对称密钥），拿到对称密钥，就可以用对称密钥解密密文了，然后可以进行篡改、也可以窃取重要信息；黑客拿着这个明文，再用服务器给的公钥进行加密，发给服务器，服务器也能用自己的私钥，解密密文（加密后的对称密钥），那拿到对称密钥，构造完响应，进行加密再返回，之后的操作也和上面一样，这样客户端和服务器都不会察觉到有异常现象，但明文数据却已经泄露了。

下图是其大概流程：

那怎么办呢，怎么让客户端能识别出，首次连接，返回的公钥是黑客的还是服务器的，如果能进行判断，这样网络传输数据的安全性就能大大提高。这也就是下面引入证书的内容了。

（4）引入证书

1、证书的介绍

证书是公证机构提供的，证书其实是一个结构化数据，里面会包含很多属性，但也是字符串形式的，证书会包含一系列的信息，例如：服务器的主域名、服务器生成的公钥、证书有效期、公证机构信息、证书签名等等。

引入证书就是为了让客户端这边，能够识别出，收到的公钥是不是服务器传过来的。

这个证书是第三方提供的，所以服务器这边要去第三方申请一个证书（提交材料会包含服务器的地址、域名等等），第三方这边同意后就会给给服务器颁发一个证书。

在客户端和服务器连接后，客户端会向服务器索要证书，服务器收到请求后就会返回服务器拿到的证书，里面就会包含公钥，下面的大概流程图：

这里有个关键的问题：黑客是否能修改证书里的公钥？答案肯定是不行的！！因为客户端收到证书后，会对证书进行验证真伪的操作。下面介绍证书验证过程。

2、证书验证过程

证书包含很多信息：服务器的主域名、证书有效时间、服务器的公钥、公证机构信息、证书签名等等。

这里面的信息有一个非常重要：证书签名，公证机构在颁发证书前，会给这个证书计算出一个校验和，然后再使用公证机构的私钥（不是服务器），对这个校验和进行加密，就得到了证书签名（本质就是加密后的校验和）；

客户端收到证书后，会通过一系列的算法（CRC、MD5等），得到一个较短的字符串，也就是校验和A；然后用公证机构的公钥，对证书签名进行解密，拿到校验和B；再进行比较，如果校验和A和校验和B一样，也就说明，这次拿到的证书是服务器发过来的。

下面是客户端拿到证书后做的事（证书的验证过程）：

1）按照校验和的算法，把证书的其他字段都重新计算一遍，得到校验和1。

2）使用系统内置的公证机构的公钥，用公钥解密证书签名，得到校验和2。

3）进行对比，判断校验和1 和校验和2 是否相同；相同就说明证书是服务器传过来的，就是原版证书，没有被修改过；如果证书被人篡改过（比如黑客修改了证书的公钥，替换成自己的），此时按照校验和算法算出了的校验和1，肯定和校验和2不同，此时客户端就能识别出来了（此时浏览器就会跳出一个告警页面，你访问网站有风险，这种情况可能是证书的有效期过期了，也可能是证书的公钥被修改过）。

下面介绍几个关键问题，也是利用了证书的特性，导致黑客不能篡改证书的原因：

3、几个关键问题（黑客不能篡改证书的原因）

黑客黑进某个设备，在网络传输的中间，截获到密文，然后能不能进行下面几个操作？

1）黑客能不能修改证书里的公钥？

不行；因为如果修改了证书里的公钥，按照校验和的算法，把证书的字段都计算一遍，算出来的校验和肯定会和原来的不同（使用公证机构的公钥，解密证书签名得到的校验和，跟这个校验和也会不同）。

2）黑客能不能修改证书里的公钥，也尝试重新生成签名，替换原来的签名？

不行；如果修改了证书签名（使用了黑客自己的私钥进行加密），那么用系统内置的公证机构的公钥，进行解密证书签名，就会解析失败，客户端也就自然可以知道这个证书不对了；还有就是黑客不知道公证机构的私钥是什么，那也就无法生成正确的证书签名了，私钥也只有公证机构会知道。

3）黑客能不能自己去公证机构申请一个证书，把服务器的证书替换成自己的？

不行；因为证书里面包含了一个信息：服务器的主域名（域名也是唯一的），黑客去申请也只能拿到黑客设备的域名证书，不能是服务器的域名。所以客户端看到证书里面的域名不是服务器，自然就能辨别真假证书了。

因为有了证书的特性，就能彻底把黑客篡改证书的路堵死了。

当然，上面所讨论的安全，也不是绝对的安全；上述的安全本质上都是基于非对称加密体系，非对称加密也不是无懈可击的，只不过破解这样的加密体系，需要的计算量非常庞大，超出了现有的计算机算力上限。

所以，现如今各国都忙着搞量子计算机，相比于现在的计算机，量子计算机的算力提升非常大，如果美国先搞出来，那破解一下网络传输的信息，就能轻而易举的知道各国的机密了；相当于谁先搞出来，谁就赢麻了（秦始皇（嬴政）吃麻椒，赢麻了）。

都看到这了，点个赞再走吧,谢谢谢谢谢

好文链接

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

金钥匙

网络协议网络原理 - HTTP / HTTPS(5)——https协议

运维 yum代理 proxy 用nginx正向代理https网站

网络网络安全测试工具火狐浏览器&burpsuite抓取app&https数据包配置指南

发表评论取消回复

金钥匙

网络协议 网络原理 - HTTP / HTTPS(5)——https协议

运维 yum代理 proxy 用nginx正向代理https网站

网络 网络安全 测试工具 火狐浏览器&burpsuite抓取app&https数据包配置指南

相关文章

发表评论取消回复

网络协议网络原理 - HTTP / HTTPS(5)——https协议

网络网络安全测试工具火狐浏览器&burpsuite抓取app&https数据包配置指南