目录

一、HTTPS是什么

为什么要进行加密

二、“加密” 是什么

三、HTTPS的工作过程

(1)引入对称加密

对称密钥的特点:

(2)引入非对称加密

非对称加密的特点:

(3)中间人攻击

(4)引入证书

1、证书的介绍

2、证书验证过程

3、几个关键问题(黑客不能篡改证书的原因)

1)黑客能不能修改证书里的公钥?

2)黑客能不能修改证书里的公钥,也尝试重新生成签名,替换原来的签名?

3)黑客能不能自己去公证机构申请一个证书,把服务器的证书替换成自己的?

一、HTTPS是什么

        HTTPS也是应用层协议,它是基于HTTP,引入了加密层,S是safe(安全)的意思,HTTPS 就是 HTTP + SSL(加密层)。HTTP协议内容是按照文本的方式,进行明文传输的,这就可能导致在传输过程中,数据被篡改的情况,还有黑客如果黑进某个设备,就能窃取到这些传输数据,你的设备信息就会被泄露。

为什么要进行加密

        这里介绍一个臭名昭著的运营商劫持,我们下载一个天天动听,如果未被劫持,就是天天动听的下载链接,如图:

        但是被劫持后,就变成QQ浏览器的下载链接了,如图:

        运营商能进行劫持,也是因为他们自身有能力进行劫持,各大企业、公司都会用到运营商提供的路由器 / 交换机,进行网络传输时,数据会经过这些设备,运营商就可以做一些程序,把经过这些设备的网络数据,截取到,然后再进行篡改里面的数据,比如说把上面天天动听的下载地址,改成QQ浏览器,这就是其所谓的运营商劫持了,其实还能劫持其他的信息,比如Referer,以前的偷流量事件。下图介绍一下更换下载链接的大概流程:

        当前大部分网站设置成HTTPS就是拜运营商所赐的,因为HTTPS可以把数据进行加密,不容易把网络传输的数据进行篡改或者窃取。

        思考一下,运营商为啥要这么搞呢?原因是因为被金钱蒙蔽了双眼。

        

        其实不止运营商可以对网络数据进行劫持,黑客也可以,而且如果被黑客劫持了,后果会更加严重、危险,泄露了个人信息、手机的一些应用账号、密码等,这就更加危险了,所以,对HTTP数据包,进行加密,套上一层加密层非常重要。

二、“加密” 是什么

        加密 就是把 明文(要传输的信息)进行一系列变换,生成 密文;相反,解密 就是 把 密文,进行一系列的变换,还原为 明文。

        在这个 加密 和 解密 过程中,往往需要一个或者多个中间数据,进行辅助转换,这个中间数据就称为 “密钥”(钥的正确读音是:yue,第四声;但平常我们都说成 yao,第四声)。

        引入 加密,是为了保证数据安全的有效手段;这里,我们只需要把 加密 的成本尽可能降低,使 破解成本 高于 加密成本 + 数据本身价值,我们就称为 数据 是安全的。

        这里举个83版《火烧圆明园》的例子,当时有人要谋反,干掉慈禧太后,这时候恭亲王奕诉就给慈禧太后传了个折子和有孔的纸张,折子里面表面就是聊聊家常,没有其他的内容,但是这时候,把有空的纸张和折子折叠后,就会出现:当心肃顺,端华,戴恒(这几个人都是当时的权臣,后来被慈溪一锅端了)。如图:

        明文:

        把带孔纸张和折子折叠后(密文):

        上面这就涉及到密码学,里面有三个比较重要的属性:明文、密文、秘钥。

        明文:就是要传输的真实数据,要表达的实际意思。(折子)

        密文:针对密文加密过后得到的结果,往往是不直观,不易理解的。(折子和带孔纸张重叠后)

        密钥:在加密和解密过程中,非常重要的中间 “钥匙”,辅助加密、解密的转换。(带孔纸张)

        加密、解密在现在,已经发展成一个独立的学科了:密码学。而密码学的奠基人,也正是计算机祖师爷之一:艾伦  麦席森  图灵。图灵大佬因遭英国皇家的迫害,41岁就英年早逝了;在2013年12月24日,英国女王伊丽莎白才终于向图灵大佬颁发 皇家赦免。在计算机领域中,最高荣誉就是以他的名字命名的:图灵奖。(像大佬致敬!!!)

三、HTTPS的工作过程

        其实,只要针对HTTPS数据进行解密,就能得到HTTP的数据格式;上面说的运营商劫持、黑客入侵,本质上都是明文传输惹的祸,所以我们需要对上述传输的数据,进行加密,使其变成 “密文”,对数据起到保护作用,加密就是HTTPS的工作过程。

        加密的方式有很多,其主要分为两大类:对称加密 和 非对称加密。

(1)引入对称加密

        通过加密的方式,针对http数据进行加密;而对称加密,就是客户端和服务器对加密后的http数据,进行解密,需要用到的密钥 是一样的。

对称密钥的特点:

        1、客户端和服务器使用的密钥一样。

        2、不同的客户端,使用的密钥不同。

        3、因为加密解密用的都是同一个密钥,所以运算速度快。

        下面介绍加密解密的大概流程,如图:

        注意:这里每个客户端的密钥都要不同,如果很多的客户端的密钥都相同,黑客还是能很容易的拿到密钥,对网络传输的数据进行解密,拿到明文。这也意味着,每个客户端连接服务器的时候,都需要自己生成一个随机密钥,并且把这个密钥告诉服务器(也可以是服务器生成,把密钥告诉客户端)。

          但是,因为密钥生成的时候,只有单方知道,对面不知道,所以密钥也要进行网络传输,黑客就不能拿到吗?答案肯定是能的;所以,对称加密也是不安全的,黑客仍然能比较轻松的拿到密钥,那么,后续的加密一系列操作也都没用了,黑客有密钥,就能进行解密,获得明文。如图:

        因此,针对密钥,我们还要再进行一次加密,这就是非对称加密的内容了。

(2)引入非对称加密

        非对称加密:就是加密和解密的密钥不同,加密使用的一个密钥,解密使用的就是另一个密钥了。

非对称加密的特点:

        1、加密 和 解密 使用的 密钥 不同。

        2、引入公钥和私钥,公钥加密对称密钥,会进行网络传输;私钥解密对称密钥,不会进行网络传输。

        3、因为加密、解密使用的密钥不同,所以运算速度慢。

        这里的非对称加密,不能针对 后续传输的 header、body进行加密,因为header和body内容还是比较长、比较多的,如果针对这些进行加密、解密,就会消耗很多的CPU资源,如果只是加密、解密一些header、body,也还好,CPU扛得住,但我们知道,服务器是要面对很多用户的,这么多的用户,对这些的请求、返回的响应,都进行加密、解密,CPU必然是吃不消的,这消耗的CPU资源是非常庞大的。(这里使用 公钥 对 对称密钥进行加密,保证对称密钥的安全性,服务器这边使用私钥对加密后的对称密钥进行解密,拿到对称密钥)

        所以,我们是对http数据包使用对称密钥加密,保证http数据的安全性,再使用公钥把对称密钥进行加密,保证对称密钥的安全性,服务器会有一个私钥,这个私钥可以对加密后的对称密钥进行解密(拿到对称密钥);私钥也不会进行网络传输,私钥也只有服务器才知道(公钥和私钥都是服务器生成的),客户端、黑客都不知道。这样黑客即使知道公钥,不知道私钥,就不能把加密后的对称密钥进行解密,就不能对加密数据进行解密,不能拿到明文。

        注意:公钥和密钥都是服务器生成的,是成对出现的,私钥也不会进行网络传输;对称密钥把数据进行加密后,还会对 对称密钥 进行加密使用公钥进行加密,因为黑客没有私钥,无法把公钥还原成对称密钥,就无法对数据进行解密,拿到明文了。

        下图介绍非对称加密,网络传输的大概流程,如图:

        上图的首次连接,客户端随机生成 对称密钥,然后向服务器索要 公钥,客户端 使用 公钥 加密 对称密钥,传给服务器,服务器使用私钥,解密拿到 对称密钥,再告知客户端我拿到 对称密钥了;

        这个过程就是交换密钥的过程,也是SSL内部完成的工作,因为HTTPS的底层也是TCP,当TCP的三次握手完成后,就要进行SSL的握手了(交换密钥的过程),后续的网络交互,才是真正的传输业务数据(http请求 / 响应)。

        但上述引入了非对称加密,任然存在重大安全漏洞,黑客任然有机会拿到私钥,就是下面中间人攻击的内容了。

(3)中间人攻击

        因为生成公钥和私钥的算法是公开的,所以黑客也能生成公钥和私钥,当黑客黑进某个设备后,客户端和服务器在建立连接,客户端向服务器索要公钥时,黑客黑进的设备在它们(客户端和服务器中间)中间,就可以把自己的公钥返回给客户端,服务器发给客户端的公钥,用自己的私钥解密 加密后的对称密钥,被黑进的设备也能拿到就能拿到对称密钥了;

        这时候,客户端和服务器进行网络交互时,被黑进的设备就能通过黑客的私钥,解密 密文(加密后的对称密钥),拿到对称密钥,就可以用对称密钥解密密文了,然后可以进行篡改、也可以窃取重要信息;黑客拿着这个明文,再用服务器给的公钥进行加密,发给服务器,服务器也能用自己的私钥,解密 密文(加密后的对称密钥),那拿到对称密钥,构造完响应,进行加密再返回,之后的操作也和上面一样,这样客户端和服务器都不会察觉到有异常现象,但明文数据却已经泄露了。

        下图是其大概流程:

        

        那怎么办呢,怎么让客户端能识别出,首次连接,返回的公钥是黑客的还是服务器的,如果能进行判断,这样网络传输数据的安全性就能大大提高。这也就是下面引入证书的内容了。

(4)引入证书

1、证书的介绍

        证书是公证机构提供的,证书其实是一个结构化数据,里面会包含很多属性,但也是字符串形式的,证书会包含一系列的信息,例如:服务器的主域名、服务器生成的公钥、证书有效期、公证机构信息、证书签名等等。

        引入证书就是为了让客户端这边,能够识别出,收到的公钥是不是服务器传过来的。

        这个证书是第三方提供的,所以服务器这边要去第三方申请一个证书(提交材料会包含服务器的地址、域名等等),第三方这边同意后就会给给服务器颁发一个证书。

        在客户端和服务器连接后,客户端会向服务器索要证书,服务器收到请求后就会返回服务器拿到的证书,里面就会包含公钥,下面的大概流程图:

        这里有个关键的问题:黑客是否能修改证书里的公钥?答案肯定是不行的!!因为客户端收到证书后,会对证书进行验证真伪的操作。下面介绍证书验证过程。

2、证书验证过程

        证书包含很多信息:服务器的主域名、证书有效时间、服务器的公钥、公证机构信息、证书签名等等。

        这里面的信息有一个非常重要:证书签名,公证机构在颁发证书前,会给这个证书计算出一个校验和,然后再使用公证机构的私钥(不是服务器),对这个校验和进行加密,就得到了证书签名(本质就是加密后的校验和);

        客户端收到证书后,会通过一系列的算法(CRC、MD5等),得到一个较短的字符串,也就是校验和A;然后用公证机构的公钥,对 证书签名 进行解密,拿到校验和B;再进行比较,如果校验和A和校验和B一样,也就说明,这次拿到的证书是服务器发过来的。

下面是客户端拿到证书后做的事(证书的验证过程):

        1)按照校验和的算法,把证书的其他字段都重新计算一遍,得到校验和1。

        2)使用系统内置的公证机构的公钥,用公钥解密证书签名,得到校验和2。

        3)进行对比,判断 校验和1 和 校验和2 是否相同;相同就说明证书是服务器传过来的,就是原版证书,没有被修改过;如果证书被人篡改过(比如黑客修改了证书的公钥,替换成自己的),此时按照校验和算法算出了的校验和1,肯定和校验和2不同,此时客户端就能识别出来了(此时浏览器就会跳出一个告警页面,你访问网站有风险,这种情况可能是证书的有效期过期了,也可能是证书的公钥被修改过)。

        下面介绍几个关键问题,也是利用了证书的特性,导致黑客不能篡改证书的原因:

3、几个关键问题(黑客不能篡改证书的原因)

黑客黑进某个设备,在网络传输的中间,截获到密文,然后能不能进行下面几个操作?

1)黑客能不能修改证书里的公钥?

        不行;因为如果修改了证书里的公钥,按照校验和的算法,把证书的字段都计算一遍,算出来的校验和肯定会和原来的不同(使用公证机构的公钥,解密证书签名得到的校验和,跟这个校验和也会不同)。

2)黑客能不能修改证书里的公钥,也尝试重新生成签名,替换原来的签名?

        不行;如果修改了证书签名(使用了黑客自己的私钥进行加密),那么用系统内置的公证机构的公钥,进行解密证书签名,就会解析失败,客户端也就自然可以知道这个证书不对了;还有就是黑客不知道公证机构的私钥是什么,那也就无法生成正确的证书签名了,私钥也只有公证机构会知道。

3)黑客能不能自己去公证机构申请一个证书,把服务器的证书替换成自己的?

        不行;因为证书里面包含了一个信息:服务器的主域名(域名也是唯一的),黑客去申请也只能拿到黑客设备的域名证书,不能是服务器的域名。所以客户端看到证书里面的域名不是服务器,自然就能辨别真假证书了。

因为有了证书的特性,就能彻底把黑客篡改证书的路堵死了。

        当然,上面所讨论的安全,也不是绝对的安全;上述的安全本质上都是基于非对称加密体系,非对称加密也不是无懈可击的,只不过破解这样的加密体系,需要的计算量非常庞大,超出了现有的计算机算力上限。

        所以,现如今各国都忙着搞量子计算机,相比于现在的计算机,量子计算机的算力提升非常大,如果美国先搞出来,那破解一下网络传输的信息,就能轻而易举的知道各国的机密了;相当于谁先搞出来,谁就赢麻了(秦始皇(嬴政)吃麻椒,赢麻了)。

都看到这了,点个赞再走吧,谢谢谢谢谢

好文链接

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: