引子
一直以来,前端性能优化
都是前端程序员在业务开发过程中不得不考虑的一个点。前端同学也一直寄希望于服务器更大的吞吐量、更密集的cdn节点;更寄希望于浏览用户使用更优秀的浏览器及更大的带宽。。。然而随着上述几种情况一一被落实时,前端性能仍然没有达到一个让人满意的结果。。。
此过程中,前端人就自身情况也进行了多种尝试,其中前端本地缓存可以说是性能优化中简单高效的一种方式,该方式缩短了网页请求资源的时长,此外缓存文件可以复用,则进一步减少了网络请求次数与实践,提高了页面加载效率。
前言
首先我们要明确一点:浏览器和服务器进行通讯属于 请求/应答式
。
简短链路为
:
发起请求 -> 服务器响应请求 -> 获取资源。
浏览器缓存就是把一个已经请求过的Web资源(如html页面,图片,js,数据等)储存在本地(内存或者硬盘)。当下一次请求要发出的时候,如果是相同的URL,浏览器会根据缓存机制决定是直接使用先前存储的资源,还是向源服务器再次发送请求。同时而并不是所有请求都需要存储于本地(比如数据接口),那么既然我们要在浏览器层缓存特定资源,应该怎样进行判断或者约定?
缓存分类
1、强缓存
强缓存不会向服务器发送请求,直接从缓存中读取资源,在浏览器控制台的 Network
选项中可以看到该请求返回200的状态码,并且 Size
显示 from disk cache
或from memory cache
等。
强缓存可以通过设置两种 HTTP Header
实现:Expires
和 Cache-Control
。
memory cache(内存)
内存缓存,主要包含页面中已经获取到的资源,比如页面的脚本文件、样式文件、图片等,内存的读取速度要比磁盘快。该缓存属于 会话级别
,一但会话结束,则缓存资源被释放。此外内存容量所限,该缓存更多存储小体积的请求资源。
该缓存主要关注当前会话中第一次请求返回中,response-headers
中的 cache-control
和 Expires
两个字段情况,一经识别计算通过,则资源将被存储于内存中。(一般cdn都会配置该策略)
1、Expires
缓存过期时间,用来指定资源到期的时间,是服务器端的具体的时间点。也就是:Expires = max-age + 到期时间(该到期时间为绝对时间)。Expires
是Web服务器响应消息头字段,在响应http请求时告诉浏览器在过期时间前,浏览器可以直接从浏览器缓存取数据,而无需再次请求。
Expires
是 HTTP/1.0
的产物,受限于本地时间,如果修改了本地时间,可能会造成缓存失效。
2、Cache-Control
在HTTP/1.1中,Cache-Control
是最重要的规则,主要用于控制网页缓存。比如当 Cache-Control:max-age=300
时,则代表在这个请求正确返回时间(浏览器也会记录下来)的300秒内再次请求资源,就会命中强缓存。
备注:
Expires
和Cache-Control
的区别在于 Expires 是 http1.0 的产物,Cache-Control 是http1.1 的产物,两者同时存在的话,Cache-Control 优先级高于 Expires;Expires 主要是用来兼容HTTP1.0,已经过时且存在弊端:Expires 时间根据本地时间而来,如果改变本地的时间。有可能会使当前的 Expires 缓存失效。 强缓存判断是否缓存的依据来自于是否超出某个时间或者某个时间段,而不关心服务器端文件是否已经更新,这可能会导致加载文件不是服务器端最新的内容。
disk cache(硬盘)
其具体缓存机制与 memory cache
一致,只是可以存储的数据量比较大,但是相对来说读取略慢,比较内存缓存来说,硬盘缓存的优点主要体现在时效性上和容量上。硬盘缓存中存入的数据也是根据 http header
中的字段判定的。哪些资源可以进行存储,哪些不进行存储。
disk cache
不同于 memory cache
,disk cache的资源是从磁盘当中取出的,也是在已经在之前的某个时间加载过该资源,不会请求服务器,但是此资源不会随着该页面的关闭而释放掉,因为是存在硬盘当中的,下次打开仍会 from disk cache
。
那么,问题来了,既然 memory cache 和 disk cache 机制一致,那么哪些资源会放在内存当中,哪些资源浏览器会放在磁盘上呢?市面上不同浏览器有不同策略机制,以下以Chrome浏览器采取的策略简单描述一下:
状态 | 类型 | 说明 |
---|---|---|
200 | form memory cache | 不请求网络资源,资源在内存当中,一般脚本、字体会存在内存当中 |
200 | form disk ceche | 不请求网络资源,在磁盘当中,一般非脚本会存在内存当中,如css、图片等 |
2、协商缓存(对比缓存)
协商缓存就是 强制缓存失效
后,浏览器携带缓存标识向服务器发起请求,由服务器根据缓存标识决定是否使用缓存的过程,需要强调的是,这个过程是 需要发出请求的
。
备注
强制缓存优先于协商缓存进行,若强制缓存 (Expires 和 Cache-Control) 生效则直接使用缓存,若不生效则进行协商缓存( Last-Modified / If-Modified-Since 和 Etag / If-None-Match),协商缓存由服务器决定是否使用缓存,若协商缓存失效,那么代表该请求的缓存失效,返回200,重新返回资源和缓存标识,再存入浏览器缓存中;生效则返回304,继续使用缓存。
304
Http 304 状态请求
文件有更新,协商缓存失效,返回200及相关数据资源
文件未更新,协商缓存生效,返回304及空响应及,浏览器直接读取缓存资源
如图所示,http请求携带的缓存标识可以有两个,分别是 Last-modified
和 Etag
,接下来我们慢慢说一说这两个。
Last-modified
和 if-Modified-since
Last-modified
:最后的修改时间,根据比对修改时间可以确定在这一段时间里资源是否进行了修改。
最小颗粒为S
,这颗粒度也就暴露了这个属性的弊端,如果在一秒以内修改多次,则数据不会更新。
浏览器第一次请求的时候,响应资源的 header
中添加 last-modified
,数值为资源在服务器的最后修改时间。浏览器下一次请求的时候,检测到先前返回 header
中有last-modified
属性,则请求上行时 header
中会添加 if-modified-since
属性,值与 last-modified
一致。
服务器再次收到这个资源请求,会根据 If-Modified-Since
中的值与服务器中这个资源的最后修改时间对比,如果两个值相等,返回状态码304
和空的响应体
,直接约定从浏览器缓存中读取;如果 If-Modified-Since
的时间小于服务器中这个资源的最后修改时间,说明文件有更新,于是返回新的资源文件
和状态码200
。
当然这个 last-modified
是http1.0
年代的产物,存在着重大弊端,因为 Last-Modified
只能以秒计时
,如果在同一个秒时间内修改了文件,那么此时二次请求服务端,服务端会认为资源未变更,进而返回304,造成资源错误。
Etag
和 if-none-macth
前面说到了 Last-modified
和 if-Modified-since
组合的弊端,于是在后续的http1.1 版本,引入了 Etag
和 if-none-macth
组合。
Etag
是服务器响应请求时,返回当前资源文件的一个唯一标识,一般是一个hash值
,只要资源有变化,Etag就会重新生成。
浏览器在下一次加载资源向服务器发送请求时,会将上一次返回的Etag值
放到请求上行的header
中 If-None-Match
属性里,服务器只需要比较客户端传来的 header
If-None-Match
值跟自己服务器上该资源的Etag是否一致,就能直接判断资源相对客户端缓存而言是否有修改。如果服务器发现Etag匹配不上,那么直接返回状态码200及新资源(当然也包括了新的Etag);如果匹配是一致的,则直接返回304和空的响应体,直接约定从浏览器缓存中读取。这里就避免了 last-modified
的秒级误差问题
。至此,我们已经介绍了3种缓存:memory cache
、disk cache
、304
,那么我们下面用一张流线图描述下请求及缓存过程:
测试代码
1 | const http = require('http');//node自带http server处理模块 |
---本文结束感谢您的阅读。微信扫描二维码,关注我的公众号---
本文链接: https://www.yp14.cn/2020/07/10/前端本地缓存概况之浏览器缓存策略/
版权声明: 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。转载请注明出处!