浏览器面试题汇总
介绍下重绘和重排(repaint & reflow),以及如何进行优化
参考答案:
整个页面可以看做是一幅画,这幅画是由浏览器绘制出来的,浏览器绘制这幅画的过程称之为渲染。
渲染是一件复杂的工作,它大致分为以下几个过程:
- 解析 HTML,生成 DOM 树,解析 CSS,生成样式规则树
- 将 DOM 树和样式规则树结合,生成渲染树(Render Tree)
- 根据生成的渲染树,确定元素的布局信息(元素的尺寸、位置),这一步称之为 reflow,译作重排或回流
- 根据渲染树和布局信息,生成元素的像素信息(元素横纵的像素点,左上角的偏移量、每个像素的颜色等)。这一步称之为 repaint,译作重绘
- 将像素信息提交到 GPU 完成屏幕绘制
当元素的布局信息发生变化时,会导致重排。
当元素的像素信息发生变化时,会导致重绘。
重排一定会导致重绘,因此布局信息的变化一定会导致像素信息的变化。
在实际开发中,获取和设置元素尺寸、位置均会导致重排和重绘,而仅设置元素的外观(比如背景颜色)则只会导致重绘,不会导致重排。
重排是一项繁琐的工作,会降低效率,因此在开发中,应该尽量避免直接获取和设置元素的尺寸、位置,尽量使用变量来保存元素的布局信息。
说说浏览器和 Node 事件循环的区别
参考答案:
浏览器的事件循环比较简单,它把任务分为宏任务和微任务,当执行栈清空后,会优先调取微任务运行,当微任务队列清空后,才会调取宏任务运行。
而 node 的事件循环机制比较复杂,它将整个任务调度分为 6 个阶段,当执行栈清空后,将依次循环 6 个阶段:
- timers
- pending callbacks
- idle, prepare
- poll
- check
- close callback
在进入任何一个阶段时,都将检查微队列中是否有任务需要执行,只有微队列清空后才能顺利进入下一个阶段。
浏览器缓存读取规则
参考答案:
当需要获取一个资源时,浏览器会先检查缓存中是否存在,若命中缓存,则不会发送请求。浏览器按照一定的顺序检查缓存,具体顺序是:
service worker
在 service worker 中,开发者可以根据需要将远程获取的资源缓存到 cache storage 中,之后对该资源的请求会直接从缓存中获取。
这部分缓存需要前端开发者手动完成的
memory cache
浏览器会自动将请求过的资源自动加入到 memory cache,这主要是为了解决一个页面中有多次相同的请求,比如页面中链接了多张相同的图片。
memory cache 是浏览器自动完成的,它保存在内存中。
disk cache
当浏览器得到的响应头中包含
cache-control
等缓存指令时,会按照指令的要求设置 disk cache。请求的资源会被保存在磁盘中,在指定的期限内有效。disk cache 是长期的,即使关闭浏览器也不会消失。
为什么通常在发送数据埋点请求的时候使用的是 1x1 像素的透明 gif 图片?
参考答案:
首先,在很多场景中,处理埋点的服务器很有可能是第三方服务器,比如百度的站点统计埋点,百度就是一个第三方服务器,这就不可避免的带来跨域问题。
其次,埋点服务方需要提供一种特别利于安装的埋点置入代码,使用传统的 ajax 会使代码变得臃肿。
同时,埋点请求绝大部分都是 get 请求,又无须得到服务器的响应结果。
基于以上的特点,使用 img 元素请求服务器就变得理所当然了,img 元素发出的请求天生支持跨域,书写的代码简单,只需要创建一个 img 元素,然后设置 src 为埋点请求地址即可。
其实请求一旦发出,埋点就成功了,无须得到服务器的响应结果。但如果服务器不给予任何响应的话,可能会导致浏览器端控制台报错,尽管这个报错并不影响实质的功能。为了避免这种情况,服务器于是响应一个最小体积的图片即可,而 1x1 像素的透明 gif 图片是体积最小的图片,自然就选用了它作为响应结果。
请求时浏览器缓存 from memory cache 和 from disk cache 的依据是什么,哪些数据什么时候存放在 Memory Cache 和 Disk Cache 中?
参考答案:
memory cache 是浏览器自动完成的,它不关心 http 语义,但会遵守
cache-control: no-store
指令。浏览器在请求资源后,会自动将资源加入 memory cache,在后续的请求中,若请求的 url 地址和之前缓存的对应地址相同,则直接使用 memory cache。memory cache 只缓存 get 请求,并且缓存的内容在内存中,因此会很快的清理。disk cache 遵守 http 缓存语义,它会按照服务器响应头中指定的缓存要求进行缓存,由于它存在于磁盘中,因此,即便浏览器关闭后缓存内容也不会消失。它的保存时间由服务器的
cache-control
字段指定,当缓存失效后,会重新发送请求到服务器,进入协商缓存的流程。什么是浏览器同源策略?
参考答案:
所谓同源,是指协议、主机、端口均相同的地址。
同源策略是指,当前页面和页面运行过程中发出的请求必须是同源的,即必须协议、主机、端口均相同,否则即被视为跨域请求。
浏览器中的大部分内容都是受同源策略限制的,但是以下三个标签可以不受限制:
- img
- script
- link
DOM Tree 是如何构建的?
参考答案:
- 转码: 浏览器将接收到的二进制数据按照指定编码格式转化为 HTML 字符串
- 生成 Tokens: 之后开始 parser,浏览器会将 HTML 字符串解析成 Tokens
- 构建 Nodes: 对 Node 添加特定的属性,通过指针确定 Node 的父、子、兄弟关系和所属 treeScope
- 生成 DOM Tree: 通过 node 包含的指针确定的关系构建出 DOM Tree
浏览器如何解析 css 选择器?
参考答案:
浏览器读取到选择器时,会从 DOM 树中找到匹配的对应节点,然后将样式附着到对应的 DOM 元素上。当选择器出现多个层级时,浏览器会使用「从右到左」的顺序进行匹配,对应到 DOM 树的遍历上,是从叶子到根的方向进行筛选,这样可以提升匹配效率。
浏览器是如何渲染 UI 的?
参考答案:
- 浏览器解析 HTML,形成 DOM Tree
- 解析 HTML 过程中遇到 CSS,则进行 CSS 解析,生成 Style Rules
- 将 DOM Tree 与 Style Rules 合成为 Render Tree
- 进入布局(Layout)阶段,为每个节点分配一个应出现在屏幕上的确切坐标
- 随后调用 GPU 进行绘制(Paint),遍历 Render Tree 的节点,并将元素呈现出来
浏览器的主要组成部分是什么?
参考答案:
用户界面(user interface)
用于呈现浏览器窗口部件,比如地址栏、前进后退按钮、书签、顶部菜单等
浏览器引擎(browser engine)
用户在用户界面和渲染引擎中传递指令
渲染引擎(rendering engine)
负责解析 HTML、CSS,并将解析的内容显示到屏幕上。我们平时说的浏览器内核就是指这部分。
网络(networking)
用户网络调用,比如发送 http 请求
用户界面后端(UI backend)
用于绘制基本的窗口小部件,比如下拉列表、文本框、按钮等,向上提供公开的接口,向下调用操作系统的用户界面。
JS 解释器(JavaScript interpreter)
解释执行 JS 代码。我们平时说的 JS 引擎就是指这部分。
数据存储(data storage)
用户保存数据到磁盘中。比如 cookie、localstorage 等都是使用的这部分功能。
常见的浏览器内核有哪些?
参考答案:
浏览器 内核(渲染引擎) JavaScript 引擎 Chrome Blink(新) Webkit(旧) V8 FireFox Gecko SpiderMonkey Safari Webkit JavaScriptCore Edge EdgeHTML Chakra IE Trident Chakra PhantomJS Webkit JavaScriptCore Node.js 无 V8 怎样选择合适的缓存策略
参考答案:
对于一次性的资源,比如验证码图片,不进行缓存。
设置响应头
cache-control: no-store
对于频繁变动的资源,比如某些数据接口,使用协商缓存。
设置响应头
cache-control: no-cache
,同时配合ETag
标记,让浏览器缓存资源,但每次都会发送请求询问资源是否更新。对于静态资源,比如 JS、CSS、图片等文件,使用强制缓存。
设置响应头
cache-control: max-age=有效时长
,设置一个很长的过期时间,比如十年,然后通过文件 hash 的处理更新
为什么用多个域名存储网站资源更有效?
参考答案:
主要原因是浏览器对同一个域下的 TCP 连接数是有限制的,这样就导致某个网页如果外部资源多了,比如图片很多的网页,在解析页面时,由于 TCP 连接数受限,就无法同时发起多个下载连接,无法充分利用带宽资源。因此,可以把静态资源放到多个域名下,这样就绕开了连接数的限制,做到了并发下载。
前端需要注意哪些 SEO
参考答案:
语义化
多使用语义化标签,让正确的标签对应正确的内容。
重要内容前置
可以利用弹性盒布局中的 order 属性,将核心、重要的内容尽量放到文档的前面。
服务端渲染
由于目前的搜索引擎对客户端渲染并不友好,因此使用服务端渲染仍然是 SEO 的重要手段。
TDK
利用 title、meta 元素,设置网页的标题、描述、关键字
浏览器是怎么对 HTML5 的离线储存资源进行管理和加载的呢
参考答案:
在线的情况下,浏览器发现 html 头部有 manifest 属性,它会请求 manifest 文件,如果是第一次访问 app,那么浏览器就会根据 manifest 文件的内容下载相应的资源并且进行离线存储。如果已经访问过 app 并且资源已经离线存储了,那么浏览器就会使用离线的资源加载页面,然后浏览器会对比新的 manifest 文件与旧的 manifest 文件,如果文件没有发生改变,就不做任何操作,如果文件改变了,那么就会重新下载文件中的资源并进行离线存储。 离线的情况下,浏览器就直接使用离线存储的资源。
如何兼容低版本浏览器
参考答案:
分为三个部分来说
HTML
低版本浏览器无法识别新增的HTML5元素,如果要兼容这部分浏览器,需要做以下处理:
- 对于非可替换元素,比如article、section、header、footer等,这种元素虽然低版本浏览器不识别,但它仍然会把它们渲染出来,只是没有浏览器的默认样式。因此,我们只需要在css中稍作处理即可,比如给它们都加上
display:block
。- 对于可替换元素,比如video、audio等,这种元素会涉及低版本浏览器没有功能,因此需要使用条件注释,在低版本浏览器中使用兼容的做法
CSS
对于CSS代码,低版本浏览器可能无法识别某些CSS属性,比如圆角边框、背景渐变、过渡动画等。但由于浏览器对于不能识别样式的处理方式是「直接丢弃、不影响后续渲染」,所以,我们可以保持这样的原则:尽量让其兼容,实在不行,至少不影响浏览。按照这样的原则,我们可以对CSS进行以下处理:
- 使用厂商前缀,尽量让其兼容。
- 对于某些样式使用JS替代,比如渐变、动画等
JavaScript
对于JS代码,低版本浏览器无法识别H5的API,因此缺少了一些新功能,比如localstorage、web worker等。不仅如此,低版本浏览器还无法识别ES6的新语法,比如let、const、async、await等。因此,要处理JS的兼容性问题,只能具体情况具体分析,通常,我们会使用下面两种手段来完成兼容:
- 模拟API。就是自己写一个功能完全和官方相同的API,来弥补低版本浏览器API没有的情况。比较典型的就是ES5中有大量的数组API,这些API都是可以轻松模拟的。
- 编译。某些新语法是无法模拟的,只能通过制作工具对源代码进行编译,将其新语法全部去掉,如果新语法涉及特殊功能,则转换为使用API完成,比较典型的例子就是async和await会被转换为generator的函数调用。
在前端工程化的今天,上面的几乎所有兼容性问题都可以依靠工程化完成,比如,css可以依托postcss平台完成兼容性处理,JS可以依托babel平台完成兼容性处理。
- 浏览器怪异模式和普通模式的区别
参考答案:
标准模式:浏览器按W3C标准解析执行代码
怪异模式:使用浏览器自己的方式解析执行代码,因为不同浏览器解析执行的方式不一样,所以称之为怪异模式。比如IE中盒模型的宽高使用的是边框盒。
- 各个浏览器兼容前缀?
参考答案:
前缀 浏览器 -moz- firefox -webkit- chrome、safari -o- opera -ms- IE
- 跨标签页的通讯方式有哪些(哔哩哔哩)
参考答案:
- BroadCast Channel
- Service Worker
- LocalStorage window.onstorage 监听
- Shared Worker 定时器轮询(setInterval)
- IndexedDB 定时器轮询(setInterval)
- cookie 定时器轮询(setInterval)
- window.open window.postMessage
- Websocket