6.5 WWW

万维网 #

它并不是一种计算机网络(LAN WAN等才是),而是一个是超文本信息文档储藏所,是Web而非net,是一个分布式应用(信息可以放在不同的站点上)

文档存于WWW服务器

一切事物使用统一资源定位符URL标识,通过超文本传输协议HTTP传送,用超文本标记语言HTML对文档结构的标记描述网页的结构和内容,CSS描述网页的样式,JavaScript控制网页的行为,浏览器进行渲染

HTTP #

浏览器和WWW服务器请求、传输的协议

工作原理 #

采用TCP连接,报文是HTTP格式:

image-20230626204901304 image-20230626205026548

在1.0版本中是非持续连接,每请求一个文件就需要连接一次(连接建立-请求-响应-断开-重新连接-请求-。。。)

1.1版本改为持续连接,并且流水线,一般考非流水线(连接建立-请求-响应-请求-响应-。。。连接断开)

报文格式 #

image-20230626205818025

例如:

HTTP是无状态的,并不记忆客户是否访问过,但如果想记忆需要用到Cookie,服务器给用户分配一个识别码并在后台数据库建项,以后用户访问的报文是带着识别码的,从而在服务器的数据库找到活动记录

image-20230626210911120
补充

缓存与代理 #

存放web缓存的中间系统即为代理服务器Proxy Server

web缓存存放了最近的请求和响应,主机首先向代理服务器请求,代理服务器发现当新请求与暂存的相同就直接返回,而不需要url地址访问因特网

image-20230626211541730

代理服务器上的文件都有有效期,避免原始服务器和代理服务器上文件不同(比如我github page部署成功后访问网页并没有马上改变