1.1 Web系统结构
Internet,人们通常称为因特网,是当今世界上覆盖面最大和应用最广泛的网络。根据英语构词法,Internet是Inter + net,Inter-作为前缀在英语中表示“在一起,交互”,由此可知Internet的目的是让各个 net 交互。所以,Internet 实质上是将世界上各个国家、各个网络运营商的多个网络相互连接构成的一个全球范围内的统一网,使各个网络之间能够相互到达。各个国家和运营商构建网络采用的底层技术和实现可能各不相同,但只要采用统一的上层协议(TCP/IP)就可以通过Internet相互通信。
为了使各个网络中的主机能够相互访问,Internet 为每个主机分配一个地址,称为 IP 地址,IPv4的IP地址是32位二进制数字,通常人们用4个0~255的数字表示,例如:127.0.0.1,称为“点分十进制”表示法。图1.1是Internet物理结构的示意图。
图1.1 Internet物理结构示意图
Internet 物理结构如图1.1所示,它将若干个子网通过路由器连接起来,这些子网可以具有不同类型的网络结构,但子网中的每个主机必须拥有全局唯一的IP地址;路由器是用于转发子网之间数据的设备,路由器上有若干个端口,每个端口拥有一个IP地址,一个端口可以连接一个子网。Internet上的数据可以从一个主机发送到另外一个主机,数据以数据包的形式传送;源主机在发送数据包时会在数据包前面加上目的主机的IP地址,路由器通过识别IP地址将数据包发送到适当的子网中;当数据在子网中传播时,拥有该IP地址的主机就会接收该数据包。很多计算机网络教材都使用邮政寄信的例子形象地说明了这个Internet中数据包的传送过程。
Internet 底层的组织和传输原理是很复杂的,感兴趣的读者可以选择相关的计算机网络教材进行深入学习。但作为开发Web应用的软件工程师,通常只是从Internet的应用层面考虑Internet的原理;从应用层面的角度考虑,可以认为Internet是连接所有主机的一个庞大的网络体系,每个主机拥有一个IP地址,主机之间通过IP地址相互传递信息和数据。Web应用实质上是一种特殊的应用,它可以在Internet的主机之间相互交流具有预定义格式的信息和数据。
典型的Web应用是B/S模式(浏览器/服务器模式),即Internet上的两台主机,一台充当服务器,另一台充当客户机,客户机通过本机的浏览器与服务器进行通信,如图1.2所示。
在图1.2中,客户机向服务器发出请求,服务器接收并处理请求,然后将对该请求的响应传送给客户机。以访问希赛网主页为例,读者在浏览器中键入希赛网的主页地址“www.csai.cn”,回车后浏览器就会向希赛网的服务器发送一个请求并且将自己的IP地址连同请求一块发送,该请求要求浏览希赛网的主页,希赛网的服务器接收到该请求并且取出客户机的IP地址,然后将希赛网的主页作为数据包发出,并且以客户机的IP地址作为目的地址。当数据包传送到客户机后,读者的浏览器就可以显示希赛网的主页了。
图1.2 B/S模式示意图
通常Web应用是运行在服务器中的一个应用程序,在上例中希赛网Web服务器中处理客户机响应的程序就是一个典型的Web应用;接收请求、分析请求、构造响应、发送响应都是由该Web应用完成的,这几项工作也是大多数 Web 应用的主要工作。所谓接收请求就是监听服务器的特定端口,当有请求到达端口时就读取该请求,这通常都是由Web容器(例如Tomcat)完成的;所谓分析请求就是解析收到的请求,从中获得请求的内容;所谓构造响应就是根据客户的请求,在进行适当的动作后,构造适当的响应数据;所谓发送响应就是将构造好的响应数据发送给客户机,这通常也是由 Web 容器自动完成的。所以,Web 应用的核心就是如何分析请求、完成相应动作并构造响应。而这其中的分析请求和构造响应都是与Internet的一种传输协议——HTTP——紧密相关的,因为它规定了Web应用中的数据在网络中的传输方式和传输格式。