分布式系统

分布式系统

分布式系统

既然我们要打造自己的分布式爬虫平台,就要先知道什么是分布式系统,百度百科是这样定义的:

分布式系统(distributed system)是建立在网络之上的软件系统。正是因为软件的特性,所以分布式系统具有高度的内聚性和透明性。因此,网络和分布式系统之间的区别更多的在于高层软件(特别是操作系统),而不是硬件。内聚性是指每一个数据库分布节点高度自治,有本地的数据库管理系统。透明性是指每一个数据库分布节点对用户的应用来说都是透明的,看不出是本地还是远程。在分布式数据库系统中,用户感觉不到数据是分布的,即用户不须知道关系是否分割、有无副本、数据存于哪个站点以及事务在哪个站点上执行等。

这个定义不太好理解,看看书上怎么说。《分布式系统概念与设计》一书中对分布式系统做了如下定义:

分布式系统是一个硬件或软件组件分布在不同的网络计算机上,彼此之间仅仅通过消息传递进行通信和协调的系统。

《分布式系统原理和范型》一书中是这样定义分布式系统的:

分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像是单个相关系统。

简单来说就是一群独立计算机集合共同对外提供服务,但是对于系统的用户来说,就像是一台计算机在提供服务一样。分布式意味着可以采用更多的普通计算机(相对于昂贵的大型机)组成分布式集群对外提供服务。计算机越多,CPU、内存、存储资源等也就越多,能够处理的并发访问量也就越大。

从分布式系统的概念中我们知道,各个主机之间通信和协调主要通过网络进行,所以,分布式系统中的计算机在空间上几乎没有任何限制,这些计算机可能被放在不同的机柜上,也可能被部署在不同的机房中,还可能在不同的城市中,对于大型的网站甚至可能分布在不同的国家。但是,无论空间上如何分布,一个标准的分布式系统应该具有以下几个主要特征:

透明性

系统资源被所有计算机共享。每台计算机的用户不仅可以使用本机的资源,还可以使用本分布式系统中其他计算机的资源。

同一性

系统中的若干台计算机可以互相协作来完成一个共同的任务,或者说一个程序可以分布在几台计算机上并行地运行。

通信性

系统中的计算机都可以通过通信来交换信息。

来源: https://www.cnblogs.com/tuohai666/p/8901370.html


分布式系统
http://peiniwan.github.io/2024/04/42bb5f9d44c5.html
作者
六月的雨
发布于
2024年4月6日
许可协议