首页 » 正文

[论文解读] A View of Cloud Computing

1.本文系课程报告的相关内容,亦系论文A View of Cloud Computing的报告和解读。
2.全文为对于云计算的讨论,非专业的知识普及,可能存在疏漏或错误,如需要相对准确的内容,请直接阅读原文。
3.文章图片部分来源于网络,表格则为根据原文内容自制,解读过程中加入的自己的部分观点,不代表原作者立场。
4.对于目前云提供商的分析,虽已充分查阅相关资料但难免疏漏,所述不代表其实际的功能和定价,亦不会因为未来功能的更新而更新本文。
5.为了帮助学习者更好的了解云端计算的相关内容,文中附上了原文下载,同样对于部分引用于网络的图片,遵循知识产权保护,如有问题请申诉。
原论文下载: [暂未公布]
演讲PPT下载: [暂未公布]
演讲影片下载:[暂未公布]
———————– Page 1———————–
A View of Cloud Computing
原文作者: MICHAEL ARMBRUST, ARMANDO FOX, REAN GRIFFITH,ANTHONY D.JOSEPH, RANDY KATZ, ANDY KONWINSKI,GUNHO LEE, DAVID PATTERSON, ARIEL RABKIN, ION STOICA,MATEI ZAHARIA
报告者:[动漫技术宅隐私保护]
2020年3月20日

———————– Page 2———————–
目录
1.1 起源:为什么使用云端运算…..3
1.2 定义:云计算的具体含义…..4
1.3 争议:云计算范围的讨论…..5
1.4 经济:云计算的成本计算…..6
1.5 比较:云计算和常规数据中心差异…..7
1.6 比较:常规数据中心的欠负载…..8
1.7 发展:云计算的发展历史…..9
1.8 模式:云计算的三种服务模式…..10
2.1 :云计算的阻碍与机遇…..11
2.2 :服务可用性和业务连续性…..12
2.3 :资料锁定…..13
2.4 :资料机密性和可审查性…..14
2.5 :资料传输瓶颈&性能不可预测性…..15
2.6 :存储扩展&大型分布式系统中的错误…..16
2.7 :快速扩展&声誉维护与共用&软件许可…..17
3.1 :常见云计算平台分析…..18
3.2 :Amazon…..19
3.3 :Google&Alibaba…..20
3.4 :比较分析…..21
4 :总结…..22

———————– Page 3———————–
1.1 起源:为什么使用云端运算
1. 减少在硬件上的大量投入。–云端运算无需在前期投入大量硬件资源 ,而是根据需要一点点的扩展需要的资源,也可以根据实际情况增删设备。
2. 减少维护成本开支。 –在传统的结构中,每个企业管理自己的设备,要付出相当的人力来以备万一,由于设备故障是相当罕见的,多数时候人员处于待命状态,而云端运算将所有的设备集中管理 ,大大减少了人力成本。
3. 降低对功能过度配置的风险。 –在项目的一开始,我们不能准确预估出实际使用的硬件资源,而是仅仅使用最大包括原则,即按照可能的情况进行最高配置 ,以免在运行高峰期出现故障,但这样的配置也包括大量的冗余。
4. 即使有大量的处理任务仍然能快速得出结果。 –有一些任务面临大量的处理任务,传统的计算仅包括单个节点和多节点负载平衡,单节点一定无法处理好,即使多节点也会出现无法应对的情况。
5. 各种资源能够弹性使用,而不必因为固定而失去灵活性。 –在使用过程中,传统的方式配置相对固定,而云计算可以根据需要随时修改配置。如果增加设备,则会在公共池里找到一些未被使用的硬件;而删除设备则是将自己空余的设备添加到公共池中。

图1 :传统服务器与云端运算

———————– Page 4———————–

1.2 定义:云计算的具体含义
云计算指使用Internet作为主要服务的应用程式,也指提供这些服务的硬件和软件。 云计算的前提使用网络,最广泛的定义涵盖硬件和软件就是我们所说的云。当按即付即用的方式任何软件以及在本地运行但通过远端进行许可形式向公众提供云时,我们称其为公共云。私有云指在企业或组织的内部公众无法使用的资料中心。

图2 :阐述云计算的用户和提供者之间的关系。云提供商和云用户之间互相影响。顶层可以是递回的,因为提供程式的人也有机会成为用户。

图3 :云计算示意图

———————– Page 5———————–
1.3 争议:云计算范围的讨论
从云计算中忽略私有云已经引起了科技界的广泛争论。
Q :ISP(互联网服务提供者)是否属于云计算?
A :ISP可以托管面向公众的Internet服务,该服务可以连接或分配大量的电脑。但通常公共Internet上的负载激增速度仍然会快得多,因此ISP不是云计算。
Q :类似Amazon的硬件虚拟机器是否属于云计算?
A :Amazon 云计算实例看起来很像物理硬件,且使用者可以从内核向上控制几乎整个软件堆叠。其应用程式运行在一种与语言无关的托管环境上( .NET ),该框 架 比AppEngine的框架要灵活得多,但仍然限制了使用者对存储模型和应用程式结构的选择。因此,其介于应用程式框架和硬件虚拟机器之间,而非真正意义上的云计算。
Q :企业搭建的资料中心是否属于云计算?
A :由企业搭建的资料中心可能仍然会受到资源的限制,不能满足云计算相对随意的添加请求。私有资料中心也不具备可观的经济效应, 除了拥有数十万台电脑的超大型资料中心之外,大多数资料中心不能算为是云计算。作者认为在云计算的定义中包括传统数据中心将导致较小的私有云的夸大主张,声称自己是公有云计算,但是也不否认更多的私有云可以通过混合计算获得公共云的更多好优点。

———————– Page 6———————–
1.4 经济:云计算的成本计算
很多时候云计算在成本上比公用程式托管更低。
1. 服务需求随时间变化的软件更适合云计算。例如,某软件每月只有几天会有高负载,而总是使用过高的配置会导致其它时间的利用率不足。相反,云计算按小时支付,即使从云提供商那里租用电脑的费率比较高却仍有可能节省成本。
2. 事先对需求未知的应用也适用于云计算。例如, Web初创公司在某软件风靡时将需要大量的资源,一旦用户减少,其需求量也可能会减少。
3. 执行大量计算的企业可以使用云计算来更快地完成计算: 使用1,000台电脑一小时的成本与使用一台电脑1,000小时的成本相同,但前者效率显然更高。“即用即付” 的理念可以为买方带来更多的经济利益。

———————– Page 7———————–
1.5 比较:云计算和常规数据中心差异云计算与常规数据中心相比,优势明显。

从表中可以看出云计算相比常规数据中心,在很多方面都有极大的优势,所以越来越多的企业选择把自己的应用托管在云计算平台。

———————– Page 8———————–
1.6 比较:常规数据中心的欠负载云计算与常规数据中心相比,优势明显。

图4 :云计算中心在符合负载和欠载情况下的资源使用情况
从图中我们可以看出,在传统计算中,当我们的负载资源较高时,我们可以满足用户的要求,但是当用户所需求的资源没有那么高的时候,会造成一定程度的资源浪费;而如果我们将负载调低,则无法满足用户最高的资源要求;而如果用户所需求的资源并不均衡,则统一的负载无法响应用户最高的需求。

———————– Page 9———————–

1.7 发展:云计算的发展历史
1983年,SUN公司提出网络即电脑的概念。
1996年,Compaq公司在公司内部文件中,首次提及“云计算”这个词汇。
2006年3月,亚马逊推出弹性计算云服务。
2007年10月,Google与IBM开始在美国大学校园推广云计算的项目,希望能降低分布式运算技术在学术研究方面的成本,并为这些大学提供相关的软硬件设备及技术支持。学
生则可以透过网络开发各项以大规模计算为基础的研究项目。
2008年1月30日,Google宣布在台湾引导“云计算学术专案”,将这种技术推广到校园。
2008年7月29日,YAHOO、HP和INTEL宣布一项涵盖美国、德国和新加坡的联合研究计画,推出云计算研究测试。
2008年8月3日,美国专利商标局网站资讯显示,DELL正在申请“云计算”(Cloud Computing )商标,此举旨在加强对这一未来可能重塑技术架构的术语控制权。
2010年3月5日,Novell与云安全联盟(CSA)共同宣布一项供应商中立专案,名为“可信任云计算项目”。
2010年7月,美国国家航空航天局和包括Rackspace、AMD、Intel、DELL等支持厂商共同宣布“OpenStack”开放源码项目
2010年10月表示支持OpenStack与Windows Server 2008 R2的集成;而Ubuntu已把OpenStack加至11.04版本中。
2011年2月,思科系统正式加入OpenStack,重点研制OpenStack的网络服务。

———————– Page 10———————–
1.8 模式:云计算的三种服务模式
软件即服务(SaaS ):消费者使用应用程式,但并不掌控作业系统、硬件或运作的网络基础架构。是一种服务观念的基础,软件服务供应商,以租赁的概念提供客户服务,而非购买,比较常见的模式是提供一组帐号密码。它是一种软件交付模式。软件仅需透过互联网,不须经过传统的安装步骤即可使用,软件及其相关的资料集中托管于云端服务。用户通常使用精简用户端,一般即经由网页浏览器来访问软件即服务。SaaS 最大的特色在于软件本身并没有被下载到使用者的硬盘,而是存储在提供商的云端或者服务器。对比传统软件需要花钱购买,下载。软件即服务只需要使用者租用软件,线上使用,不仅大大减少了用户购买风险也无需下载软件本身,无设备要求的限制。

平台即服务(PaaS ):是一种云计算服务,提供运算平台与解决方案服务。在云计算的典型层级中,PaaS层介于软件即服务与基础设施即服务之间。PaaS提供用户将云端基础设施部署与创建至用户端,或者借此获得使用程式设计语言、程式库与服务。使用者不需要管理与控制云端基础设施(包含网络、服务器、作业系统或存储),但需要控制上层的应用程式部署与应用托管的环境。PaaS将软件研发的平台做为一种服务,以软件即服务(SaaS )模式交付给使用者。因此,PaaS也是SaaS模式的一种应用。但是, PaaS的出现可以加快SaaS的发展,尤其是加快SaaS应用的开发速度。

基础设施即服务(IaaS ):消费者使用“基础计算资源”,如处理能力、存储空间、网络元件或中介软件。消费者能掌控作业系统、存储空间、已部署的应用程式及网络元件(如防火墙、负载平衡器等), 但并不掌控云基础架构。

———————– Page 11———————–
2.1 :云计算的阻碍与机遇
下面的表格总结了云计算的十大障碍和机遇。1到3主要影响利用率,4-8主要影响业务增长,9到10是政策和业务的障碍。而事实上每一个所谓障碍都伴随着可观的机遇。

———————– Page 12———————–
2.2 :服务可用性和业务连续性
服务可用性指的是服务的效果、效能和效率。互联网行业中指用户是否可以随时使用网络资源 ,换言之,就是网络的平均无故障率。所以,为了保证网络的无故障率,除了选择高性能、高可靠性的设备外,还要在网络结构上充分考虑冗余和备份。用户常常担心自己的程式是否具有足够的可用性,目前很多云服务的提供商自己设定了高标准。Google搜索素以其高可用性而著称,任何小的错误都有可能引发混乱,很少有企业IT基础架构如此出色。除了可用性方面的诸多问题外,云提供商可能会因非技术原因而遭受停运 ,包括停业或成为监管的目标。高可用性的云计算提供商长期以来一直遵循“没有故障” 的口号,但是由一家公司管理云计算服务实际上很可能发生故障。而作为用户,可以使用多个服务提供商的业务,当灾害发生时,迅速从发生故障的运营商迁移到非故障的运营商。

图5 :常见的破坏服务可用性的原因包括施工、自然灾害或停电等。

———————– Page 13———————–
2.3 :资料锁定
软件堆叠改善了平台之间的关联性 ,但是由于云计算的API是专有的,因此客户无法轻松地从一个网站提取其数据在另一个网站上运行。从云中提取资料的困难使一些公司无法采用云计算。资料锁定可能对云计算提供商有帮助,利于它们锁定客户 ,但他们的用户容易受到价格上涨,可靠性等问题甚至是提供商倒闭的影响。一种解决方案是提供标准化的API,即开发人员可以在多个云计算提供商之间部署服务和数据,这样一家公司的倒闭就不会导致所有客户数据丢失。有人可能会担心这会导致云计算定价困难,并使云计算提供商的 利润较少。

———————– Page 14———————–
2.4 :资料机密性和可审查性
许多公司使用外部电子邮件服务来保存敏感资讯 ,但是安全性是人们最常关心的问题之一。从某些法规上讲,也存在可审核性的要求 ,必须将企业资料转移到云中。保护云免受外部威胁是很多大型数据中心所面临的问题。但由于此职责可能牵涉到多个方面,包括云用户,云供应商以及用户依赖的软件或配置所依赖的任何厂商供应商。云用户负责应用程式级别的安全性。云提供商负责物理安全性,并负责执行外部防火墙策略。用户和操作员之间共用软

图6 :密码是保护敏感资料的方式之一。

记忆体堆叠中间层的安全性;暴露给用户的抽象级别越低,承担的责任就越大。诸如EC2之类的平台的同质性和标准化API使公司可以提供配置管理等服务。云计算同样面临来自内部的安全问题 ,云提供商必须防范用户的盗窃或拒绝服务攻击。用户需要彼此保护。当今的主要安全机制是虚拟化。这是一种强大的防御措施,可防止使用者攻击对方或底层云基础架构。不正确的网络虚拟化可能会允许用户代码访问提供商的敏感部分或其他用户的资源。但是任何大型Internet服务都需要确保单个安全漏洞不会损害其他所有功能。

图7 :虚拟化处理内部问题的方式之一。

———————– Page 15———————–
2.5 :资料传输瓶颈&性能不可预测性
现代云计算经常遇到资料传输瓶颈。如果我们设定过多的传输路径,则可能会使资料存储和传输复杂化。这些成本很快的加总,使传输成本成为一个新的问题。云用户和云提供商要想最小化成本,就必须考虑系统各个节点的布局和流量的影响。为了克服Internet传输成本高昂的一个方法是运送硬盘。亚马逊发现发送大量资料最便宜的方法是运送硬盘甚至整个电脑,可以有效地处理点对点传输的延迟和错误。

图8 :传输瓶颈示意

在云计算中,多个虚拟机器可以很好地共用CPU和主内存 ,但是网络和磁片I / O共用则存在许多问题。不同的程式在I / O性能上的变化很大,作者经过测量发现虚拟机器之间存在I / O干扰问题。改进方法可以是更新体系结构和作业系统 ,以有效地虚拟化中断和I / O通道。也可能通过快闪存储器减少I /O干扰。快闪存储器是一种半导体内存,在断电时可以像机械硬盘一样保留信息,但是由于它没有活动部件,因此存取速度更快,并且能耗更低。多个虚拟机器的I/O冲突可以更好地共存于同一台物理电脑上,而不会遇到机械磁片干扰。另一个问题是在大量处理问题时的虚拟机器调度。可以在云中的大型集群上运行这些任务,从而节省大量资金。

———————– Page 16———————–
2.6 :存储扩展&大型分布式系统中的错误
三个特性使得云计算具有吸引力,包括设备可扩展 ,无前期成本以及按需提供的无限容量。尽管将其应用于计算很简单,但是如何将其应用于持久性存储尚不清楚。作者认为实现高可用性的唯一可行解决方案是多个云计算提供商。但需要提供的性能保证以及可靠的一致性。通常可以创建一个存储系统满足现有程式设计师对持久性,高可用性以及管理和查询资料的能力。

图9 :设备可扩展性是云计算的重要特点之一

大型分布式系统中困难挑战之一就是消除系统中的错误。这些错误往往无法在较低的配置中重现,因此调试必须在数据中心大规模的进行。云计算中也可以依赖虚拟机器。许多传统的云计算提供商都在不使用虚拟机的情况下开发了其基础架构,这可能是因为它们早于虚拟机而流行,或是虚拟机的性能损失过大。

图10 :消除系统错误是大型系统的困难挑战之一

———————– Page 17———————–
2.7 :快速扩展&声誉维护与共用&软件许可
即付即用适用于存储和网络频宽。根据虚拟化级别,计算略有不同。GoogleAppEngine会根据负载的增加和减少自动进行调整 ,并由使用的周期向用户收费。即使您的电脑处于空闲状态, AWS也会按小时收取费用。然后有方法实现自动响应负载而快速地扩展 ,以节省资金。加州大学伯克利分校可靠性自适应分布式系统实验室广泛地使用统计机器学习作为诊断和预测工具,以实现动态扩展,对实际效果进行自动反应,以最小的经济代价获得最大的收益。

图11 :机器学习可作为云端自动扩展的工具

限制可以运行软件的电脑。用户购买软件,然后支付年度维护费。许多云计算提供商最初依赖于开源软件,部分原因是商务软件的许可与程式实际需求不符。开源仍然流行,使得云计算更为普及。

图12 :一份Windows许可秘钥

———————– Page 18———————–
3.2 :常见云计算平台分析
论文写于2009年,而经过十多年的发展,云计算平台已经产生了非常大的变化,本小节我们注重观察云计算市场 ,对他们共同的特点和各自的优势进行比较。

图13:部分云计算供应商,包括Amazon,Google和Alibaba

———————– Page 19———————–
3.1 :Amazon
官方网站:https://aws.amazon.com/
价格:在Amazon官网,支援用户自定义配置。我使用2核心,2GB内存 (硬盘,带宽另付)的配置,得出价格为0.0752美元(2.27台币 )每小时。
架构:Amazon的每个应用层单独收费,分别为服务器的费用,存储的费用,网络的费用和管理的费用。Amazon认为这种弹性计费方式会比传统方式更省钱。

图14:Amazon的付费架构
配套:在我查找相关资料的过程中,发现几乎所有的云供应商都支持CDN内容分发,高性能存储等扩展,这对公司开展配套业务是非常有利的。但是由于我们讨论的主要是云端运算,所以这些内容没有写入我们的报告内。

图15:部分Amazon的方案价格

———————– Page 20———————–
3.3 :Google&Alibaba
官方网站: https://cloud.google.com
价格:在GoogleCloud官网,我同样使用2核心,2GB内存,得出价格为0.0971美元(29.33台币 )每小时。
架构:Amazon的每个应用层单独收费,分别为服务器的费用,存储的费用,网络的费用和管理的费用。Amazon认为这种弹性计费方式会比传统方式更省钱。

图16:部分Google的方案价格

官方网站:https://cn.aliyun.com/
价格:在Alibaba官网,依旧是使用2核心,2GB内存,得出价格为0.65RMB(2.28台币 )每小时。

图17:部分Alibaba的方案价格

———————– Page 21———————–
3.4 :比较分析
我比较了几个常用的云平台架构,配置和收费方式。找出他们的异同点。

———————– Page 22———————–
4 :总结
云计算将持续增长 ,无论云提供商出售的是低层抽象的服务还是较高级别的服务,我们都认为计算,存储和网络必须具有多节点、可扩展的特性 ,而不是单节点的计算。此外,软件既需要快速增加配置,又需要快速降低配置。按使用者付费的许可满足现代云计算的需求。同样对于内容分发和安全性的需求也逐步显现。
基础架构软件在虚拟机中而不会在机器上直接运行。虚拟的空间提供了更多的扩展性,使得云计算的一些特性的实现成为可能。
我对主流的云计算厂商进行了功能和价格上的分析。它们大多提供多种付费方式,随意增删设备等特性,具备云计算的基本特性,但在负载均衡和价格上存在一些差异。

发表评论