该系列是由亚利桑那州大学(Arizona State University,下文简称ASU)和中国独家官方合作伙伴CinLearn职学教育携手推出的线上中文公开课系列。每一期公开课将邀请到校内或业内资深讲师、从业者,围绕学科及相关领域的话题,为学员们进行定制化分享会。
近几年,“云计算”可谓是IT业界热词之一。根据中国信通院2022年发布的《云计算白皮书》显示,中国的云计算自2021年起就处于快速发展的阶段,并持续保持高速增长的趋势。其实远不止IT领域。近年来,从在线学习、直播购物到在线办公,毫不夸张地说,在不断进行数字化转型的过程中,云计划正在给人类社会带来一场全新变革。
本期公开课,CinLearn邀请亚利桑那州立大学(Arizona State University, 以下简称ASU)艾拉·富尔顿工程学院讲师,同时也是ASU在线中文硕士项目“计算机与科技工程硕士”课程的讲师之一的邓宇立博士(Dr. Yuli Deng)来浅聊一下这个即将带来巨大改变的“云计算”, 以及与之息息相关的“虚拟化”。
邓宇立博士(Dr. Yuli Deng)
从硬件开发商、软件开发商、互联网服务提供商(阿里、百度、亚马逊等)到电信运营商,几乎所有主流IT厂商都在谈论“云计算”。而正是这些覆盖了整个IT产业链的企业,构建了一个完整的云计算生态。
关于“云计算”的定义有很多。这个词的雏形是由“人工智能之父”约翰·麦卡锡提出的“Utility as a service”,即公共计算服务。他的愿景是将计算、服务和应用作为一种公共设施提供给公众,而人们可以像使用基础设施一样使用计算机资源。他认为将来终端用户只需拥有一个设备,即可通过连接公共资源池而获取资源。
作为学术机构,ASU的“计算机与科技工程硕士”课程中所采用的是美国国家标准与技术研究所NIST(National Institute of Standards and Safety)的定义,即云计算是一个模型,用来实现对已经配置好的计算资源(网络/服务器/存储/应用程序/服务)的高效、方便、按需的访问。这些计算资源可以快速地获取和释放,同时管理成本极低,而且与供应商的沟通成本基本为零。
在此定义的基础上,NIST对云计算从特征、服务模型及部署模式3个方面进行了更为详细的总结。
首先,云计算具备5大特征:
1) 自助式服务。用户可按自己的需求,独自完成计算机资源的获取;
2) 完善的网络支持。计算资源采用标准的协议通过网络访问,从而保证各种客户端都可实现对计算资源的访问;
3) 资源整合。供应商使用多租户模型,将计算资源合并为资源池,以对多用户提供服务。根据客户的需求,资源池中的计算资源可被动态分配或重新分配给不同用户;
4) 快速伸缩。计算资源可快速获取或释放;且在时间上和数量上可实现灵活配置;
5) 服务可计量。对服务的各项指标进行监控,云系统可自动对资源的使用进行调整和优化。这一特点在实操上具有一定的挑战。根据服务模式的不同,云计算可以分为IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)3种。随着技术不断发展,现在还有许多衍生服务模式,例如DBaaS(数据库即服务)、FaaS(功能即服务)等,统称为X即服务。至于部署模型,可分为公共云,私有云以及混合云。
从20世纪60年代的概念提出后,直到2006年3月亚马逊推出了弹性计算云服务(AWS EC2),云计算才算实际“登场”了。但当时亚马逊还称之为“亚马逊网络服务”。同年8月,谷歌首席执行官埃里克·施密特在搜索引擎大会首次提出了“云计算”的概念。随后,谷歌、IBM、雅虎、英特尔等企业也陆续开始推广云计算。
在云计算不断发展的过程中,不得不提到“OpenStack”开放源代码计划。
2010年7月,美国国家航空航天局和包括Rackspace、AMD、Intel、戴尔等厂商共同支持宣布了OpenStack开放源代码计划,旨在通过在任何一台具备计算能力的设备上安装OpenStack之后,即可搭建自主云计算平台。它基本复制了所有亚马逊平台的功能,但是一个完全开源的项目。作为目前第3大的开源基金会,这个项目至今仍是极其活跃的开源平台。我们熟悉的一些国内公司在早期都在OpenStack投入了很多精力。
云计算持续高速的发展,从技术层和经济两个层面考量,都有其持续发展的必然推动力。
从经济利益角度来说,IT基础设施利用率低下,数据中心能耗问题突出,以及IT管理和维护成本的提高,成了云计算推广的助力。例如谷歌、亚马逊发现他们搭建的大型数据计算中心,每年平日使用率较低,仅有个别节日期使用频率较高,因此萌生了云计算能力租借的想法。
另一方面,从技术发展角度而言,网络的普及、宽带的提速,以及浏览器开发技术的进步等因素,让终端用户的使用变得越来越便捷。而其中最重要的一点,就是虚拟化技术的应用。
虚拟化技术(Virtualization),是将计算机物理资源(如服务器、网络、内存及存储等)予以抽象、转换后呈现出来,使用户可以采用比原本的组态更好的方式应用这些资源。而这些资源的新虚拟部分是不受现有资源的假设方式、地域或物理组态所限制的。
举个简单的例子。一台物理机上有24核的CPU、128G的内存和2TB的硬盘。虚拟化技术可以将这台物理机拆解为几十台小的虚拟机,再出借给更多不同需求的云计算用户。这就是将一部分硬件技术转化为异构的虚拟资源池,并对这个资源池进行任意的切分。
虚拟化包括计算机虚拟化、存储虚拟化及网络虚拟化。我们经常使用的百度云盘、云上贵州等云存储软件就是存储虚拟化的一种形式。与传统的内容存储方式相比,存储云更容易扩容、易于管理、成本低廉,数据也不易丢失。但也存在需要面临的挑战,包括保障数据的安全以及对海量数据进行管理等。更多内容,我也将在我们的线上中文硕士课程里详细介绍。
Q: 有高数基础,学习这个项目难度是否很大?毕业是否需要完成大型项目或论文?
A: 没有专门的毕业项目。除了《技术创业》和《算法基础》两门课程之外,每门课程都有各自的课程项目。也就是说,在每门课程的学习中,都会有一个课程项目帮助大家进行实践。这些项目都不会是长期制的,而是每门课程单独的。
关于数学基础这部分,推荐大家先学习《前沿计算技术》这门课程,因为其实计算机科学并不需要太多高等数学的内容,而更多需要统计学、概率论等方面的知识。特别是在进行人工智能学习和大数据处理的时候,概率论是比较重的一个背景内容。
虽然每门课程都会有各自的项目,但也都会根据不同教授的要求而异。云计算这门课程有3个小项目,都是相辅相成的。这3个项目分别在学期开始、学期中和学期末进行。虽然不会有大的论文写作,但是会要求大家提交3-4页的项目报告,作为大家在实践过程中的总结。
Q: 未来的课程中,关于“人工智能”方面的占比重吗?
A: 当前的课程设置是每学期1门课程,大家也都可以根据自己的兴趣选择。在课程当中,《人工智能》、《基于统计学的机器学习》、《社交媒体挖掘》、《大数据可视化》以及《大规模数据处理》这5门课程都适合“人工智能”高度相关的。
Q: 针对未来就业方向是数据安全方向的,在这个项目上会有哪些课呢?
A: 比较主要的是在《软件安全性》和《高级计算机网络》这两门课。直接和“安全性”相关的是《软件安全性》这门课程,它主要讲的是服务器安全;在《高级计算机网络》这门课里,也会提到网络安全的内容。另外,在《软件基础》里也会有基本的软件安全常识。
Q: 如果没有计算机学习的基础,但未来希望在这个领域里面有深入发展,是否适合从这个项目课程学起?如果不适合,您有什么建议吗?
A: 可以尝试从《前沿计算机技术》这门课开始入手,这门课大比重是涉及到课程日后需要用的数学基础和工程技术,例如基本的计算机网络、计算机图形的概念、计算机编程(主要是Python使用)的技术等。如果能顺利完成这门课,那之后的学习就不会有太大问题。
如果这门课的完成比较困难,那可以了解一下需要补充哪一方面的知识。但这个项目并不要求特别强的编程能力。除了《算法基础》会涉及到大量数据结构、设计架构等的讲解。其他方面,例如Python编程,其实每门课会使用不一样的“库”。你只要会调用这些“库”,并读懂这些“库”的文档,知道什么是输出和输入,基本就完成这些课程了。
Q: 如何看待中国云生态的发展前景呢?中国企业的用户上云和海外企业的用户上云的最大区别是什么呢?
A: 我对国内企业的云生态了解还停留在比较早期,之前阿里云是占了比较大的云计算份额。但是后来就渐渐进入一些专有云服务。比如说,财务管理或者物流,都有专门相关的云。这让更多中小企业更愿意去找相对应功能的云平台,而不是去找像阿里云这样的通用性云平台去搭建自己的系统,因为这些企业也缺乏这样的能力。
海外的话,更多是出于需求去决定是否上云。比如说,初创企业基本会选择上云,因为成本较低。等到后期做大之后,例如迪士尼早期就是用AWS云平台做媒体串流。随着使用量上升,他们搭建自己数据中心成本要低于使用亚马逊平台的时候,从成本角度考量,他们会去选择搭建自己的云平台或是下云。
感觉是这样一个趋势:国内也是因为软件企业做得比较彻底,云功能开发出来之后,大家才会选择上云。而国外更多是出于早期成本考量,大家会选择用公共云;但成本越来越高之后,他们才会转向私有云。
Q: 如何基于虚拟储存技术构建容灾备份系统?是否会受到一些区域的安全影响呢?
A: 容灾备份系统的“灾”,一般定义为自然灾害,这和地理位置是高度相关的。虚拟存储可以跨地理位置,将多个数据中心的存储容量进行共享。例如,在百度云上存储了一首歌,是有地理备份的。它可以存在上海,同时又在四川或者贵州又有一个备份。这种情况下,它就可以规避地域性的自然灾害。
Q: 如何运用异构虚拟化来帮助企业数据管理和数据保护,提升数据安全性?
A: “异构虚拟化”的目的是将不同的存储介质统合成一个存储资源池。当你在做这个整合的过程中,就需要去考虑如何去进行数据管理和保护数据安全。其实这两部分是比较对立的。这个解释起来相对复杂,但是在课程中我们会逐一介绍各种各样的具体技术,讲解如何通过虚拟化技术既达成资源池整合,又保证方便终端用户做数据管理及其安全性。
Q: 硕士和博士的计算机科学技术有什么区别呢?都要学编程吗?博士毕业后,就业方向可以有哪些选择?
A: 首先,ASU的这门在线课程是以课本理论为基础的设置,没有科研的要求,只要大家能够按照讲师们的指导和要求完成相应任务,是可以顺利拿到学位的。博士的话,ASU的博士前两年也是要上课的。如果在没有硕士学位的情况下申请博士,需要提前完成16门课程的学习。对于选择我们这个项目的同学,你也可以在学习的同时考虑一下是否想要博士学习,因为我们这个项目可以豁免16门课中10门课的学习。这部分学习作为博士课程的先导内容,完成之后就可以去和博士生导师去讨论你想研究的具体课题。在确定课题到开题的过程中,博士生导师都会给予一定的指导,但因为这是一个研究过程,因此没有一个固定的答案,你需要自己去寻找这个答案。
关于就业,我身边的博士生同学将近一半会选择去企业。像硅谷,企业大多数都会设有研究性部门,他们主要招收一些博士生,因为他们要解决的可能不仅仅是工程问题。另外一半毕业,例如我自己,就会选择去学校教书授课。
关闭