立即购买
赛智时代:国外智能计算中心对标研究
  • 赛智时代:国外智能计算中心对标研究

    Innov100
    2021-04-01 15:17:47
  • 摘要:以人工智能新型计算能力为代表的智能计算中心是新型基础设施建设的重要组成部分。目前,国外正争先建设大规模智能计算中心,建设大规模智能计算中心成为推动人工智能产业进一步发展的关键要素。通过对国外智能计算中心的研究,为我国发展智能计算中心得出启示。

    一、智能计算中心定义

    智能计算中心是基于最新人工智能理论,采用领先的人工智能计算架构,提供人工智能应用所需算力服务、数据服务和算法服务的公共算力新型基础设施,通过算力的生产、聚合、调度和释放,高效支撑数据开放共享、智能生态建设、产业创新聚集。

    随着人工智能技术的日新月异,人工智能计算中心开始转向规模化建设。规模化建设的需求主要来自于人工智能算法愈加复杂、模型规模提升,视频、语音、图片等非结构化数据指数级增加,人工智能与5G、物联网等行业应用结合,促使算力需求也呈指数级增长。

    此外,人工智能计算中心还向云计算、量子计算等领域延伸,从目前国外智能计算中心最新发展情况看,智能计算中心不仅包括人工智能,还向超算中心、量子计算中心拓展。建设和发展智能计算中心,不仅将进一步提升算力供给,还将为大规模算法、模型基础理论研究、复杂智能化计算引擎发展、人工智能应用商业落地、技术研发创新形成条件支撑,并促进人工智能硬件、软件、云服务之间协同生态发展。智能计算中心作为新型算力公共基础设施,将促进行业应用基础能力转化为人工智能技术,助推实体经济进行新旧动能转换,为行业应用赋能,为推动人工智能科研和工程技术人才培养方面发挥重要作用。

    二、国外智能计算中心发展情况

    (一)美国在智能计算领域处于国际前列

    美国在智能计算领域处于国际前列,其智能超算中心布局可基本分为三大体系:美国能源部下属六大国家实验室、美国国家科学基金会支持的依托高校的智能超算中心、美国航空航天局(NASA)下属的Ames研究中心超级计算中心。

    美国能源部智能计算中心在构思、设计、建造及运维方面全球领先。美国能源部(DOE)下属的橡树岭国家实验室、劳伦斯·利弗莫尔国家实验室以及IBM、NVIDIA公司成立超级计算机卓越实验中心,联合开发新一代HPC计算机,使用IBM的Power处理器及NVIDIA的Teslak加速卡,浮点性能至少10亿亿次,最高的可达30亿亿次,主要研究核武器、核安全、天文、能源、气候、宇宙、新能源等领域。

    美国国家科学基金会通过与美国高校及研究机构合作,为全世界科学家提供免费的、最高性能的超级计算资源,在伊利诺伊大学、加州大学圣地亚哥分校、西纳西大学等高校布局。由美国国家科学基金会资助的美国最大的公共超级计算中心是美国国家超级计算应用中心,业务主机为Abe。美国德克萨斯高级计算中心主要研究领域为可视化工具、教育、县级计算、数据管理,业务主机为Stampede。

    美国航空航天局(NASA)下属的Ames研究中心超级计算中心,主要应用于天文、航天、气候、军事等领域,如模拟未来太空任务、预测人类活动对气候模型影响、设计安全高效的太空探索工具和航天器等。

    随着相关技术的扩大和升级,智能计算中心开始布局量子计算。2020年7月,美国白宫科学技术政策办公室和美国国家科学基金会(NSF)宣布投资7500万美元在全国建立三个量子计算中心。新的量子飞跃挑战研究所(Quantum Leap Challenge Institutes,QLCI)将获得2500万美元的资金用于量子计算领域的研究和开发,开发量子计算领域的内容,以帮助增加该领域的人才储备,带动该领域发展。三个量子计算中心将分别建立在不同的大学,且每个中心所攻坚的方向不尽相同。中心一建立在加州大学伯克利分校,主要负责解决当前以及未来量子计算面临的问题;中心二建立在伊利诺伊大学厄巴纳-香槟分校,将专注于混合量子结构和网络的研究;中心三将建立在科罗拉多大学,其主要研究方向是量子传感器,该研究的目的是帮助各领域进行更精确的测量。   

    美国互联网企业也在布局量子计算中心。2020年8月,亚马逊宣布全面上市量子计算管理服务平台Braket,这是一个探索和设计新颖的量子算法开发环境全面管理的亚马逊网络服务(AWS)的产品。客户可以点击Braket(在去年12月的预览版中启动)来对在云中运行的模拟量子计算机上的算法进行测试和故障排除,以帮助验证其实现,然后在D-Wave,IonQ和Rigetti的系统中的量子处理器上运行这些算法。

    美国企业智能计算中心注重绿色环保。2020年4月,谷歌宣布致力于让所有数据中心实现24/7无碳能源目标,其碳智能计算平台将帮助谷歌根据计算负载来匹配风能和太阳能等清洁能源。

    (二)欧盟聚焦数字主权布局超算和量子计算

    2019年6月,欧盟委员会发布了《欧洲高性能计算共同计划(EuroHPC)》,宣布将在欧盟成员国中选定8处地点建设“世界级”超级计算机中心,项目总预算高达8.4亿欧元,将用于个性化医疗、药物和材料设计、生物工程、天气预报及气候变化等领域,服务对象包括欧洲学术界、工业界和公共部门等各类用户。这一举措标志着欧洲朝着成为全球顶级超级计算区域迈出了重要的一步。“欧洲高性能计算共同计划”致力于联合欧盟各国建设世界级的超级计算基础设施,在超算系统及应用性能等方面打造具有高度竞争力和创新性的高性能计算生态环境。

    随着人工智能技术的迅速发展,智能制造、智能驾驶等领域对数据存储、流通和共享的需求迅速提升。欧盟必须加强在云计算基础设施上的投入,将人工智能等领域的应用以及重要的数据存储与传输掌握在自己手中,实现欧盟的“数据主权”。2020年10月,欧洲云计算平台“GAIA-X”项目正式发布,旨在为欧洲提供“强大、具有竞争力、安全可靠的数据存储基础设施”,以减少整个欧洲对国外云厂商的依赖。GAIA-X云计算平台将于2021年正式上线。2019年4月,欧盟设立一项新的92亿欧元资助计划——“数字欧洲计划(DigitalEuropeProgramme)”,以确保欧洲应对各种数字挑战有具备所需的技能和基础设施。2020年12月,欧盟拟为“数字欧洲”计划拨付75亿欧元,其中22亿欧元用于超级计算,21亿欧元用于人工智能。该计划具体包括:在2021年底前至少收购1台百万兆级超级计算机;在健康、制造和能源等领域建立可用于人工智能的全欧数据空间及测试设施;部署泛欧量子通信基础架构并支持建立网络安全产品认证计划;专设人工智能、高级计算和网络安全硕士计划等。

    目前,欧洲的云计算数据存储主要依靠非欧盟企业,如亚马逊、微软、谷歌、IBM、阿里云、腾讯云等云计算行业巨头。西门子MindSphere工业互联网平台云基础设施服务主要依赖亚马逊AWS和微软;雷诺、德意志银行和汉莎航空依赖谷歌云;大众汽车与AWS签署了云计算服务协议;法国卫生部选择微软公司来存放其研究数据;阿里云与沃达丰达成战略合作布局德国数据中心,并与西门子合作将MindSphere工业物联网操作系统将部署在阿里云上,共同发展中国的工业物联网;腾讯云联合SAP、西门子等软件厂商着手于打造细分领域的解决方案等。

    2020年3月,欧盟资助的GREENDC项目正在开发新的技术方案来降低数据中心碳排放强度,以应对全球数据中心日益增长的能源消耗和温室气体排放所带来的严峻挑战。该项目汇集了来自英国、保加利亚和土耳其的5个学术、工业联合团体,其宗旨正是有效降低能耗,创建更加绿色环保的数据中心。2021年1月,欧洲范围内的25个数据中心服务商与云供应商,以及17个协会共同签署一项协议,即到2030年使欧洲数据中心在能源消耗上保持中立,实现气候中和目标,这是确保该行业长期可持续发展的重大努力。

    2020年9月18日,为加强欧洲的数字主权,欧委会针对欧洲高性能计算联合执行体(EuroHPCJU)发布了新章程,拟投资80亿欧元支持以百亿亿次计算和量子计算为主的新一代超级计算技术和系统的研究和创新,并培养必备的基础设施使用技能,为欧洲打造世界级的超算生态系统奠定基础,维持并提升欧洲在超算和量子计算领域的领先水平。EuroHPC主要聚焦5大核心领域,分别是基础设施、超算服务的联合、技术、应用,不断拓展的用途与技能。

    表1 五大核心领域重点内容

    (三)英国成立国家计算能力中心和量子计算中心

     2021年3月,英国科学技术设施委员会(STFC)哈特里中心宣布将联合爱丁堡大学超级计算中心(EPCC)在英国创建一个国家计算能力中心,命名为EuroCC@UK,成为由欧洲委员会资助的欧洲30多个国家能力中心组成的新网络的一部分。STFC表示,该项目将向公共部门、学术界和工业界开放,支持人工智能研究和创新。该网络将提供一个分享先进计算的最佳实践和专业知识的平台,高性能计算(HPC)、高性能数据分析(HPDA)和人工智能成为重点技术领域。EuroCC@UK将展示英国目前的专业知识,并开发培训、软件支持和行业参与项目。中小企业将从这些技术和项目中受益。同时,EuroCC@UK还将开展理念创新活动,保持英国的科学和工业研究社区参与欧洲高性能计算。

    2020年,英国研究与创新局(UK Research and Innovation)宣布将在5年内提供9300万英镑的资金,建设量子计算中心。量子计算中心将在伯明翰、格拉斯哥、牛津和约克的四个大学进行建设,中心将建在牛津南部的哈威尔校区,建筑预算为3000万英镑,总共将有17所大学和132家公司参与其中,校园已经具备足够的电力容量和其他基础设施。该量子计算中心将有助于加快相关硬件和软件的开发,以支持英国计算中心产业和更广泛的最终用户群体的发展。

    (四)新加坡建立智能计算中心

    2016年新加坡建立国家超级计算中心,提供新加坡最先进的计算、数据和资源设施,支持用户解决科学技术问题,促进行业利用计算机解决问题、试验设计、并优化技术。通过高速宽带网络联接资源,力求在任何地方都能够为所有的用户提供高速的使用体验。

    2020年12月德国英飞凌半导体公司宣布将在未来三年内斥资2020万美元在新加坡建立全球首个人工智能中心。这笔投资将用于基础设施建设、人工智能项目、员工培训以及开展合作。根据规划,1000多名员工将接受人工智能技能培训,目标在2023年前启动25个这一新兴技术的项目。新加坡创新机构(SGInnovate)、起步公司、高等学府以及研究机构在新的人工智能应用领域可以利用英飞凌的丰富数据为实际问题开发解决方案。英飞凌也与新加坡国立大学系统科学院(NUS-ISS)以及新加坡全国人工智能核心(AI Singapore)合作,培养新一代的员工和创新者。英飞凌特别表示数字化转型不会导致人员配置出现任何变化,而且数字化转型计划的目的是为了让现有员工能够在所有业务功能中开发提升能力,部署AI解决方案,并协助AI成为未来50年公司的基柱。

    三、对我国智能计算中心建设的启示

    (一)兼顾人工智能、超算中心功能,积极发展量子计算

    从美国、欧盟、英国、新加坡的实践来看,智能机计算中心不仅局限于人工智能,同时发展超算中心、积极发展量子计算。人工智能计算中心的发展,面临AI算力能耗密度大、成本高、硬件基础设施和软件基础设施等问题,仅仅发展人工智能计算中心不能满足庞大的算力需求,因此还需要发展超算中心、量子计算中心。量子计算领域的研究和开发,将开发量子计算领域的内容,帮助增加该领域的人才储备,带动该领域持续发展。未来人工智能计算中心的建设,将以人工智能理论、技术和应用为支撑,同时兼顾超算中心、量子计算功能,可以配套建设为企业提供普惠算力的公共计算服务平台。

    (二)立足长期发展需求提升人工智能算力生产供应

    人工智能带来的算力需求已经远超摩尔定律,各类AI芯片正在加速适应人工智能的算法和算力需求特征。然而,不同的AI芯片设计与实现方式不同,AI芯片企业应当从芯片/硬件、软件SDK到终端应用进行精细化匹配,以发挥硬件的最大算力。例如,谷歌把TensorFlow与其人工智能专用芯片TPU绑定式设计协同优化;英伟达的CUDAAI开发框架将GPU与上层软件优化衔接,充分挖掘和发挥GPU的硬供服务能力。2020年7月30日,MLPerf Training v0.7发布结果也显示,人工智能专用芯片及软硬件结合的优化大幅提升了人工智能计算效率。

    超算中心拥有支撑人工智能算力的能力,目前,将人工智能技术融入超级计算系统已经成为一种趋势,越来越多的超算系统针对人工智能设计了低精度算术逻辑单元,以支撑人工智能计算能力需求,在应用驱动下,人工智能将在医疗诊断、天文探测、地震预测等领域快速发展。随着云计算的成熟,以云化计算中心构建人工智能算力服务,对用户提供统一架构、统一服务和统一API,降低人工智能服务的使用门槛。同时,云化计算中心提供服务器、虚拟机、容器等多样化的算力资源,并使得人工智能服务与云上大数据、物联网、边缘计算等服务的相互协同,能够满足新型应用场景综合复杂多层次的计算需求。

    (三)以智能计算中心为主体推动数据共享开放打通数据生态

    在智能时代,计算力就是核心动力。智能计算中心通过构建领先的AI算力基础设施,不仅承载智能化技术创新,还能促进数据开放共享。以智能计算中心为主体,汇聚各行业领域数据资源,推动教育、医疗、能源、公共安全等领域数据的内部整合、共享和开放,支撑人工智能与政府服务、企业服务的融合,提升智能化水平。鼓励相关企事业单位联合人工智能企业围绕应用场景进行人工智能服务,推动数据共享开放,实现海量数据开放共享,加速智能生态建设,带动智能产业的聚合产生经济和社会价值,全面提升AI算法训练数据质量,使沉淀的数据资源在各个应用场景中实现价值最大化,打通数据生态。

    (四)围绕智能计算中心打造区域人才培养创新基地

    从美国、欧盟、英国、新加坡的实践来看,注重围绕智能计算中心打造区域人才培养创新基地,为智能计算中心的技术研发提供人才保障。智能计算中心需要大量的智力资源、人才资源支持,因此可以鼓励高校院所联合行业龙头企业,采用产、学、研合作模式创新科研机制,围绕智能计算中心的算力资源开展人工智能技术研发、科技成果转化等。同时加强人工智能、云计算、量子科技等方面的学科建设,支持高校设立相关专业,引导企业、科研院所参与高校人工智能学科建设,增强人工智能、云计算、量子科技等基础理论与前沿技术领域的研究力量。加强人工智能引才计划,大力引进人工智能基础理论、关键技术等领域的紧缺人才和高水平团队,引进人工智能领域的创新型人才,在人工智能、云计算、量子科技等领域发展培育一批具有潜力的人工智能青年领军人才和科学家。鼓励科创企业、科研机构和传统企业发挥各自在人工智能智能、云计算方面的技术优势、加速AI应用场景落地,助力传统产业转型升级,优化公共服务供给。

    (五)注重计算中心绿色环保和碳中和

    从美国、欧盟的智能计算中心来看,正在开发新的技术方案降低数据中心碳排放强度,从而应对计算中心日益增长的能源消耗和温室气体排放所带来的环境污染问题。建设智能计算中心需要考虑能源消耗和温室气体排放问题,提高计算中心的能源效率等,注重计算中心绿色环保,实现碳中和。

    注:本文摘自赛智时代智能计算中心课题组冯诗楠、周君、冯姣姣完成的研究报告,详细内容请点击饮鹿网产业报告栏目阅读。

    ▎本文系Innov100原创文章,转载请标明出处。

    更多精彩内容请登录https://www.innov100.com官方网站

    或扫描下方二维码,点击关注微信公众号(ID:sagetimes)


  • 点赞点赞(0)

数据服务
月报系列
咨询服务
培训服务