新浪新闻客户端

速石科技跻身全球超算TOP500,仅花4小时5500美元

速石科技跻身全球超算TOP500,仅花4小时5500美元
2019年11月20日 17:58 新浪网 作者 砍柴网

   2019年11月19日,第54期全球超算TOP500榜单公布,多云算力运营平台——速石科技(fastone),以HPL值1.1626 Petaflops,第482名的成绩进入榜单,成为全球第二,亚洲唯一一家用云算力跻身超级计算机队伍的公司。

  速石科技仅用4个小时,花费5530美元,使用公司自研的fastone软件平台,Amazon Linux 2的操作系统,构建了多达41472个核的超大规模集群。使用的算力资源是AWS北美区的低成本Spot实例,CPU型号为Xeon Platinum8124M 18C 3GHz。

  速石科技跻身全球超算TOP500,仅花4小时5500美元

  全球超级计算机TOP500项目是针对全球已知最强大的电脑系统做出排名与详细介绍。开始于1993年,至今已经持续26年,一年出版两次最新超级计算机排名列表,旨在提供一个可靠的基础追踪与侦测高性能计算的趋势。TOP500的评价标准是计算速度,准确地说是High Performance Linpack (HPL)指标值,即每秒能够执行多少次浮点运算。1 Petaflops=每秒一千万亿次浮点运算。

  云算力比肩传统超级计算中心

  TOP500榜单主要由国家实验室,国家超级计算中心,全球最知名的几家硬件厂商,比如英特尔组成。最新榜单排名第一位的是美国能源部下属橡树岭国家实验室开发的Summit(顶点)超级计算机,每秒14.86亿亿次的浮点运算速度,美国能源部下属劳伦斯利弗莫尔国家实验室开发的Sierra(山脊)、中国超算神威·太湖之光和天河二号分列二三四位。

  速石科技是全球第二,亚洲唯一一家完全用公有云算力跻身超级计算机榜单的公司。云已经成长到能够完成这些原本是昂贵的超级计算机才能完成的事。

  相比传统超级计算中心,时间和花费几乎可忽略不计

  速石一共只花了5530美元,跑了4个小时,远远低于TOP500榜单上其他各种组织所需的成本。按4万个核假设:每台机器按36个核算,共1111台机器。每台机器20万,就已经高达大约2.2亿元人民币。这还只是机器,没有考虑网络,安装,人力等等。另外,还有6-12个月甚至更长的等待时间。

  速石拥有在云上短时间组织和配置超大规模集群的能力

  1、大规模集群按需启动,即启即用

  仅用数分钟就能完成部署应用,准备数据,运行集群整个过程。

  2、大规模集群动态监控能力

  速石平台集成了对每个节点状态的监控,包括CPU,内存和网络的状态利用率的监控。这些监控指标会被汇总,并通过统一的观察界面展示,这让我们可以迅速定位瓶颈,调整任务的参数或者改变配置来获得更好的结果。

  3、大规模集群动态调优能力让整个过程资源利用率得到了优化

  由于整个构建过程可定制的特点,我们可以很方便地修改参数,例如系统和MPI级别的一些参数。如果没有自动化工具的帮助,修改数千个节点将会耗费相当的时间和精力。而通过速石的自动化调度平台,1152个节点仅用数分钟就完成了新参数的修改,可以很快、很经济地验证参数是否符合预期。

  4、自动识别并采用低成本实例的能力

  这次计算全部采用Spot节点进行。平台对抢占可能性做出了预判,选择了抢占可能性比较小,但又有足够资源的区域进行。在整个过程中没有遇到被抢占导致的任务失败。

  速石科技专为有高算力需求的企业级用户提供一站式算力运营解决方案,帮助用户提升10-20倍业务运算效率,降低成本达到75%以上,加快市场响应速度。关于算力,我们拼的不是速度,我们关心的是怎么帮助用户获取到这些算力。

  目前公司主要业务领域包括药物研发、基因测序分析、半导体行业的EDA仿真及电路设计、汽车行业的自动驾驶开发、虚拟碰撞试验以及AI人工智能。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
超算浮点运算
权利保护声明页/Notice to Right Holders

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有