找回密码
 立即注册
查看: 52|回复: 1

架起科学数据到科学发明桥梁,曙光宣布年夜数据引擎

[复制链接]

1462

主题

1462

帖子

4388

积分

金牌会员

Rank: 6Rank: 6

积分
4388
发表于 2017-1-18 10:34:10 | 显示全部楼层 |阅读模式
10月28日,在全国高机能盘算学术年会(HPC China 2016)上,我国领先的信息体系综合办事商中科曙光宣布了全球首个“科学年夜数据引擎”,旨在辅助当局部分、科研院所、教导机构、行业技巧立异中间、年夜型企业研发部分等用户向年夜数据研讨方面转型,增进数据密集型盘算架构在各行业范畴的立异成长和深刻利用。曙光公司总裁历军说,科学年夜数据引擎集成了曙光在高机能盘算、海量数据存储和年夜数据处置剖析技巧等范畴的上风资本,以积极应对科学年夜数据成长对传统HPC体系提出的挑衅。
“科学年夜数据的时期已经到临。”曙光公司总裁历军先容说,数字化过程正在激发分歧行业范畴的群体性技巧革命,已经深刻到IT互联网、科学研讨、产业制作、现代农业、办事业等各个利用场景,有力地带动了财产进级和技巧改革。而年夜数据技巧给科学研讨带来的影响更为深远—科学发明将越来越依靠数据密集型盘算来驱动。今天,年夜数据研讨已经成为继理论、试验和盘算模仿之后的第四种科学范式,在新型资料、生物基因、精准医学、地球科学、生态情况、卫星远感、天文、空间地舆、高能物理、现代农业等诸多范畴受到宽大科研职员的高度器重。
4034970a304e251f868d4abcae86c9177f3e537f.jpg
(曙光宣布全球首个“科学年夜数据引擎”)
面向科学年夜数据应时而动
“科学研讨正酿成一个又一个年夜数据题目。”曙光公司高机能产物事业部总工程师戴荣举例说,“千人基因组打算”每月发生1万亿条碱基序列信息,我国30多个在轨平易近用航天平台每年有跨越3PB远感卫星数据,FAST 射电千里镜的数据产出速度是6000亿笔记录/年,年夜型强子对撞机试验每年发生15PB原始数据……“将来,基于对科学年夜数据的处置和剖析将成为发明新常识的基础特点。”
实在,客岁8月底,国务院就宣布了《增进年夜数据成长举动纲领》,明白提出要成长科学年夜数据,以实现科学数据的开放共享和利用办事。本年7月,《十三五国度科技立异计划》进一步明白了多个重点范畴的年夜数据成长计划,好比在人工智能方面,要“重点成长年夜数据驱动的类人智能技巧方式”;在资料基因工程方面,要研发“资料年夜数据”等四年夜要害技巧;在进步前辈高效生物技巧方面,要加速推动“生物年夜数据”等性命科学前沿要害技巧冲破;在生态环保方面,要开辟“生态情况年夜数据”利用技巧;在精准医学方面,要树立“国度生物医学年夜数据共享平台”;在空天探测开辟和应用方面,开展“多源多标准时空年夜数据剖析与地球体系模仿”等焦点要害技巧研讨及示范利用。
科学年夜数据的海量、多源、异构、高维等特点,向传统HPC体系倡议了全新的挑衅。“大都科研项目标数据量很是宏大并快速变更,并且往往是散布、异构的,传统的数据治理模式已不克不及知足须要;此外对科学年夜数据的‘盘算’包含了从数据获取、治理到剖析、可视化的全进程,传统的高机能盘算亟需将办事向外延拓展。”戴荣说明说。
作为出生于科研国度队、多年办事于科研范畴的HPC领军企业,曙光灵敏地洞察到科学年夜数据的将来远景及其对“盘算-存储-剖析”架构提出的更高请求,率先将“鼎力成长科学年夜数据”列进公司“数据中国加快打算”计谋,为科学年夜数据引擎的进一步开辟和程度进步供给了有力的保障。
走向融会的盘算模式
针对科学年夜数据的行业利用特点,曙光以为,科学年夜数据引擎将实现盘算存储剖析一体化,充任衔接数据源和营业利用的“黑匣子”,完成对数据的清洗转换、存储与治理、数据处置与发掘、数据剖析及可视化等工作,架起从科学数据到科学发明的桥梁。
据戴荣先容,在科学年夜数据引擎的“黑匣子”里,安排着曙光全系列数据盘算技巧及办事产物,重要由5个引擎组件组成,它们分辨是:针对海量非构造化数据的曙光ParaStor并行存储体系、类型丰盛的曙光高机能盘算平台、最年夜化晋升体系整体效能的曙光深度进修盘算平台、高效灵敏的曙光XData年夜数据处置平台以及能笼罩科学年夜数据中间全性命周期的曙光 EasyOP运维治理平台。
“科学年夜数据引擎融会了高机能盘算、云盘算、认知盘算、年夜数据剖析等多种模式,是高机能盘算与数据剖析发掘的有机联合,可为科研工作者供给一个实现科学数据存储、剖析和治理的一体化解决计划。”戴荣评价说。 曙光的科学年夜数据引擎拥有以下六个亮点特点:
1.专门为科学数据处置流程进行优化,供给“盘算、存储、剖析、运维”一体化强劲机能;
2.基于曙光奇特的超融会架构,机动支撑高机能盘算、年夜数据盘算、深度进修盘算等多种盘算模式;
3.超强弹性设计,最高支撑E级超算体系立体扩大;
4.可构建EB级单一存储空间,是颠末验证的国内乱最年夜存储体系;
5.支撑PB级数据处置才能,可实现亿级数据库毫秒级极速查询剖析;
6.可为上万节点供给7*24小时在线、移动、及时主动监控办事。
共建科学年夜数据开放生态
曙光“科学年夜数据引擎”固然方才宣布,但曙光在多年的HPC技巧办事工作中已经形成了一套全流程、一体化数据处置技巧系统,今朝已经在多个年夜科学项目上开展了利用。
安排在贵州黔东南地域的世界最年夜口径单体射电千里镜FAST,天天要发生5TB摆布的数据,数据须要保存10年以上。曙光安排的超算体系就将承担起海量天文数据整合剖析、天体剖析和发掘、天文年夜数据的可视化等工作,推进天文科学研讨和摸索由假设驱动向数据驱动改变。
此外,曙光于客岁与中科院年夜气鼓鼓物理所结合安排的“地球数值模仿装配”原型体系,也将为地球科学年夜数据充任“盘算处置引擎”;本年还联袂中科星图、中科三清等分辨成长空天年夜数据利用和生态情况年夜数据利用。
今朝来看,科学年夜数据在中国的利用成长还处于起步阶段,在推进年夜科学研讨、增进各行业范畴科学发明和技巧立异方面有着很是年夜的潜力,但同时也面对诸多挑衅。好比我国的科学数据资本还相对疏散,还没有形成一批在国际上有强盛影响力的科学数据中间,针对科学数据资本治理和开放共享的法令律例以及相干技巧尺度还不敷完美,高程度的复合型数据科学家人才步队还存在缺掉。
对此,曙光公司年夜数据总司理宋怀明博士谈到,作为一家已经为上千家科研教导机构用户供给了近20年办事的高机能盘算和信息体系办事商,曙光有义务、也有才能供给更好的解决计划来辅助晋升科研立异才能,同时,我们也呵责吁更多的机构和厂商加盟进来,配合成长合适中国的科学年夜数据开放生态,辅助中国的科研机构借助各范畴年夜数据成长机会实现转型与变更,共建立异型国度。
回复

使用道具 举报

游客  发表于 2017-1-22 04:02:00
广东人帮你顶下哈!!
回复 支持 反对

使用道具

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

GMT+8, 2017-2-28 07:20

Copyright © 2010-2016 凤城市都市广告有限公司, All rights reserved. ncgglm.com 辽ICP备13004588号

快速回复 返回顶部 返回列表