微软研究院释出开放资料集储存库不只能下载还能直接複製到Azure平台使用
为促进全球科学研究,微软释出新的开放资料储存库,其中包含了微软研究院累积多年用来发表研究的资料集,而开放资料集能够简化资料取得的门槛,帮助基于云端技术研究人员间的协作,实现研究的可重複性。微软提到,由于几乎所有研究项目都需要资料的参与,因此研究社群的确需要有组织的资料集,而且不仅限于电脑科学领域,在跨科学领域及其他专业领域都有相同的需求。
微软研究院人工智慧首席研究员John Krumm提到,他常被要求分享研究资料,而过去公开分享的这些资料现在变的更加热门,使用Azure对这些资料进行组织与编目,无论是内部或是外部的研究员都能够方便存取这些资料,同时也鼓励协作风气。微软研究开放资料网站上有许多种类的资料集,这些资料集都由微软的员工自己製作,并且已经用于发表的研究报告中,资料集领域包罗万象从电脑科学到生物学都有。
微软表示,这个开放资料储存库是为微软的研究人员以及其他合作伙伴提供一个方便的平台,以互相共享资料集、相关研究技术跟工具。微软降低了这些资料集存取的门槛,促进使用云端平台的研究人员互相协作,并能够有足够的资料集重现研究结果,微软承诺会继续发展这个资料集储存库,并根据社群回馈增加功能。虽然现在已有存在数十个类似的资料储存库,但微软仍期望这个开放资料库能够增强现存资料的丰富度。
微软研究院开放资料库遵循FAIR(Findable, Accessible, Interoperable and Reusable)资料原则,维持资料共享的品质,使用者可以直接在资料集中,找到与该资料相关的出版研究链结。在过去几年间,微软研究院广泛的与其他研究社群合作,共同创造云端研究基础架构,在一年前这个开放资料集储存库雏形出现,现在已经趋于成熟,能够释出给更多的研究人员使用。
微软认为,现在的资料量以指数成长,在2025年可获取的资料将达150ZB以上,因此他们优先开始进行资料处理,而非仰赖网路频宽移动资料,因为这样成长的速度将慢上许多。而他们也认为,提供处理资料的选项是真正有帮助,因此研究人员除了可以下载资料集,也可以直接在云端複製资料集到Azure资料科学虚拟机器上。
免责声明:本文由用户上传,如有侵权请联系删除!
猜你喜欢
最新文章
- 中国好声音如果没有你李昊瀚(山野中国好声音李昊瀚唱的那么好为什么淘汰)
- 被套的尺寸是多少(被套尺寸一般是多少简介介绍)
- 怪物x联盟复刻版攻略(怪物x联盟复刻祥云马)
- 阳历是快的还是慢得(快的和慢的哪个是阳历简介介绍)
- 英雄联盟赵信特战先锋(特战先锋德邦总管赵信)
- 凤凰传奇有一首歌叫什么(凤凰传奇有一首歌歌词有)
- 为什么腾讯视频看不了直播(腾讯lpl视频看不了怎么办)
- Blue(Da(Ba Dee) 歌词)
- 联想z475开机黑屏(联想Z475开机超慢怎么回事)
- 吴建豪舞林大会跳的舞(2011舞林大会吴建豪怎么没有看见进复赛)
- 海清结婚了吗现在怎么样了(海清结婚了吗)
- 开十字绣店到哪里进货(开十字绣店在哪里进货怎么进货呢)
- 卫庄大战六剑奴是哪一集(卫庄哪集说的六剑奴是值得一战的对手)
- 微信六年来第一次开始“变脸”为什么
- iphone怎么看已连接wifi密码(iPhone怎么越狱啊)
- 求K233次列车(15车厢的座位号)
- 能链综合能源港里的充电站为何成为香饽饽
- 鸡蛋怎么做比较有营养(鸡蛋怎么做比较好吃)
- lol手游霞怎么出装(LOL新英雄霞与洛逆羽霞如何出装霞怎么出装)
- 穿越火线什么时候上架(穿越火线什么时候能玩)
- 北比臼舅怎么读(北比臼日怎么读)
- 创世之柱任务有什么用(创世之柱任务怎么做)
- 徐磊的歌曲(写给你的歌 徐磊乐演唱作品)
- 广州市经济适用住房准购证明怎么办理(如何取得广州市经济适用住房准购证明)