基于GPU运算平台RAPIDS的查询引擎BlazingSQL现对外开源
GPU加速SQL引擎BlazingSQL建立在Nvidia的GPU资料科学平台RAPIDS之上,RAPIDS开源平台提供了一套基于GPU的CUDA加速函式库,可用于机器学习以及资料视觉化。现在BlazingSQL团队已经与RAPIDS团队整合,并将程式码于GitHub上开源。
RAPIDS奠基于跨语言开发平台Apache Arrow,以及用来载入、聚合和过滤资料的GPU资料影格(GPU DataFrame,GDF)函式库cuDF。GPU资料影格是一种GPU记忆体资料格式,可为GPU应用程式提供互通性。BlazingSQL提供一套存取cuDF的SQL介面,可将企业资料湖泊的查询资料,编码成GPU资料影格,方便GPU记忆体使用。
BlazingSQL让开发者以SQL语法,就能利用GPU查询资料,而不需要操作複杂的cuDF函式呼叫。另外,BlazingSQL也能用来连结云端或是网路档案系统,直接对原始档案进行查询。BlazingSQL中的SQL最佳化工具,可以使RAPIDS堆叠运作更加快速。
BlazingSQL还整合Python平行运算函式库Dask,可以为资料科学家提供快速的分析运算。官方提到,过去需要数千台伺服器进行的大规模资料科学研究,现在只需要其中一小部分的基础设施就能够完成,过去需要耗时数小时甚至是数天的大型资料集工作负载或是查询,由于BlazingSQL利用GPU,数秒钟就能完成,而这赋予资料科学家快速迭代模型的能力。
除此之外,BlazingSQL让开发者在开发测试环境与正式产品环境,可以使用相同的程式码,官方表示,资料科学家通常需要先小规模的测试工作负载雏形,待验证完成之后,会为分散式系统重新建置程式,而BlazingSQL可以使用同一行程式码,在不同发布规模中运作。
有鑒于BlazingSQL与RAPIDS发展息息相关,因此为了未来的发展,双方整合了开发团队,官方表示,他们认为RAPIDS将成就下一代分析生态系,而SQL又是构成当前主要分析生态系的重要语法,BlazingSQL为RAPIDS下的SQL标準,因此与RAPIDS团队整合,以利为cuDF做出更多贡献。BlazingSQL建构在RAPIDS的cuDF以及GPU档案I/O函式库上,因此当这些项目受到更新时,也同时改善了BlazingSQL的效能。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
最新文章
- DNF搬砖最佳宠物搭配指南
- DNF白金徽章变现攻略:如何巧妙出售白金徽章
- 寒潮蓝色预警:近两日最低气温 0℃线南压至江南南部至贵州南部和云南北部一带
- DNA 纳米机器人:可改造人造细胞,推动合成生物学发展
- 新型巨型里德伯原子成为精准量子温度计
- 《生化危机9》重大爆料:里昂确定回归主角,吉尔缺席引热议
- 广东:到 2027 年 绿色低碳循环经济体系基本建成
- 2024 财年美国对外军售额创历史新高:背后的战略与影响
- 离子阱量子计算在近年实现双码纠错
- 这次与肯德基的全新联动,星铁再次硬控玩家热情?
- 新年多城土地市场回温:杭州单价地王纪录 3 个月内两度被打破,民企恢复拿地
- 扎克·克雷格执导新版《生化危机》电影,发行权引多家大公司激烈争夺
- 广东:积极推进煤炭消费控制,全力构建以新能源为主体的新型电力系统
- 广东:到 2027 年,全力构建绿色低碳循环经济体系
- 长三角铁路春运再创佳绩:昨日发送旅客 310.2 万人次
- 海通策略:2025 年政策见效下市场望步入基本面驱动新阶段,结构上科技制造确定性更强
- 《最终幻想14》水晶世界青魔法师职业任务全攻略
- 上海:推出乡村振兴领域优秀博士后创新计划,打造高潜力创新人才‘储备库’
- 春节机票价格跳水至百元,航司退差价政策各异引关注
- 浙江:到 2030 年,LNG 年接收能力达 4250 万吨
- 上海:启动乡村振兴博士后创新计划,打造高潜力人才‘蓄水池’
- 币界网晚讯速递:SHIB币价攀升至0.00002044美元,日内涨幅达2.10%
- 不知火舞《街霸6》惊艳换衣秀,细节之处尽显匠心,玩家为之痴狂
- 中国汽车:奋力争夺超豪华市场入场券