皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

Apache CarbonData 1.5.0 发布,华为大数据存储方案

CarbonData 1.5.0 发布了,该版本更贴近于统一分析。我们希望能够从更多的引擎/库中读取 CarbonData 文件,以支持各种用例。在这方面,我们增加了支持从 C++库读取 CarbonData 文件的支持。此外,可以使用 Java SDK、Spark 文件格式接口、Spark、Presto 等读取 CarbonData 文件。

此外 CarbonData 添加了多个优化以减少存储大小,以便可以利用较小的 IO 进行查询。对来自 CarbonData 的流支持进行了一些改进。

在该版本中,包含了超过 150 项 JIRA 的条目,包括新特性、改进和 bug 修复。详细的列表请看 发行说明

Apache® CarbonData™是由华为开源贡献的大数据高效存储格式解决方案。 针对当前大数据领域分析场景需求各异而导致的存储冗余问题,Ca rbonData 提供了一种新的融合数据存储方案,以一份数据同时支持“交互式分析、详单查询、 任意维度组合的过滤查询等”多种大数据应用场景, 并通过丰富的索引技术、字典编码、列存等特性提升了 IO 扫描和计 算性能,实现百亿数据级秒级响应,与大数据生态 Apache Hadoop、Apache Spark 等无缝集成。

转自 https://www.oschina.net/news/101173/apache-carbondata-1-5-0-released

分享到:更多 ()