Hudi社区 | 这里有一份来自PMC Chair的新年礼包
Apache Hudi社区PMC Chair – Vinoth Chandar的新年祝福
大家好,我是来自Apache Hudi社区的Vinoth,实际上我和一些同学已经在github或者jira上有过一些交流,但不是以个人名义,所以我发了这个视频。
我代表Hudi社区祝愿大家在2021新年快乐,很高兴看到Hudi在中国变得越来越流行,去年我们看到很多来自中国的开发者参与到社区并且贡献了很多非常棒的特性。
我们在2020年一起完成了很多事情,比如毕业成为了顶级项目,也支持很多特性,比如Clustering以及Flink客户端支持,以及内置Metadata表和更快的索引技术,还有一些摄取和管理Schema提交的工具。
当然,2021年我们还有很多其他项目正在进行,比如SQL DML支持,支持更快的索引,还有些高级的特性,比如加速查询的缓存服务,以及更智能地Clustering技术,以及我们会构建一个UI来管理数据湖,同时还有大家期待已久的多Writer并发写支持,此外,我们还想推出一个一流的低级表元数据api,方便那些想知道如何使用Hudi元数据和表格式功能的人,最后我们计划构建最终愿景的大部分内容,即将流处理置于云存储之上,这需要与Flink进行更深入的集成。
希望我们能够在新的一年中继续为Apache Hudi建立越来越多的势头,我也希望在2021年与大家一起工作,再一次祝大家新年快乐。
生产实践
数仓实时化改造:Hudi on Flink 在顺丰的实践应用
使用Apache Spark和Apache Hudi构建分析数据湖
刚刚晋升为 Apache 顶级项目的 Hudi 如何在数据湖上玩转增量处理
实战系列
神探!Apache Hudi集成Prometheus/Pushgateway 进行监控
Apache Hudi 异步Compaction部署方式汇总
实战!使用Apache Hudi DeltaStreamer将数据流写入OSS
Apache Hudi数据备份与转储利器:HoodieSnapshotExporter
最强指南!数据湖Apache Hudi、Iceberg、Delta环境搭建
周边生态
基于阿里云数据湖分析服务和Apache Hudi构建云上实时数据湖
最佳实践 | 通过Apache Hudi和Alluxio建设高性能数据湖
假期结束还没缓过神?Hudi on Flink最新进展了解下?
重磅!Impala 3.4版本正式集成Apache Hudi
生态 | Apache Hudi集成Apache Zeppelin
基于Apache Hudi 和 Kylin 构建准实时高性能数据仓库
内核解读
数据湖框架选型很纠结?一文了解Apache Hudi核心优势
请查收!一份”鼠”于你的Apache Hudi新年礼包
云数据湖
使用Apache Hudi + Amazon EMR进行变化数据捕获(CDC)
使用Apache Hudi + Amazon S3 + Amazon EMR + AWS DMS构建数据湖
Apache Hudi + AWS S3 + Athena实践
官宣!AWS Athena正式可查Apache Hudi数据集
速度!Apache Hudi又双叕被国内顶级云服务提供商集成了!
官宣!Apache Hudi与AWS Database Migration Service深度集成
社区发展
特性速览 | Apache Hudi 0.5.3版本正式发布
祝贺!Apache Hudi社区迎来国内第三位Committer