Hudi社区 | 这里有一份来自PMC Chair的新年礼包

Apache Hudi社区PMC Chair – Vinoth Chandar的新年祝福

大家好,我是来自Apache Hudi社区的Vinoth,实际上我和一些同学已经在github或者jira上有过一些交流,但不是以个人名义,所以我发了这个视频。

我代表Hudi社区祝愿大家在2021新年快乐,很高兴看到Hudi在中国变得越来越流行,去年我们看到很多来自中国的开发者参与到社区并且贡献了很多非常棒的特性。

我们在2020年一起完成了很多事情,比如毕业成为了顶级项目,也支持很多特性,比如Clustering以及Flink客户端支持,以及内置Metadata表和更快的索引技术,还有一些摄取和管理Schema提交的工具。

当然,2021年我们还有很多其他项目正在进行,比如SQL DML支持,支持更快的索引,还有些高级的特性,比如加速查询的缓存服务,以及更智能地Clustering技术,以及我们会构建一个UI来管理数据湖,同时还有大家期待已久的多Writer并发写支持,此外,我们还想推出一个一流的低级表元数据api,方便那些想知道如何使用Hudi元数据和表格式功能的人,最后我们计划构建最终愿景的大部分内容,即将流处理置于云存储之上,这需要与Flink进行更深入的集成。

希望我们能够在新的一年中继续为Apache Hudi建立越来越多的势头,我也希望在2021年与大家一起工作,再一次祝大家新年快乐。

生产实践

数仓实时化改造:Hudi on Flink 在顺丰的实践应用

T3 出行构建数据湖上低延迟数据 Pipeline 的实践

印度最大在线食品杂货公司Grofers的数据湖建设之路

使用Apache Hudi构建大规模、事务性数据湖

使用Apache Spark和Apache Hudi构建分析数据湖

Uber基于Apache Hudi构建PB级数据湖实践

刚刚晋升为 Apache 顶级项目的 Hudi 如何在数据湖上玩转增量处理

Apache Hudi在医疗大数据中的应用

初创电商公司Drop的数据湖实践

在线房产公司Zillow数据迁移至数据湖实践

实战系列

实战 | Apache Hudi回调功能简介及使用示例

Apache Hudi入门指南(含代码示例)

神探!Apache Hudi集成Prometheus/Pushgateway 进行监控

调优 | Apache Hudi应用调优指南

Apache Hudi 异步Compaction部署方式汇总

详解Apache Hudi如何配置各种类型分区

实战!使用Apache Hudi DeltaStreamer将数据流写入OSS

真香!PySpark整合Apache Hudi实战

实战 | 将Kafka流式数据摄取至Hudi

实战 | 将Apache Hudi数据集写入阿里云OSS

实战|使用Spark Streaming写入Hudi

Apache Hudi丨数据服务实时化利器

Apache Hudi数据备份与转储利器:HoodieSnapshotExporter

填坑!线上Presto查询Hudi表异常排查

实战!配置DataDog监控Apache Hudi应用指标

最强指南!数据湖Apache Hudi、Iceberg、Delta环境搭建

解锁Apache Hudi删除记录新姿势

周边生态

CDH 6.3.0安装Apache Hudi指南

基于阿里云数据湖分析服务和Apache Hudi构建云上实时数据湖

Apache Hudi + Flink作业运行指南

最佳实践 | 通过Apache Hudi和Alluxio建设高性能数据湖

假期结束还没缓过神?Hudi on Flink最新进展了解下?

Apache Hudi和Presto的前世今生

生态 | Apache Hudi插上Alluxio的翅膀

重磅!Impala 3.4版本正式集成Apache Hudi

生态 | Apache Hudi集成Apache Zeppelin

基于Apache Hudi 和 Kylin 构建准实时高性能数据仓库

Apache Hudi与机器学习特征存储

如何将Apache Hudi应用于机器学习

Data Lake架构揭秘

Apache Hudi与Delta Lake对比

终于!Apache Hudi与Impala完成整合

什么是LakeHouse?

内核解读

数据湖框架选型很纠结?一文了解Apache Hudi核心优势

Apache Hudi 设计与架构最强解读

Apache Hudi初学者指南

Apache Hudi重磅RFC解读之存量表高效迁移机制

Apache Hudi重磅RFC解读之记录级别全局索引

Apache Hudi典型应用场景知多少?

请查收!一份”鼠”于你的Apache Hudi新年礼包

云数据湖

划重点!AWS的湖仓一体使用哪种数据湖格式进行衔接?

使用Apache Hudi + Amazon EMR进行变化数据捕获(CDC)

使用Apache Hudi + Amazon S3 + Amazon EMR + AWS DMS构建数据湖

Apache Hudi助力nClouds加速数据交付

Apache Hudi表自动同步至阿里云数据湖分析DLA

Apache Hudi + AWS S3 + Athena实践

官宣!AWS Athena正式可查Apache Hudi数据集

Apache Hudi:云数据湖解决方案

速度!Apache Hudi又双叕被国内顶级云服务提供商集成了!

官宣!Apache Hudi与AWS Database Migration Service深度集成

社区发展

快速参与下一代数据湖顶级项目ApacheHudi

一行代码成为Apache Contributor

Apache Hudi 0.6.0版本重磅发布

特性速览 | Apache Hudi 0.5.3版本正式发布

官宣!ASF官方正式宣布Apache Hudi成为顶级项目

一个月增长4倍!数据揭示当下增长势头最猛的开源数据湖框架!

祝贺!Apache Hudi社区迎来国内第三位Committer

终于!Apache Hudi 0.5.2版本正式发布

首次!Apache Hudi在Apache官方Blog出镜

揭秘!Apache Hudi社区发展数据盘点

Apache Hudi 0.5.1版本重磅发布

源码分析