动手虚拟实验室:使用 Presto 和 Apache Iceberg 构建开放数据湖仓
2024 年 8 月 15 日星期四 | 太平洋时间上午 10 点,在 Zoom 上举行
您可能熟悉数据湖仓,这是一种新兴架构,它将数据湖的灵活性和可扩展性以及数据仓库的数据管理功能结合在一起。在本工作坊中,我们将动手构建一个开放数据湖仓——这是一种将开放技术和格式引入您的湖仓的方法。
这是一个针对构建数据平台的软件开发人员和工程师的初学者级工作坊。我们将使用 Presto 作为开源 SQL 查询引擎,Apache Iceberg 实现 ACID 事务,以及 Minio S3 兼容的对象存储作为数据湖。
您将亲身体验 Presto 和 Iceberg。我们将向您展示如何设置和连接这些技术,如何对数据运行查询,以及如何访问和解释 Iceberg 元数据。到最后,您应该精通 Presto 和 Iceberg,并拥有创建自己的开放数据湖仓的基本要素。
课程大纲
- 介绍开放数据湖仓和 Presto 查询引擎
- 介绍 Apache Iceberg 和常见用例
- 使用 Presto 查询 S3 数据
- 将 Iceberg 与 Presto 集成
- 使用 Iceberg 数据和元数据表
该活动已结束
查看更多我们的 即将举行的社区 活动!
实验室讲师
Kiersten Stokes
软件开发人员
Yihong Wang
软件开发人员