动手虚拟研讨会
    使用 Presto 和 Apache Iceberg 构建开放数据湖仓库

    2024 年 2 月 28 日 | 太平洋时间上午 10 点,Zoom

    您可能熟悉数据湖仓库,这是一种新兴架构,它将数据湖的灵活性和可扩展性以及成本管理优势与数据仓库的数据管理功能结合在一起。在本研讨会中,我们将动手构建一个开放数据湖仓库——一种将开放技术和格式引入您的数据湖仓库的方法。

    这是一场针对构建数据平台的软件开发人员和工程师的初学者级研讨会。我们将使用 Presto 作为开源 SQL 查询引擎,使用 Apache Iceberg 来启用 ACID 事务,以及使用 Minio S3 兼容的对象存储来存储数据湖。

    您将亲身体验 Presto 和 Iceberg。我们将向您展示如何设置和连接这些技术,如何对您的数据运行查询,以及如何访问和解释 Iceberg 元数据。到最后,您应该精通 Presto 和 Iceberg,并具备创建自己的开放数据湖仓库的构建模块。

    课程大纲

    • 介绍开放数据湖仓库和 Presto 查询引擎
    • 介绍 Apache Iceberg 和常见用例
    • 使用 Presto 查询 S3 数据
    • 将 Iceberg 集成到 Presto
    • 使用 Iceberg 数据和元数据表
    • 未来路线图——Presto 将增加哪些额外的 Iceberg 支持,例如时间旅行和合并读取支持

    实验室讲师

    Kiersten Stokes
    软件开发人员

    王义宏
    软件开发人员