TPCH 连接器

TPCH 连接器提供了一组架构来支持 TPC Benchmark™ H (TPC-H)。TPC-H 是一种数据库基准测试,用于衡量高度复杂决策支持数据库的性能。

此连接器还可用于测试 Presto 的功能和查询语法,而无需配置对外部数据源的访问。当您查询 TPCH 架构时,连接器使用确定性算法动态生成数据。

配置

要配置 TPCH 连接器,请创建一个目录属性文件 etc/catalog/tpch.properties,其内容如下

connector.name=tpch

TPCH 架构

TPCH 连接器提供多个架构

SHOW SCHEMAS FROM tpch;
       Schema
--------------------
 information_schema
 sf1
 sf100
 sf1000
 sf10000
 sf100000
 sf300
 sf3000
 sf30000
 tiny
(11 rows)

忽略每个目录中都存在的标准架构 information_schema,它不是由 TPCH 连接器直接提供的。

每个 TPCH 架构都提供相同的表集。某些表在所有架构中都是相同的。其他表会根据确定性的 *缩放因子* 而变化,该因子根据架构名称确定。例如,架构 sf1 对应于缩放因子 1,而架构 sf300 对应于缩放因子 300。TPCH 连接器为任何缩放因子提供无限数量的架构,而不仅仅是 SHOW SCHEMAS 列出的少数几个常见架构。 tiny 架构是缩放因子 0.01 的别名,这是一个非常小的数据集,用于测试。