在bigquery中创建分区外部表

我想在bigquery中创建一个外部表,该表从Google云存储中加载数据。从Web UI创建表的过程中,“分区类型”选项被禁用。有什么办法可以创建分区的外部表?我的数据已在GCS Ex上按日期格式分区:/ somepath / data / dt = 2018-03-22

费利佩·霍法

当您使用文件名作为变量(_FILE_NAME时,GCS中的联合表会自动充当分区表

例如,此视图将文件名转换为本地日期:

#standardSQL
CREATE VIEW `fh-bigquery.views.wikipedia_views_test_ddl`
AS SELECT
  PARSE_TIMESTAMP('%Y%m%d-%H%M%S', REGEXP_EXTRACT(_FILE_NAME, '[0-9]+-[0-9]+')) datehour
  , _FILE_NAME filename
  , line
FROM `fh-bigquery.views.wikipedia_views_gcs`

稍后,我可以编写如下查询:

#standardSQL
SELECT *
FROM `fh-bigquery.views.wikipedia_views_test_ddl`
WHERE EXTRACT(YEAR FROM datehour)=2015
AND EXTRACT(MONTH FROM datehour)=10
AND EXTRACT(DAY FROM datehour)=21
AND EXTRACT(HOUR FROM datehour)=7

...,并且这些查询只会打开名称与此模式匹配的文件。

我在https://medium.com/google-cloud/bigquery-lazy-data-loading-ddl-dml-partitions-and-half-a-trillion-wikipedia-pageviews-cd3eacd657b6上写了一个完整的故事

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用配置单元创建分区外部表:无可用数据

将数据插入Hive中的分区外部表时出错

在蜂巢的外部表中创建分区

如何从扩展分区外部向扩展分区中包含的逻辑分区添加空间?

如何在Java中创建分区的BigQuery表

使用 Python 在 BigQuery 中创建表的范围分区

如何在bigquery中创建分区表

如何使用Dataproc Pyspark在BigQuery中创建外部表

分区外部硬盘驱动器的优点/缺点

在RAID系统上还是在单独的分区外部安装Linux?

分区外部USB硬盘驱动器

无法分区外部硬盘驱动器

在 BigQuery 中创建外部分区表时,它说: 不允许为 STORAGE_FORMAT_AVRO 指定架构

创建Hive外部表,路径中没有分区列名称的分区?

在预先分区的数据之上创建外部表

在 ATHENA 中创建带有分区的外部表会导致空表

在索引表中创建分区

BigQuery 外部 GCS 表 - 优化 Hive 分区策略

从Azure HDInsights中的分区实木复合地板文件创建配置单元外部表

BigQuery:如何通过 DML 创建整数分区表?

BigQuery-使用分区创建视图,但基本表没有

如何从我的 Cloud Storage 存储分区自动创建 BigQuery 表?

Bigquery Python API按特定字段创建分区表

bigquery表上可以创建的最大分区数

如何在扩展分区内调整分区大小,以便从扩展分区外部分配空间?

安装GPT分区外部硬盘驱动器时出现问题

分区外部硬盘驱动器:我的文件在哪里?

在PostgreSQL中创建表分区的权限继承

在BigQuery中更改分区表的数据类型