查询 hive 和 Metastore

流氓

我想通过查询获取每列的列名和最小值/最大值。

假设我只知道表的名称。

我知道以下查询。
表名=人

select min(some_col_name_which_don't_know) from people
SELECT t.TBL_ID, d.NAME as `schema`, t.TBL_NAME name, t.TBL_TYPE, tp.PARAM_VALUE as description,
           p.PKEY_NAME as col_name, p.INTEGER_IDX as col_sort_order,
           p.PKEY_TYPE as col_type, p.PKEY_COMMENT as col_description, 1 as "is_partition_col",
           IF(t.TBL_TYPE = 'VIRTUAL_VIEW', 1, 0) "is_view"
FROM TBLS t
JOIN DBS d ON t.DB_ID = d.DB_ID
JOIN PARTITION_KEYS p ON t.TBL_ID = p.TBL_ID
WHRER TBL_NAME=people

我可以将这两个查询合并为一个查询吗?

蜂巢中是否有类似 information_schema 的表?

梨树

可能的重复:Hive,我如何检索所有数据库的表列

您可以使用以下命令列出表中的总列数:

hive -e "show columns in <table name>" > table_list.txt

下一步是遍历 table_list.txt 文件并构建一个包含所有字段名称及其最大/最小查询的查询字符串。

 for column in table_list:
   hive -e "select min("+column+") from <table name>" >> min_max_table.txt

希望这可以帮助。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

从 Hive 中的 Metastore 查询表抛出错误

Hive Metastore配置PostgreSQL

Hive JDBC客户端和Hive Metastore Java api有什么区别

如何进行Hive查询以利用Metastore中存储的统计信息

查询具有很多列的Hive表时,是否可以减少MetaStore检查的次数?

通过Hive Metastore进行Spark SQL查询“ SHOW VIEWS IN”失败,并在“ IN”处缺少“ FUNCTIONS”

Hive Metastore列宽限制

为Presto和AWS S3设置独立的Hive Metastore服务

Hadoop 3中的Spark和Hive 3:metastore.catalog.default和spark.sql.catalogImplementation之间的区别

Hadoop 和 Hive 中的位级查询

JDBC和Hive查询错误10或9

Use hive metastore service WITHOUT Hadoop/HDFS

Hive-启动时的Metastore连接

在 Hive Metastore 错误中注册 Delta 表

spark不下载hive_metastore jars

验证Hive单查询和多查询并行性

如何从bash shell脚本运行beeline和hive查询

Google DataProc Hive和Presto查询不起作用

Hive查询以根据eff和exp日期返回单行

Hive 中单个查询中的聚合、数学函数和 GROUP BY

Hadoop Hive查询选择和分组来自不同的表

如何遍历Hive查询和使用循环变量

Hive中基于分区和非分区列的查询

hive 如何管理基于非 Tez 和非 MapReduce 的查询

Dataproc:本地 Hive Metastore 的主要用例是什么?

带有外部 mysql 的 hive Metastore 不起作用

hive 独立 Metastore 读取 avro 数据,架构不起作用

无法从Spark应用程序连接到Hive Metastore

Hive 2.1.1 MetaException(在metastore中找不到消息:版本信息。)