在SQL的层次结构列上使用分组依据

Jay 发表于 Dev

杰伊

我们有一个数据集，下面显示一个随机样本；

city|salesman_id|day|sale_qty

Chicago| 1  | 2017-01-16 | 24
Chicago| 1  | 2017-01-17 | 23
Chicago| 2  | 2017-01-16 | 20
NewYork| 1  | 2017-01-15 | 0
NewYork| 2  | 2017-01-15 | 10
NewYork| 1  | 2017-01-16 | 5

在这里，我们是肯定的给定组合salesman_id和 day独特。例如，salesman_id =1并且day=2017-01-17不能出现两次或多次。

现在的问题是，对于每个城市，找到平均销售数量。我的第一次尝试是

SELECT city,
       AVG(sale_qty)
FROM table
GROUP BY city

第一种方法给出答案为；

  City|avg_sales

 Chicago| 22.33
 NewYork| 5

出于直觉，我尝试了另一种方法。

WITH CTE1(

SELECT city,
        salesman_id,
        SUM(sale_qty) AS total
FROM table
GROUP BY city, salesman_id)

SELECT city,
      AVG(total)
FROM CTE1
GROUP BY city

答案为：

city| avg_sales

Chicago| 33.5
NewYork| 7.5

我可以看到答案有所不同。我真的很想了解这种差异的根本原因是什么，其次，在使用Group By子句时应仔细考虑哪些因素。这将帮助我避免Group By将来盲目使用子句。提前致谢。

戈登·利诺夫

第一个计算数据中每个城市的平均销售额。平均一天的营业员在城市的平均销售额是多少？

第二个计算城市中每个销售人员的平均总销售额。全天营业员在城市的平均销售额是多少？

这些是完全不同的。没有理由期望他们甚至会接近。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-24

我来说两句

0 条评论

登录后参与评论

上一篇：Typescript接口作用域如何工作？如何使接口具有全局性？

在SQL的层次结构列上使用分组依据

在SQL的层次结构列上使用分组依据

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID