大熊猫与阴囊之间的偏斜和峰态功能有什么区别?

lin_bug:

我决定在pandas和scipy.stats中比较偏斜和峰度函数,但不明白为什么我在库之间得到不同的结果。

据我所知,这两个峰度函数都是使用Fisher的定义进行计算的,而对于偏斜而言,似乎没有足够的描述来说明它们的计算方式是否存在重大差异。

import pandas as pd
import scipy.stats.stats as st

heights = np.array([1.46, 1.79, 2.01, 1.75, 1.56, 1.69, 1.88, 1.76, 1.88, 1.78])

print "skewness:", st.skew(heights)
print "kurtosis:", st.kurtosis(heights)

这将返回:

skewness: -0.393524456473
kurtosis: -0.330672097724

而如果我转换为熊猫数据框:

heights_df = pd.DataFrame(heights)
print "skewness:", heights_df.skew()
print "kurtosis:", heights_df.kurtosis() 

这将返回:

skewness: 0   -0.466663
kurtosis: 0    0.379705

抱歉,如果我将其张贴在错误的位置;不知道这是统计数据还是编程问题。

布伦·巴恩:

差异是由于不同的归一化。默认情况下,Scipy不能纠正偏见,而熊猫可以。

您可以通过传递bias=False参数来告诉scipy纠正偏差

>>> x = pandas.Series(np.random.randn(10))
>>> stats.skew(x)
-0.17644348972413657
>>> x.skew()
-0.20923623968879457
>>> stats.skew(x, bias=False)
-0.2092362396887948
>>> stats.kurtosis(x)
0.6362620964462327
>>> x.kurtosis()
2.0891062062174464
>>> stats.kurtosis(x, bias=False)
2.089106206217446

似乎没有办法告诉熊猫消除偏差校正。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

大熊猫的count(),size(),unique()有什么区别?

大熊猫的where,mask和df [S> 0]有什么区别?

Aurelia插件和功能有什么区别?

大熊猫统计功能与boost :: accumulators之间的区别

这些功能有什么区别?

大熊猫.iloc和.iat之间的区别?

大熊猫中的read_table和read_csv之间有区别吗?

大熊猫中的Series.replace()和Series.map()之间有区别吗?

Swift中的扩展功能,扩展静态功能和扩展类功能有什么区别?

功能和功能之间有什么区别*

do功能和功能之间有什么区别?

react-bootstrap-table中的远程功能和非远程功能有什么区别

覆盖虚拟功能和隐藏非虚拟功能有什么区别?

perl和Java regex功能之间有什么区别?

sep和end in print功能之间有什么区别?

“功能”和“程序”之间有什么区别?

模块和工厂功能之间有什么区别?

RSpec:功能和请求规范之间有什么区别?

Powershell:别名和功能之间有什么区别?

(SICP)功能和步骤之间有什么区别?

打字稿:使用吸气剂和普通功能有什么区别

ListView.builder 和使用地图功能有什么区别

Windows计算器上的“ C”和“ CE”功能有什么区别?

Oracle的“序列”和MySql的Auto_increment功能有什么区别?

setInterval node.js中的异步和同步功能有什么区别

反应组件和作为反应组件的功能有什么区别

这些mondaic功能有什么区别?

这两个功能有什么区别

“SAS”中的“重命名”功能和“标签”功能有什么区别,它们的用例是什么?