为什么numpy在字符串转换时截断数字？

罗布兰夫

我和一个合作者发现，在numpy中有些奇怪的事情我们无法理解。使用Python 3.5.4和numpy版本1.14.2-py35ha9ae307_1（以及以前的版本，以防万一，我对其进行了更新）会发生这种情况。

问题似乎是，如果将浮点数与一些字符串一起添加到numpy数组中，则浮点数将按预期转换为字符串，但有时（非常罕见），浮点数会以非常奇怪的方式被截断。我不知道这是错误还是我们不了解的某些行为。不管怎样，这似乎很奇怪。任何见解都是有用的。

可复制的例子

import numpy as np
p = np.empty([1,2],dtype='U21')
a = 4.4226657709978134e-05
p[0] = np.array(['string',a])
p

# WTF
Out[5]: array([['string', '4.4226657709978134e-0']], dtype='<U21')

这也取决于浮点数的最后一位

# Works as expected
In [26]: np.array(['string',4.4226657709978130e-05], dtype='<U21')
Out[26]: array(['string', '4.422665770997813e-05'], dtype='<U21')

# Works as expected
In [27]: np.array(['string',4.4226657709978131e-05], dtype='<U21')
Out[27]: array(['string', '4.422665770997813e-05'], dtype='<U21')

# Doesn't work as expected
In [28]: np.array(['string',4.4226657709978132e-05], dtype='<U21')
Out[28]: array(['string', '4.4226657709978134e-0'], dtype='<U21')

# Doesn't work as expected
In [29]: np.array(['string',4.4226657709978133e-05], dtype='<U21')
Out[29]: array(['string', '4.4226657709978134e-0'], dtype='<U21')

# Doesn't work as expected
In [30]: np.array(['string',4.4226657709978134e-05], dtype='<U21')
Out[30]: array(['string', '4.4226657709978134e-0'], dtype='<U21')

# Doesn't work as expected
In [31]: np.array(['string',4.4226657709978135e-05], dtype='<U21')
Out[31]: array(['string', '4.4226657709978134e-0'], dtype='<U21')

# Doesn't work as expected
In [32]: np.array(['string',4.4226657709978136e-05], dtype='<U21')
Out[32]: array(['string', '4.4226657709978134e-0'], dtype='<U21')

# Doesn't work as expected
In [33]: np.array(['string',4.4226657709978137e-05], dtype='<U21')
Out[33]: array(['string', '4.4226657709978134e-0'], dtype='<U21')

# Works as expected
In [34]: np.array(['string',4.4226657709978138e-05], dtype='<U21')
Out[34]: array(['string', '4.422665770997814e-05'], dtype='<U21')

# Works as expected
In [35]: np.array(['string',4.4226657709978139e-05], dtype='<U21')
Out[35]: array(['string', '4.422665770997814e-05'], dtype='<U21')

这个问题很难解决，例如通过切换到可以处理不同类型的Pandas数据框。但是这种行为似乎很奇怪。我们注意到它只是因为我们正在对数百万个数字执行此操作，并且理智检查突出显示了它（我们所有的数字都应小于1，并且我们偶尔会开始使数字大于1）。

鬣蜥

这与Numpy无关。参见https://stackoverflow.com/a/25899600/982257

Python（3）通常将浮点数表示为字符串，以最少的数字来明确表示该特定浮点值。

在这两种情况下4.4226657709978137e-05，并4.4226657709978138e-05没有被IEEE双打准确表示。在4.4226657709978137e-05最短的唯一表示形式的情况下，恰好是22个字符，而不是21个字符，因此当您尝试将其填充到a中时，<U21它会被截断。

要用科学计数法表示大多数双打，您至少需要24个字符。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-3

我来说两句

0 条评论

登录后参与评论

上一篇：为了避免生成Makevars文件，是否需要在Imports和LinkingTo中都指定Rcpp？

TOP 榜单

文章

为什么numpy在字符串转换时截断数字？

为什么numpy在字符串转换时截断数字？

IE 11中的FormData未定义

如何一次从多个文本框中获取值？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

OpenCv：改变 putText() 的位置

Redux动作正常，但减速器无效

如何从JavaScript中的MP3文件读取元数据属性？

如何使用Redux-Toolkit重置Redux Store

将加号/减号添加到jQuery菜单

OpenGL纹理格式的颜色错误

获取并汇总所有关联的数据

超过时间限制错误C ++

ActiveModelSerializer仅显示关联的ID

在交互式Python Shell中获得最后结果

如何开始为Ubuntu开发

去噪自动编码器和常规自动编码器有什么区别？

Excel 2016图表将增长与4个参数进行比较

算术中的c ++常量类型转换

使用因子时如何在y轴上的ggplot中插入count或％

TreeMap中的自定义排序

如何在R中转置数据

在 React Native Expo 中使用 react-redux 更改另一个键的值