将列表值分配给 Pandas df 列会生成 NaN 或长度错误

mark T 发表于 Dev

马克·T

我有一个数据框

           Close    Delta   
Date            
2020-05-11  2920.50 -440    
2020-05-11  2920.25 -9      
2020-05-11  2920.25 -27     
2020-05-11  2920.50 2       
2020-05-11  2920.75 117

现在我正在使用此函数计算“关闭”的连续增量：

tickbox = []
cumtickCount = 0

for i in range(len(df.index)):
        if df.Close[i] > df.Close[i-1]:
            cumtickCount += 1
            tickbox.append(cumtickCount)
        else:
            cumtickCount = 0

我得到了列表，但在这里我也不明白为什么值以 1 开头而不是 0
复选框：

[1,
 1,
 2,
 3,
 1,
 2,
 3,
 4,
 5,
 6,
 1,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 1,
 2,
 3,
 4,
 5,

如果我将列表转换为 df 列

ct = pd.Series(tickbox)
df['consec_tick'] = ct

我得到 NaN 值

            Close   Delta  consec_tick
Date            
2020-05-11  2920.50 -440    NaN
2020-05-11  2920.25 -9      NaN
2020-05-11  2920.25 -27     NaN
2020-05-11  2920.50 2       NaN
2020-05-11  2920.75 117     NaN

如果我像这样分配列表：

df.assign(new_col=consec_tickup)

要么

df['consec_tick'] = consec_tickup

我收到以下错误：

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-57-9d3e9ad7ceb3> in <module>
      7             cumtickCount += 1
      8             #tickbox.append(cumtickCount)
----> 9             df['consec_tick'] = tickbox
     10         else:
     11             cumtickCount = 0

/opt/anaconda3/lib/python3.7/site-packages/pandas/core/frame.py in __setitem__(self, key, value)
   3470         else:
   3471             # set column
-> 3472             self._set_item(key, value)
   3473 
   3474     def _setitem_slice(self, key, value):

/opt/anaconda3/lib/python3.7/site-packages/pandas/core/frame.py in _set_item(self, key, value)
   3547 
   3548         self._ensure_valid_index(value)
-> 3549         value = self._sanitize_column(key, value)
   3550         NDFrame._set_item(self, key, value)
   3551 

/opt/anaconda3/lib/python3.7/site-packages/pandas/core/frame.py in _sanitize_column(self, key, value, broadcast)
   3732 
   3733             # turn me into an ndarray
-> 3734             value = sanitize_index(value, self.index, copy=False)
   3735             if not isinstance(value, (np.ndarray, Index)):
   3736                 if isinstance(value, list) and len(value) > 0:

/opt/anaconda3/lib/python3.7/site-packages/pandas/core/internals/construction.py in sanitize_index(data, index, copy)
    610 
    611     if len(data) != len(index):
--> 612         raise ValueError("Length of values does not match length of index")
    613 
    614     if isinstance(data, ABCIndexClass) and not copy:

ValueError: Length of values does not match length of index

如何将“tickbox”中的值正确分配给列？

哈弗姆

您的解决方案存在一些问题，可能源于我对您的目标的误解。

如果您希望该列与另一列具有相同数量的值，您需要tickbox为每个元素添加一个值。在您的情况下，您没有在else分支中附加任何内容，这意味着您实际上是在跳过某些值。

另一个问题是第一个值可能需要设置为0。相反， when i = 0，您将 element0与 element进行比较-1。KeyError: -1当我尝试你的代码时，我实际上得到了一个。

考虑到上述问题，我们可以重写函数：

def consecutive_ticks(close_prices):
  # start with 0 for the first data point
  ticks = [0]
  count = 0

  # go from element 1 to the last element
  for i in range(1, len(close_prices)):
    if close_prices[i] > close_prices[i-1]:
      count += 1
    else:
      count = 0
    # we append the current count anyway.
    # it's either going to be an increment, or it's 0 if "close" is smaller
    ticks.append(count)

  return ticks

这将返回一个与close_prices系列长度相同的列表。因此，您可以通过以下方式将其添加到您的数据框中：

df['consec_tick'] = consecutive_ticks(df.Close)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-9

我来说两句

0 条评论

登录后参与评论

上一篇：数组中的随机项目，在 Javascript 中不重复元素

将列分配给pandas df

将数组值分配给NaN Dataframe Pandas

如何将pandas列分配给其他列，如果是nan则默认值？

Python：使用其他列将值分配给Pandas中的新列作为列表

如何将列表中的随机值分配给pandas数据框中的列？

将值分配给Pandas中的多个列

无法将值分配给Pandas中的某些列

将值分配给另一个df的df $列？

Python Pandas - 填写 df NaN 值

Postgres Crosstab将值分配给错误的列

如何基于概率分布将从列表中选择的值分配给df列？

使用第二个熊猫df中的条件将值分配给列

使用np.where有条件地将值分配给DF列

将列表分配给 df 的子集

将行和列值分配给特定位置的NaN矩阵

Pandas 数据帧将第一个非 nan 值之后的所有值分配给 0

将列表值分配给pandas数据框

range（1：len（df））将NaN分配给数据帧中的最后一行

根据Pandas中其他列的值将值分配给新列

Python / Pandas：基于多个列/行值将值分配给列

将值分配给按索引和列过滤的pandas数据框列

将值重新分配给特定列，并使用pandas与其余列合并

根据另一列中的变量将Pandas中的值分配给该列

根据多个条件将现有列的值分配给 Pandas 中的新列

将字典映射标签分配给pandas中列的索引值

使用默认值将pandas.DataFrame列分配给Series

Python Pandas根据字典键将字典值分配给数据框列

根据字符串条件将值分配给pandas数据框列

有条件地将值分配给Pandas列

TOP 榜单

文章

将列表值分配给 Pandas df 列会生成 NaN 或长度错误

将列表值分配给 Pandas df 列会生成 NaN 或长度错误

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）