从熊猫列计算平均值，该列的元素包含坐标列表

gio888 发表于 Dev

gio888

我有一个带有'geometry.coordinates'列的数据框，每行包含一个经纬度长坐标对的列表，例如：

[[[120.789558, 17.41699],
  [120.761307, 17.416771],
  [120.744881, 17.437571],
  [120.745842, 17.44907],
  [120.727699, 17.457621],
  [120.73217, 17.463221],
  [120.762817, 17.54215],
  [120.791496, 17.54603],
  [120.817032, 17.51009],
  [120.884644, 17.469419],
  [120.789223, 17.44525],
  [120.789558, 17.41699]]]

我想创建另一列，其中包含列表中所有纬度和经度的平均值。我怎么做？

DataFrame中的示例行：

+----+---------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
|    | properties.NAME_2   | geometry.coordinates                                                                                                                                                                                                                                                                                   |
|----+---------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|  0 | Sallapadan          | [[[120.789558, 17.41699], [120.761307, 17.416771], [120.744881, 17.437571], [120.745842, 17.44907], [120.727699, 17.457621], [120.73217, 17.463221], [120.762817, 17.54215], [120.791496, 17.54603], [120.817032, 17.51009], [120.884644, 17.469419], [120.789223, 17.44525], [120.789558, 17.41699]]] |
|  1 | San Isidro          | [[[120.630783, 17.43194], [120.578957, 17.44137], [120.584541, 17.476851], [120.584137, 17.48283], [120.605492, 17.502029], [120.615356, 17.494249], [120.672997, 17.49074], [120.673241, 17.46966], [120.618919, 17.46871], [120.621872, 17.446251], [120.630783, 17.43194]]]                         |
|  2 | San Juan            | [[[120.782753, 17.71497], [120.779747, 17.66584], [120.724838, 17.665701], [120.707687, 17.687611], [120.712273, 17.711361], [120.711327, 17.726721], [120.721786, 17.732639], [120.750092, 17.724319], [120.785896, 17.76413], [120.811371, 17.740749], [120.782753, 17.71497]]]                      |
+----+---------------------+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+

新列将是这样的：

Center
120.778018916667, 17.4642644166667
120.619734363636, 17.4669609090909
120.751865727273, 17.7135464545455

耶斯列尔

np.mean与配合使用axis=1并选择嵌套列表[0]：

df['geometry.coordinates']=df['geometry.coordinates'].apply(lambda x: np.mean(x, axis=1)[0])
print (df)
  properties.NAME_2                      geometry.coordinates
0        Sallapadan  [120.77801891666665, 17.464264416666666]
1        San Isidro  [120.61973436363637, 17.466960909090908]
2          San Juan  [120.75186572727272, 17.713546454545455]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。