我正在尝试在熊猫数据框中的地址栏中建立一致性。我有一个具有两种格式的ZipCode列:1)87301 2)87301-1234。并非每一行都有连字符,因此当出现连字符时,我需要进行拆分。
我的数据如下所示:
State ZIP
CA 85145-7045
PA 76913
我已经尝试了几种解决此问题的方法。我试过了:
data['Zip_1'],data['Zip_2'] = data['Zip'].str.split('-').str
我试过了:
data['Zip'] = data['Zip'].str.split('-', n=1, expand=True)
data['Zip'] = data['Zip'][0]
data['Zip_drop'] = data['Zip'][1]
我也尝试过使用lambda函数。
但是,它仅返回空值。
我希望新列返回不带连字符的邮政编码的NaN以及连字符后的数字(如果确实包含连字符)。但是,新列只会为每次观察填充NaN
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句