gpt4 book ai didi

python - 编辑 DataFrame 中的值

转载 作者:太空宇宙 更新时间:2023-11-04 08:46:37 25 4
gpt4 key购买 nike

我正在尝试:

将 UPC 代码的 CSV 导入到数据框中。如果 UPC 代码是 11 个字符,请在其后附加“0”。例如:19962123818 --> 019962123818

这是代码:

 #check UPC code length. If 11 characters, adds '0' before. If < 11 or > 13, throws Error
for index, row in clean_data.iterrows():
if len(row['UPC']) == 11:
row['UPC'] = ('0' + row['UPC'])
#clean_data.set_value(row, 'UPC',('0' + (row['UPC']))
print ("Edited UPC:", row['UPC'], type(row['UPC']))
if len(row['UPC']) < 11 or len(row['UPC']) > 13:
print ('Error, UPC length < 11 or > 13:')
print ("Error in UPC:", row['UPC'])
quit()

但是,当我打印数据时,原始值没有被编辑:

enter image description here

有谁知道是什么导致了这个问题?

我尝试了其他帖子中提到的 set_value 方法,但是没有用。

谢谢!


感谢矢量化方法,更清晰!但是,我收到以下错误,并且该值仍未更新:

enter image description here

最佳答案

我可以推荐一个不同的方法吗?

#identify the strings shorter than 11 characters
fix_indx = clean_data.UPC.astype(str).str.len()<11

#append these strings with a '0'
clean_data.loc[fix_indx] = '0'+clean_data[fix_indx].astype(str)

要修复其他问题,您可以类似地执行以下操作:

bad_length_indx = clean_data.UPC.astype(str).str.len()>13
clean_data.loc[bad_length] = np.nan

关于python - 编辑 DataFrame 中的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40054147/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com