我能够读取两个Excel文件的列数据。下面是我的代码:
from openpyxl import load_workbook
book = load_workbook("Book1.xlsx")
book2 = load_workbook("Book2.xlsx")
sheets = book['Sheet1']
anotherSheet = book2["sheet1"]
for val1 in sheets:
print(val1[0].value)
print("\n\n\n\n")
for val2 in anotherSheet:
print(val2[0].value)
我需要将Book1的列的每个值与Book2的列的每个值进行比较。我对如何进行比较感到困惑。如果值匹配,那么我可以添加另一列并输入“是”,如果不匹配,则可以输入“否”。换句话说,我只需要检查Book2的Book1的Column中是否存在值。一些帮助将不胜感激。
最后,找出解决方案。
首先,我们需要创建3个列表来存储book1,book2中的tempList
值并存储匹配的值。
from openpyxl import load_workbook
book = load_workbook("Book1.xlsx")
book2 = load_workbook("Book2.xlsx")
sheets = book['Sheet1']
anotherSheet = book2["sheet1"]
book1_list = []
book2_list = []
tempList = []
接下来,我们还想跳过列的标题并存储在新变量中。
skip_Head_of_anotherSheet = anotherSheet[2: anotherSheet.max_row]
然后遍历工作表并将所需列的值附加到它们各自的列表中(在我的情况下为'0'表示第一列)。
for val1 in sheets:
book1_list.append(val1[0].value)
for val2 in skip_Head_of_anotherSheet:
book2_list.append(val2[0].value)
检查列表中的重复项,并删除所有重复值。
book1_list = list(dict.fromkeys(book1_list))
存储列表的长度以用于调试
length_of_firstList = len(book1_list)
length_of_secondList = len(book2_list)
接下来,遍历两个列表并检查它们是否匹配,然后将匹配的值存储到中tempList
。
for i in book1_list:
for j in book2_list:
if i == j:
tempList.append(j)
#print(j)
现在,是时候编辑我们的Excel工作表了。我们将遍历存储在内部的匹配值,tempList
并找到实际Excel工作表内的那些值。当我们检测到相同的值时,我们将YES
通过识别特定行的索引来标记到excel工作表的第4列,即“ D”列。此外,如果“ D”列中的单元格为空,则将标记NO
。
for temp in tempList:
for pointValue in skip_Head_of_anotherSheet:
if temp == pointValue[0].value:
anotherSheet.cell(column=4, row=pointValue[0].row, value="YES")
#print(pointValue[0].row)
if pointValue[3].value is None:
anotherSheet.cell(column=4, row=pointValue[0].row, value="NO")
最后,我们将在新填充的列中添加标题,并保存我们的excel工作表并打印所需的信息以进行调试。
anotherSheet.cell(column=4, row=1, value="PII")
book2.save("Book2.xlsx")
print("SUCCESSFULLY UPDATED THE EXCEL SHEET")
print("Length of First List = ", length_of_firstList)
print("Length of Second List = ", length_of_secondList)
我希望这会对遇到同样问题的人有所帮助。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句