gpt4 book ai didi

python - 如何根据大文件中的首字母进行搜索、比较和操作

转载 作者:行者123 更新时间:2023-12-01 00:15:41 24 4
gpt4 key购买 nike

我知道这个标题很令人困惑。所以,我现在拥有的是一个txt文件。例如:

*Product 1    Orange
*Product 2 Banana
*Product 3 Peach
*Product 4 Orange
*Product 5 Peach

所以,我的目标是一起打印两个相同的产品。“产品 1 产品 4”“产品 3 产品 5”我想过有一个 for 循环

     for line in lis:
if line[0]=="*":
continue
else:
print(line)

但它打印的是单个字符。有人可以帮忙吗?如何使用 for 循环来扫描每一行?

最佳答案

这里是一个例子,您可以使用 pandas 和 numpy 来处理大文件...只需使用 pip 安装 pandas 和 numpy 即可。

import pandas as pd
import numpy as np
#Reading your text file delimited by space , I'm adding headers 'Product','Num','Fruit'
df = pd.read_csv('yourtxtfile.txt',delim_whitespace=True,names=['Product','Num','Fruit'])
# Merge Product and Num
df['Product_num'] = df.agg('{0[Product]} {0[Num]}'.format, axis=1)
df.drop(['Product', 'Num'], axis=1, inplace=True)
# Pivot rows for build a cell like a *Product 1,*Product 4 for each Fruit
print(pd.pivot_table(df,index=['Fruit'],values='Product_num',aggfunc=lambda x: ','.join(x)))

结果:

                  Product_num
Fruit
Banana *Product 2
Orange *Product 1,*Product 4
Peach *Product 3,*Product 5

关于python - 如何根据大文件中的首字母进行搜索、比较和操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59349318/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com