python - 合并计算文件内容并在输出中显示先前计算的数据-6ren

python - 合并计算文件内容并在输出中显示先前计算的数据

转载作者：行者123 更新时间：2023-12-05 03:33:12

我正在处理 2 个文件，oldFile.txt 和 newFile.txt 并计算它们之间的一些变化。 newFile.txt 不断更新，任何更新都将写入 oldFile.txt

我试图通过保存以前的计算值并将其添加到 finalOutput.txt 来改进下面的代码段。任何想法都将非常有助于完成所需的输出。提前谢谢你。

import pandas as pd
from time import sleep
def read_file(fn):
    data = {}
    with open(fn, 'r') as f:
        for lines in f:
            line = lines.rstrip()
            pname, cnt, cat = line.split(maxsplit=2)
            data.update({pname: {'pname': pname, 'cnt': int(cnt), 'cat': cat}})
    return data

def process_data(oldfn, newfn):  
    old = read_file(oldfn)
    new = read_file(newfn)

    u_data = {}
    for ko, vo in old.items():
        if ko in new:
            n = new[ko]
            
            old_cnt = vo['cnt']
            new_cnt = n['cnt']
            u_cnt = old_cnt + new_cnt
            tmp_old_cnt = 1 if old_cnt == 0 else old_cnt
            cnt_change = 100 * (new_cnt - tmp_old_cnt) / tmp_old_cnt
            u_data.update({ko: {'pname': n['pname'], 'cnt': new_cnt, 'cat': n['cat'],
                                'curr_change%': round(cnt_change, 0)}})
    for kn, vn in new.items():
        if kn not in old:        
            old_cnt = 1
            new_cnt = vn['cnt']
            cnt_change = 0
            vn.update({'cnt_change': round(cnt_change, 0)})        
            u_data.update({kn: vn})

    pd.options.display.float_format = "{:,.0f}".format
    mydata = []
    
    for _, v in u_data.items():
        mydata.append(v)
        
    df = pd.DataFrame(mydata)
    df = df.sort_values(by=['cnt'], ascending=False)
    
    # Save to text file.
    with open('finalOutput.txt', 'w') as w:
        w.write(df.to_string(header=None, index=False))
        
    # Overwrite oldFile.txt
    with open('oldFile.txt', 'w') as w:
        w.write(df.to_string(header=None, index=False))

    # Print in console.
    df.insert(0, '#', range(1, 1 + len(df)))
    print(df.to_string(index=False,header=True))
    
while True:
    oldfn = './oldFile.txt'
    newfn = './newFile.txt'
    process_data(oldfn, newfn)
    sleep(60)

旧文件.txt

e6c76e4810a464bc 1                   Hello(HLL)
65b66cc4e81ac81d 2           CryptoCars (CCAR)
c42d0c924df124ce 3            GoldNugget (NGT)
ee70ad06df3d2657 4             BabySwap (BABY)
e5b7ebc589ea9ed8 8            Heroes&E... (HE)
7e7e9d75f5da2377 3                Robox (RBOX)

newfile.txt #-- 第一次阅读时的内容

e6c76e4810a464bc 34                  Hello(HLL)
65b66cc4e81ac81d 43           CryptoCars (CCAR)
c42d0c924df124ce 95            GoldNugget (NGT)
ee70ad06df3d2657 15             BabySwap (BABY)
e5b7ebc589ea9ed8 37            Heroes&E... (HE)
7e7e9d75f5da2377 23                Robox (RBOX)
755507d18913a944 49             CharliesFactory

newfile.txt #--二读时的内容

924dfc924df1242d 35              AeroDie (ADie)
e6c76e4810a464bc 34                  Hello(HLL)
65b66cc4e81ac81d 73           CryptoCars (CCAR)
c42d0c924df124ce 15            GoldNugget (NGT)
ee70ad06df3d2657 5              BabySwap (BABY)
e5b7ebc589ea9ed8 12            Heroes&E... (HE)
7e7e9d75f5da2377 19                Robox (RBOX)
755507d18913a944 169            CharliesFactory

newfile.txt # 三读内容

924dfc924df1242d 45             AeroDie (ADie)
e6c76e4810a464bc 2                  Hello(HLL)
65b66cc4e81ac81d 4           CryptoCars (CCAR)
c42d0c924df124ce 7            GoldNugget (NGT)
ee70ad06df3d2657 5             BabySwap (BABY)
e5b7ebc589ea9ed8 3            Heroes&E... (HE)
7e7e9d75f5da2377 6                Robox (RBOX)
755507d18913a944 9             CharliesFactory

oldFile.txt #-- 需要改进的当前输出

#            pname  cnt               cat   curr_change%
 1 924dfc924df1242d   35    AeroDie (ADie)            29 
 2 755507d18913a944    9   CharliesFactory           -95
 3 c42d0c924df124ce    7  GoldNugget (NGT)           -53
 4 7e7e9d75f5da2377    6      Robox (RBOX)           -68
 5 ee70ad06df3d2657    5   BabySwap (BABY)             0
 6 65b66cc4e81ac81d    4 CryptoCars (CCAR)           -95
 7 e5b7ebc589ea9ed8    3  Heroes&E... (HE)           -75
 8 e6c76e4810a464bc    2        Hello(HLL)           -94

finalOutput.txt #-- 需要改进输出，根据更新读数的数量增加 r1、r2 等列

# curr_change% is the latest 3rd reading
# r2% is based on the 2nd reading
# r1% is based on the 1st reading

 #            pname  cnt               cat  curr_change%    r2%      r1%
 1 924dfc924df1242d   35    AeroDie (ADie)            29      0        0
 2 755507d18913a944    9   CharliesFactory           -95    245        0
 3 c42d0c924df124ce    7  GoldNugget (NGT)           -53    -84    3,067
 4 7e7e9d75f5da2377    6      Robox (RBOX)           -68    -17      667
 5 ee70ad06df3d2657    5   BabySwap (BABY)             0    -67      275
 6 65b66cc4e81ac81d    4 CryptoCars (CCAR)           -95     70    2,050
 7 e5b7ebc589ea9ed8    3  Heroes&E... (HE)           -75    -68      362
 8 e6c76e4810a464bc    2        Hello(HLL)           -94      0    3,300

最佳答案

更新反馈，我进行了调整，以便它可以处理实时提供给它的数据。每当加载新数据时，将文件名加载到 process_new_file() 函数中，它将更新 'finalOutput.txt'。

为简单起见，我将不同的文件命名为 file1、file2、file3 和 file4。

我正在使用 pandas Dataframe 进行大部分操作。我认为使用 Pandas DataFrames 会让您轻松完成任务。

总的来说，我创建了一个函数来读取文件并返回格式正确的 DataFrame。我创建了第二个函数来比较旧文件和新文件并进行您正在寻找的计算。我将这些计算的结果合并在一起。最后，我将所有这些计算与最后一个文件的数据合并以获得您正在寻找的输出。

import pandas as pd

global global_old_df
global results_df
global count

global_old_df = None
results_df = pd.DataFrame()
count = 0


def read_file(file_name):

    rows = []
    with open(file_name) as f:
      for line in f:
         rows.append(line.split(" ", 2))
    df = pd.DataFrame(rows, columns=['pname', 'cnt', 'cat'])
    df['cat'] = df['cat'].str.strip()
    df['cnt'] = df['cnt'].astype(float)

    return df


def compare_dfs(df_old, df_new, count):

    df_ = df_old.merge(df_new, on=['pname', 'cat'], how='outer')
    df_['r%s' % count] = (df_['cnt_y'] / df_['cnt_x'] - 1) * 100
    df_ = df_[['pname', 'r%s' % count]]
    df_ = df_.set_index('pname')

    return df_


def process_new_file(file):

    global global_old_df
    global results_df
    global count

    df_new = read_file(file)

    if global_old_df is None:
        global_old_df = df_new
        return

    else:
        count += 1
        r_df = compare_dfs(global_old_df, df_new, count)
        results_df = pd.concat([r_df, results_df], axis=1)
        global_old_df = df_new

        output_df = df_new.merge(results_df, left_on='pname', right_index=True)
        output_df.to_csv('finalOutput.txt')
        pd.options.display.float_format = "{:,.1f}".format
        print(output_df.to_string())




files = ['file1.txt', 'file2.txt', 'file3.txt', 'file4.txt']

for file in files:
    process_new_file(file)

这给出了输出:

              pname  cnt                cat    r3    r2      r1
0  924dfc924df1242d 45.0     AeroDie (ADie)  28.6   NaN     NaN
1  e6c76e4810a464bc  2.0         Hello(HLL) -94.1   0.0 3,300.0
2  65b66cc4e81ac81d  4.0  CryptoCars (CCAR) -94.5  69.8 2,050.0
3  c42d0c924df124ce  7.0   GoldNugget (NGT) -53.3 -84.2 3,066.7
4  ee70ad06df3d2657  5.0    BabySwap (BABY)   0.0 -66.7   275.0
5  e5b7ebc589ea9ed8  3.0   Heroes&E... (HE) -75.0 -67.6   362.5
6  7e7e9d75f5da2377  6.0       Robox (RBOX) -68.4 -17.4   666.7
7  755507d18913a944  9.0    CharliesFactory -94.7 244.9     NaN

因此，要实时运行它，您只需将最后一部分替换为:

while True:
    newfn = './newFile.txt'
    process_new_file(newfn)
    sleep(60)

关于python - 合并计算文件内容并在输出中显示先前计算的数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/70358745/

文章推荐： reactjs - React 我想在 react-chart-2 工具提示中添加文本

文章推荐： javascript - 三个 JS 将模型旋转到 xyz 位置

文章推荐： python - 如何解决 pyodbc 在 Ubuntu 20.04 上的安装错误？

服务器端的 Firebird 计算(计算)字段
SQL 和一般开发的新手，我有一个表(COUNTRIES)，其中包含字段(INDEX、NAME、POPULATION、AREA) 通常我添加一个客户端(Delphi)计算字段(DENSITY)和 On
jquery - 计算(百分比)计算(像素)
我想使用 calc(100%-100px)，但在我的 demo 中不起作用由于高度只接受像素，因此如何将此百分比值转换为像素。最佳答案以下将为您提供高度: $(window).height();
MySql 计算
我正在尝试在 MySQL 中添加列并动态填充其他列。例如我有一张表“数字”并具有第 1 列、第 2 列、第 3 列，这些总数应填充在第 4 列中最佳答案除非我误解了你的问题，否则你不只是在寻找:
mysql - 计算
我想返回简单计算的结果，但我不确定如何执行此操作。我的表格如下: SELECT COUNT(fb.engineer_id) AS `total_feedback`, SUM(fb.ra
嵌套for循环中的c++计算
我一直在尝试做这个程序，但我被卡住了，我仍然是一个初学者，任何帮助将不胜感激。我需要程序来做打印一个 10 X 10 的表格，其中表格中的每个条目都是行号和列号的总和包含一个累加器，用于计算所有表
c - 计算
这个计算背后一定有一些逻辑。但我无法得到它。普通数学不会导致这种行为。谁能帮我解释一下原因 printf ("float %f\n", 2/7 * 100.0); 结果打印 1.000000 为什么会
计算 AND 的算法
我想计算从 0 到 (n)^{1/2} - 1 的数字的 AND每个数字从 0 到 (n)^{1/2} - 1 .我想在 O(n) 中执行此操作时间，不能使用 XOR、OR、AND 运算。具体来说，
Excel - 在数字格式中使用公式/计算
如何在 Excel 中将公式放入自定义数字格式？例如(出于说明目的随机示例)，假设我有以下数据: 输入输出在不编辑单元格中的实际数据的情况下，我想显示单元格中的值除以 2，并保留两位小数: 有没
Flutter:隔离内存泄漏(计算)
每次我在 Flutter 应用程序中调用计算()时，我都会看到内存泄漏，据我所知，这基本上只是一种生成隔离的便捷方法。我的应用程序内存占用增加并且在 GC 之后永远不会减少。我已将我的代码简化为仅调
R中的RMSE(均方根偏差)计算
我有数字特征观察 V1通过 V12用于目标变量 Wavelength .我想计算 Vx 之间的 RMSE列。数据格式如下。每个变量“Vx”以 5 分钟的间隔进行测量。我想计算所有 Vx 变量的观测值
计算 C 文件中未知数量的字符
我正在寻找一种使用 C 语言计算文件中未知字符数的简单方法。谢谢你的帮助最佳答案 POSIX 方式(可能是您想要的方式): off_t get_file_length( FILE *file ) {
sql - 计算/派生连续日期跨度中的第一个开始日期
我正在使用 Postgres，并且我正试图围绕如何在连续日期跨度中得出第一个开始日期的问题进行思考。例如 :- ID | Start Date | End Date =================
jquery - 计算，用逗号替换点
我有一个订单表格，我在其中使用 jQuery 计算插件来汇总总数。此求和工作正常，但生成的“总和”存在问题。总之，我希望用逗号替换任何点。代码的基础是； function ($this) {
Delphi错误的 double 计算
我在使用 double 变量计算简单算术方程时遇到问题。我有一个具有 double 属性 Value 的组件，我将此属性设置为 100。然后我做一个简单的减法来检查这个值是否真的是 100: va
openssl CRC32 计算
我在这里看到了一些关于 CRC 32 计算的其他问题。但没有一个让我满意，因此是这样。 openssl 库是否有任何用于计算 CRC32 的 api 支持？我已经在为 SHA1 使用 openssl，
php - 计算-1个月时的PHP天错误
当我在PHP日期计算中遇到问题时，我感到惊讶。 $add = '- 30 days'; echo date('Y-m-01', strtotime($add)); // result is 2017-
持有变量的 JavaScript 计算
我正在使用 javascript 进行练习，我编写了这个脚本来计算 2 个变量的总和，然后在第三个方程中使用这个总和!关于如何完成这项工作的任何想法都将非常有用! First Number:
audio - sample 计算
我有一个来自EAC的提示单和一个包含完整专辑的FLAC文件。我正在尝试制作一些python脚本来播放文件，因为我需要能够设置在flac文件中开始的位置。如何从CueSheet格式MM:SS:FF转
javascript - 计算 for 循环中输入值的总和
这个问题已经有答案了: Adding two numbers concatenates them instead of calculating the sum (24 个回答) 已关闭去年。我有一个
使用输入和跨度字段的 Javascript 计算
4000 我需要上面字段 name="quantity" 和 id="price" 中的值，并使用 javascript 函数进行计算，并将其显示在字段 id= 中仅当我单击计算按钮时才显示“总

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 合并计算文件内容并在输出中显示先前计算的数据