python - 使用 xlsxwriter 打印 pandas 输出时，某些单元格为空-6ren

python - 使用 xlsxwriter 打印 pandas 输出时，某些单元格为空

转载作者：行者123 更新时间：2023-12-04 20:48:22

26

4

我有两张多行多列的 excel 工作表。我的任务是比较两个 excel 并只打印匹配的值。输出必须打印到新的 excel 中。我的想法是为此使用 pandas 和 xlsxwriter 引擎。
伪代码:

读取 Excel 1 --> 数据框 1

读取 Excel 2 --> 数据框 2

过滤 Excel 2，使其仅包含带有特定文本“Service_”的条目 --> Dataframe 3

比较 Excel 1 与过滤后的 Excel 2(数据框 1 与数据框 3)

仅打印两个 excel 中的匹配元素 (Dataframe 4)

将输出存储在带有两张工作表(数据框 3 和数据框 4)的新 Excel 中

我遇到的问题是 Dataframe 3 打印正确，但 Dataframe 4 有一些缺失值
数据框 1

  ColumnAlpha     
0 Service_1   
1 Service_2   
2 Service_3   
3 Service_4   
4 Service_5   
5 Service_6

数据框 2

   ColumnA    ColumnB  ColumnC 
0 Service_1    100     Text1
1 Service_2    110     Text2
2 Sample1      120     Text3
3 Sample2      130     Text4
4 Service_6    140     Text5
5 Service_7    150     Text6

代码:

#Reading Excel 1 
data1 = pd.read_excel(r'C:\Users\XXXX\Excel1.xlsx')
df1 = pd.DataFrame(data1, columns= ['ColumnAlpha'])

#Reading Excel 2
data2 = pd.read_excel(r'C:\Users\XXXX\Excel2.xlsx')
df2 = pd.DataFrame(data2, columns= ['ColumnA','ColumnB','ColumnC'])
    
# Filtering ColumnA containing the text Service_ and sorting
filter_df2 = df2.loc[df2['ColumnA'].str.contains("Service_", case = False)]
clean_df2 = filter_df2.groupby("ColumnA").first().reset_index()
clean_df2.sort_values(by='ColumnB', inplace=True, ascending=[False])

#Comparing ColumnA with ColumnAlpha to filter only matching texts
MatchedData = pd.DataFrame(columns=['ColumnA', 'ColumnB','ColumnC'])
for i in df1.ColumnAlpha:
    match_df = clean_df2[clean_df2.ColumnA.str.contains(i)]
    MatchedData = MatchedData.append(match_df, ignore_index=True)

# Class 2 Services Interfaces created in the last one week
MatchedData["ThirdColumn"] = clean_df2["ColumnC"]

OutputData = pd.DataFrame(MatchedData, columns= ['FirstColumn','SecondColumn','ThirdColumn'])
OutputData.sort_values(by='SecondColumn', inplace=True)

# Printing Output in Excel
with pd.ExcelWriter(r'C:\Users\XXXX\Output.xlsx', engine='xlsxwriter') as writer:      # pylint: disable=abstract-class-instantiated
    # Writing Sheet 1
    clean_df2.to_excel(writer, sheet_name="All entries", index=False)  
    
    #Writing Sheet 2             
    OutputData.to_excel(writer, sheet_name="Filtered entries", index=False)

预期数据帧 3( 输出中的工作表 1)

    ColumnA   ColumnB  ColumnC 
 0 Service_7  150       Text6
 1 Service_6  140       Text5
 2 Service_2  110       Text2
 3 Service_1  100       Text1

预期数据帧 4( 输出中预期的工作表 2 )

   FirstColumn  SecondColumn   ThirdColumn 
 0 Service_6    140            Text5
 1 Service_2    110            Text2
 2 Service_1    100            Text1

实际数据框 4( 输出中的实际工作表 2，空单元格 C2 )

   FirstColumn  SecondColumn   ThirdColumn 
 0 Service_6    140            Text5
 1 Service_2    110            Text2
 2 Service_1    100

这里出了什么问题？我正在努力寻找为什么在 Excel 的第一张表中打印相同的值时会省略一些随机值。
答案或建议将不胜感激。非常感谢。
P.S 我试图尽可能简化问题、代码和数据框。如果它看起来仍然很复杂，我提前道歉。

最佳答案

在我看来，这个问题与 MatchedData 和 OutputData 中的不同列名有关。
我尝试将输出数据初始化为

OutputData = pd.DataFrame(MatchedData, columns=['ColumnA', 'ColumnB', 'ColumnC'])And got the expected result.

附言。
如果 pandas 太复杂，那么对于基本任务，您可以使用纯 xlsxwriter 库(没有 Pandas 数据帧)，并使用“dict”、“set”等基础 Python 语言控制数据。

关于python - 使用 xlsxwriter 打印 pandas 输出时，某些单元格为空，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/72632868/

26

4

0

文章推荐： excel - 使用 filesystemobject 检查文件是否存在

文章推荐： excel - Excel 中的自定义类方法

文章推荐： excel - 带有电源查询的 POST 请求未返回所需的结果

文章推荐： excel - VBA从excel公式检测到特定结果时自动显示日期

PHP : echo"", 打印()，打印()
有没有更好的方法用 PHP 将数据输出到 html 页面？如果我想在 php 中用一些 var 制作一个 div，我会写类似的东西 print (''.$var.''); 或 echo "''.$v
javax 打印 vs java awt 打印 api
我可以使用 java awt print 来打印文档/文件而不是使用 javax print 吗？我发现在 java awt print 中有一个选项可以使用 AttributedString 将内容
R 命令行最佳实践 : exit, 打印 stdout、打印 stderr、避免警告
目前我通过以下方式运行 R 脚本: R --slave argument1 argument2 ... 我想知道 R 中关于如何退出脚本并发出警告的最佳实践，q() 会这样做吗？ if(!file.
c++ - 用 gcc 打印 c，用 g++ 打印 c++
谁能告诉我如何编写一个程序，用 gcc 编译时打印 c ，用 g++ 编译时打印 c++? 最佳答案 #ifdef __cplusplus printf("c++\n"); #else
android - 如何通过反射使用 KitKat 4.4 打印 API 打印 WebView？
我需要支持在 KitKat 设备上打印，但我的目标 SDK 是 13(无法更改)。特别是我需要打印一个 webview。这是用于打印 webview 的 API: http://developer
Python输入函数，打印
我正在尝试创建一个简单的函数，其中 python 将根据您的年份输入计算年龄。我已经尝试了几种方法，但我没有运气 atm。附:对不起，我是新手。 ame = input(" Enter your n
JavaFX 打印
JavaFX 2.0 是否支持打印？我有一个文本区域，我从中获取文本然后我想打印它，但似乎没有这个功能。当然，这里我说的是打印到打印机。 :) 最佳答案尚不支持。作为一种解决方法，您可以使用 Ja
Smalltalk - 打印 :
我试图找出printOn的重点。我查看了一些实现它的类，看起来它只是帮助打印不同数据类型的单位。这是准确的吗？如果是这样，有人能指出我如何为我自己的类(class)实现这一点的正确方向吗？我将在可能
打印 Canvas
我无法让 IE 打印我的 Canvas (使用 excanvas 生成)...我使用的是最新版本的 excanvas。 http://dl.dropbox.com/u/997831/canvas.ht
信号处理程序中的 C++ 打印？
我搜索了很多但没有人回答我的问题，我读到在这样的信号处理程序中使用 cout 是不安全的: void ctrlZHandler(int sig_num) { //SIGTSTP-18
python - MongoDB - 打印
我有兴趣打印一系列查询。我有以下代码。 start = datetime.datetime(2012, 2, 2, 6, 35, 6, 764) end = datetime.datetime(201
Java 打印 "?"而不是事物
public class javaClass { public static void main(String [] arg) { String row1 = "A____A"
python - 打印()到上一行？
我需要写入前一行的命令，例如不带\n 的 print()。下面是一些示例代码: a=0 print("Random string value") if a==0: print_to_prev
SwiftUI 打印 View
我有一个使用 UIKit 和 Objective C 的旧 iOS 应用程序，我目前正在将其移植到 SwiftUI 和 Swift。一切都很顺利，我喜欢 Swift 和 SwiftUI。该应用程序已经
Python 打印 while 循环的每次迭代
我创建了一个求和函数，它接受一个开始编号和一个结束编号，并返回这两点之间的总和答案 def print_sum_equations(start_number,end_number):
raku - 打印、放置和说的区别？
在 Perl 6 中，print 和有什么区别？ , put和 say ? 我怎么看 print 5不同，但 put 5和 say 5看起来一样。最佳答案 put $a就像 print $a.Str
jquery - 打印 getOrgChart
我正在使用 here 中的 getOrgChart 库，我正在尝试打印整个图表，而不仅仅是可见部分。不幸的是，当使用标准库打印功能时，它只会打印出第一部分，而我不知道如何打印整个图表(该图表相当宽，大
macos - cocoa 打印
我制作了一个非常适合 A4 页面的 View 。现在我想打印它。请注意，我没有使用drawRect或类似的东西，只是一个带有 subview 和文本标签的普通 View 。我的问题是，我对该 View
cocoa - 打印 NSImage
由于 Cocoa-Java 已弃用，我正在将 Cocoa-Java 代码迁移到 Cocoa + JNI。该代码打印存储在文件中的图像。新的 Cocoa 代码基本上是: NSImage *image =
delphi - 打印 TDBGrid
这个问题已经有答案了: Printing a TDBGrid (4 个回答) 已关闭 6 年前。如何在不安装或下载组件的情况下打印 DBGrid？或者如何将 DBGrid 的数据放入 RichE

首页

博学

6Ren·AI

商城

python - 使用 xlsxwriter 打印 pandas 输出时，某些单元格为空