- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
//编辑:这个问题是一个子问题。对于更短、更好的示例,它有更好的回复,请检查 This Post
我对 python 很陌生,对 pandas 更陌生。我使用它至少一个月了,我想我已经掌握了大部分基础知识。
我当前的任务是将值写入 xslx 文件内特定空间中的某个单元格。
我有一个非常大的 Excel 文件,其中包含各种数据,从名称到电子邮件地址和一切。我还有两个列表(.txt 文件)与其中的 excel 文件具有相同的电子邮件地址,但那些如果电子邮件符合某些安全检查,则电子邮件会得到验证,或者不是。根据结果,它们被存储在“Secured.txt”或“Unsecured.txt”文件。
为了在 Excel 文件中写入和读取,我使用 pandas。
在 Excel 文件中的“电子邮件”列旁边有一列,您可以在其中标记电子邮件是否受安全保护。我的实际任务是插入这些条目,具体取决于电子邮件所在的文本文件。
我解决这个问题的方法是读出每个 .txt 文件并使用列表和 for 循环将每个电子邮件地址存储在变量中。迭代这些电子邮件,我知道想要在 Excel 文件内查找电子邮件地址的位置并访问它旁边的单元格。同一行,不同列。由于电子邮件之前已根据安全验证进行了排序匹配,因此我只需将相应的值放入电子邮件旁边的验证单元格中即可。
我的问题如下:如何根据其中的值处理特定行?我想找到包含变量“mails”实际内容的单元格的位置,这样我就可以移至它旁边的单元格。由于我知道所有列的名称,因此我实际上只需要电子邮件所在行的索引。我得到了 x 坐标,需要 y 坐标。
到目前为止我所得到的是 .txt 文件的读数:
import pandas as pd
import os
import re
#fetching the mail adress through indexnumber out of the list
with open('Protected/Protected G.txt', 'r') as file:
#creating the regex pattern to sort out the mail adresses
rgx = '\S+@\S+'
#read the file and convert the list into a string
content = file.readlines()
content_str = ''.join(content)
#get the mails out of the "list" with regex
mails = re.findall(rgx, content_str)
#put each mailadress in a variable
for item in mails:
print(item)
这个虚拟数据框代表我正在使用的 Excel 工作表:
Dummy-Dataframe:
Forename Last Name Email Protection
1 John Kennedy John@gmx.net
2 Donald Trump Donald@gmx.net
3 Bill Clinton Bill@gmx.net
4 Richard Nixton Richard@gmx.net
我知道想要将存储在变量“item”中的实际地址传递给 pandas 的某种“定位”功能以便找出实际电子邮件位于哪一行。 一旦我知道地址位于哪一行,我现在就可以告诉 pandas 在下一列中写一个“x”(表示邮件 protected )或“o”(表示邮件不 protected )。
我完成的数据框可能如下所示:
Finished Dataframe:
Forename Last Name Email Protection
1 John Kennedy John@gmx.net x
2 Donald Trump Donald@gmx.net o
3 Bill Clinton Bill@gmx.net x
4 Richard Nixton Richard@gmx.net x
我真的很感谢你的帮助。
最佳答案
为了确保我理解您有一个 protected 文本文件和一个不 protected 文本文件。我做了一个很大的假设,你在这两者中都没有电子邮件。
import pandas as pd
df = pd.read_csv('Protected/Protected G.txt', header = None, sep = " ")
df.columns = ['Protected Emails']
df2 = pd.read_excel('dummy-excel')
if df2['Email'].isin(df) :
df2['Protection'] = 'x'
else :
df2['Protection'] = 'o'
writer = pd.ExcelWriter('ProtectedEmails.xlsx')
df2.to_excel(writer,'Sheet1') #or whatever you want to name your sheet
writer.save()
也许是这样的,虽然我不知道电子邮件的文本文件是什么样的。
关于python - 根据单元格值定位行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53918100/
我试图要求 test/unit 的新版本(即不是与 ruby 捆绑的版本) .根据 instructions我用 gem i test-unit 安装它.但是现在当我需要 test/unit我似乎
简短版本是: 我有一个 systemd 单元,我想在调用时检查脚本的返回代码: systemctl status service.service 长版本:我有一个 lsb init 脚本正是这样做的,
我正在使用反射动态创建一个类的实例,这工作正常,除非尝试通过单元测试执行此操作 - 我使用的是 MS 测试框架。 我收到熟悉的错误:“无法加载文件或程序集‘Assy’或其依赖项之一。系统找不到指定的文
我想知道测试网站“界面功能”的最佳实践是什么。 我对哪些方法可用于测试界面和动态生成的内容感兴趣。特别是,我很难弄清楚是否可以为需要用户交互的操作创建自动化测试,或者这是否只是浪费时间,我应该让一些
我有一个简单的 Python 服务,其中有一个无限执行某些操作的循环。在各种信号上,sys.exit(0) 被调用,这导致 SystemExit 被引发,然后如果可以的话应该进行一些清理。 在测试中,
我正在使用 OpenCV 2.4.2 这是 OpenCV 文档中的引文 C++: void HoughLinesP(InputArray image, OutputArray lines, doubl
忙于 C# 中的自动化测试用例,我们需要在每次测试后恢复数据库快照。问题是,当运行多个测试时它会失败,因为“其他用户正在使用数据库时无法更改数据库状态。” 我们使用 SqlConnection.Cle
我阅读了 C# 规范并用谷歌搜索了它,但一无所获。 我 99% 肯定 C# 中没有像单元命名空间指令这样的功能,但问题是:为什么?是否有惯用或技术原因? 这很方便,尤其是当我们的大部分文件都由单个命名
我目前正在尝试向我的应用程序(一个非常老的项目......评论说 iOS 2.0)添加单元测试(精确的应用程序测试)并且总是偶然发现 undefined symbols for architectur
我正在使用Delphi 7,并且有一个新单元要在我的项目中使用。我已经编译了新的。当我尝试通过将其添加到uses子句在项目中使用此单元时,出现错误,提示未找到.dcu文件。我还尝试将文件的完整路径放在
场景:我需要编写一个复杂的nHibernate查询,该查询将返回预计的DTO,但是我想使用TDD方法。该方法如下所示: public PrintDTO GetUsersForPrinting(int
您可以通过运行以下命令在事件 html 设置中显示 Jupyter 笔记本: $ jupyter nbconvert untitled.ipynb --to slides --post serve 有
如何在一个网站上拥有多个 AdSense 单元? Google 提供的唯一代码是按单位计算的。 (adsbygoogle = window.adsbygoogle || []).push({})
我刚刚开始为大量代码编写测试。有很多类依赖于文件系统,即读取 CSV 文件、读/写配置文件等。 当前测试文件存储在项目(这是一个 Maven2 项目)的 test 目录中,但由于多种原因该目录并不总是
我对 TDD 还很陌生,在单元测试方面也不是很老练,所以才有这个问题。我有这个用 PHP 编写的遗留函数 function foo(){ x = bar(); y = baz();
我创建了一个程序,在 Swing 窗口的一侧显示结果过滤选项,但默认情况下它们水平相邻显示,这浪费了我在 BorderLayout 的西侧分配的空间。我可以在构造函数或添加语句中传递任何内容来将它们堆
标题不好的借口:如果有人能更好地描述它,请做。 我有一个 WeakList类,它“基本上”是一个 List> (虽然不是字面意义上的派生自列表,但它应该对用户完全透明)。 现在的基本思想是“如果引用的
我正在尝试在 UITableView 上添加两个原型(prototype)单元。但是,我不知道如何验证是否能够为每个原型(prototype)“返回”正确的单元格。你们能帮我一下吗? func ta
我正在使用 CloudKit 作为数据库创建一个简单的待办事项列表应用程序。目前我可以添加和删除对象,但对编辑对象感到困惑。 编辑项目 Controller protocol EditItemCont
我正在针对以下任务训练 RNN:给定一个包含 30 个单词的序列,然后将该序列分类为二进制类。 在我的网络中拥有超过 30 个单元(LSTM、GRU 或普通 RNN)有好处吗?我在网上看到过很多例子,
我是一名优秀的程序员,十分优秀!