python - 如何使用正则表达式从 Pandas 数据框中删除点号 : '(i)' , '(ii)' 、 '(iii)' ？-6ren

python - 如何使用正则表达式从 Pandas 数据框中删除点号 : '(i)' , '(ii)' 、 '(iii)' ？

转载作者：行者123 更新时间：2023-12-04 07:37:50

26

4

假设，我有一个 Pandas 数据框，其中包含多行产品名称和描述其各自功能的列。他们添加了一些编号系统，如 1., 2.,3.,... 或 a),b),c)....或 (i),(ii),(iii),... 等。现在我想在数据框中删除它们。

df.replace(regex=True, inplace=True, to_replace=r'["(i*)"|i*.|(a-zA-Z).|("("a-zA-z")")]', value=r'')

但代码不起作用。它从答案中删除所有 i，例如。考虑成为考虑，我可以删除 a., b.等等，如果我单独给出它，即 to_replace=r'[a.|b.|A.|B.] 但如果给出了模式，它就不起作用。
如何删除“(i)”、“(ii)”、“(iii)”和“(a)”、“(A)”、“a.”、“A.”范围从 A-Z 和 i 为一个或多个与正则表达式 Pandas 数据框？
例子
输入
(i) 母牛有四条腿。 (ii) 牛吃草。 (iii) 牛给我们牛奶。
或者
a.牛有四只脚。 b. 牛吃草。 c.牛给我们牛奶。
输出
牛有四只脚。牛吃草。牛给我们牛奶。

最佳答案

请你试试:

df.replace(regex=True, inplace=True, to_replace=r'^\(?(?:[ivxlcdm]+|[a-zA-Z]+|[0-9]+)[).]', value='')

输入:

(i) The cow has four legs.
(ii) The cow eats grass.
(iii) Cow gives us milk.
a.The cow has four legs.
b.The cow eats grass.
c.Cow gives us milk.
1.The cow has four legs.
2.The cow eats grass.
3.Cow gives us milk.
a)The cow has four legs.
b)The cow eats grass.
c)Cow gives us milk.

输出:

The cow eats grass.
Cow gives us milk.
The cow has four legs.
The cow eats grass.
Cow gives us milk.
The cow has four legs.
The cow eats grass.
Cow gives us milk.
The cow has four legs.
The cow eats grass.
Cow gives us milk.

正则表达式说明 ^\(?(?:[ivxlcdm]+|[a-zA-Z]+|[0-9]+)[).] :

^表示字符串的开始。

\(?匹配一个零或一个左括号。

(?:[ivxlcdm]+|[a-zA-Z]+|[0-9]+)可以分解为:

[ivxlcdm]+匹配罗马数字。

[a-zA-Z]+匹配字母。

[0-9]+匹配数字。

[).]匹配右括号或点。

关于python - 如何使用正则表达式从 Pandas 数据框中删除点号 : '(i)' , '(ii)' 、 '(iii)' ？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67645592/

26

4

0

文章推荐： forms - 复制表单字段值并将其粘贴到另一个表单/选项卡中？

文章推荐： microservices - 使用微服务架构构建身份验证

文章推荐： flask - 是否可以在 Github 操作的不同终端上运行命令？

732. My Calendar III 我的日程安排表 III
题目地址：https://leetcode.com/problems/my-calendar-iii/description/ 题目描述： Implement a MyCalendarThree
337. House Robber III 打家劫舍 III
题目地址：https://leetcode.com/problems/house-robber-iii/description/ 题目描述 Thethief has found himself a
216. Combination Sum III 组合总和 III
题目地址：https://leetcode.com/problems/combination-sum-iii/description/ 题目描述： Find all possible combin
437. Path Sum III 路径总和 III
题目地址：https://leetcode.com/problems/path-sum-iii/#/descriptionopen in new window 题目描述 Youare given
1004. Max Consecutive Ones III 最大连续1的个数 III
题目地址：https://leetcode.com/problems/max-consecutive-ones-iii/ 题目描述 Given an array A of 0s and 1s, w
245. Shortest Word Distance III 最短单词距离 III
题目地址：https://leetcode-cn.com/problems/shortest-word-distance-iii/ 题目描述 Given a list of words and t
123. Best Time to Buy and Sell Stock III 买卖股票的最佳时机 III
题目地址：https://leetcode.com/problems/best-time-to-buy-and-sell-stock-iii/description/ 题目描述 Sayyou ha
LeetCode_动态规划_递归_二叉树_中等_337.打家劫舍 III
1.题目小偷又发现了一个新的可行窃的地区。这个地区只有一个入口，我们称之为 root 。除了 root 之外，每栋房子有且只有一个“父“房子与之相连。一番侦察之后，聪明的小偷意识到“这个地方的所有
LeetCode_字符串反转_简单_557. 反转字符串中的单词 III
1.题目给定一个字符串 s ，你需要反转字符串中每个单词的字符顺序，同时仍保留空格和单词的初始顺序。示例 1：输入：s = “Let’s take LeetCode contest” 输出：“s
LeetCode_二叉树_前缀和_中等_437. 路径总和 III
1.题目给定一个二叉树的根节点 root ，和一个整数 targetSum ，求该二叉树里节点值之和等于 targetSum 的路径的数目。路径不需要从根节点开始，也不需要在叶子节点结束，但是路径
postgresql - 在Docker中为链接的数据库容器安装pgadmin III
有两个正在运行的Docker容器。一个包含Web应用程序的容器，另一个包含链接的postgres数据库。 Pgadmin III工具应安装在哪里？最佳答案 pgAdmin can be deploy
leetcode刷题(第1004题)——最大连续1的个数 III
一、题目给定一个二进制数组 nums 和一个整数 k，如果可以翻转最多 k 个 0 ，则返回数组中连续 1 的最大个数。二、示例输入：nums = [1,1,1,0,0,0,1,1,1,1
java - 异常处理冒险 III - 更新
我有以下 java 代码框架 - try { Question q = null; //List of questions. I have put 3 in t
r - 如何运行使用 III 类错误并查看成对比较的双向方差分析？
我有一个数据集，我想用它来比较物种和栖息地对家园大小的影响 - 同时使用 III 型错误和物种和栖息地内的成对比较。这是数据的一个子集: species<- c("a","b","c","c","b
android - SGS III 上的罗盘读数
我的应用需要使用罗盘显示设备的当前方位。我正在使用的代码(下方)在我的 Galaxy Nexus 和 Galaxy One 上运行得非常好，但指南针在三星 Galaxy S III 上却疯狂地旋转。我
postgresql - pgAdmin III 显示到同一服务器的重复连接
我的 pgAdmin 突然显示两个连接到同一个服务器(本地主机)。我不记得今天打开软件前最后一次做了什么具体操作。两台服务器包含相同的数据库和登录角色。问: 为什么会这样？只删除/删除其中一个
sql - pgAdmin III 错误行为？
我在 pgAdmin 上查询时偶然发现了这种奇怪的行为。我已连接到运行 PostgreSQL 9.1.9 的服务器。我有一个名为 messages 的表，其定义如下: ghareh@godot:~
postgresql - pgAdmin III 为什么查询结果被缩短了？
我最近安装了 pgAdmin III 1.18.1 并注意到一件奇怪的事情: 长json查询结果缩短为256个符号，然后添加'(...)'。有人可以帮我禁用这个缩短吗？最佳答案感谢用户Erwin
javascript - Leetcode 上的组合和 III
leetcode 问题是: Find all possible combinations of k numbers that add up to a number n, given that only
algorithm - 约翰卡马克不寻常的快速平方根反函数(Quake III)
John Carmack 在 Quake III 源代码中有一个特殊函数，它计算 float 的平方根倒数，比常规 (float)(1.0/sqrt(x)) 快 4 倍，包括奇怪的 0x5f3759d

首页

博学

6Ren·AI

商城

python - 如何使用正则表达式从 Pandas 数据框中删除点号 : '(i)' , '(ii)' 、 '(iii)' ？