gpt4 book ai didi

python - 搜索模式不唯一? - 正则表达式

转载 作者:太空宇宙 更新时间:2023-11-03 15:04:23 25 4
gpt4 key购买 nike

我想编写一个函数来清理数据帧的索引列。

  1. 删除具有高级 ID 的整行。例如删除

    东库特尼 (5901) 01010

  2. 将索引定制为低级 ID 的 7 位数字。例如,转

    东库特尼 A (5901017) RDA 02020进入5901017

  3. 如果有两个括号,则仅保留第二个括号中的 7 位数字。例如,

    Sechelt(部分)(5929803) IGD 020205929803

    大写 H(第 1 部分)(5917054) RDA 010205917054

    大写 H(第 2 部分)(5917056) RDA 020305917056

    T'Sou-ke 1 (Sooke 1) (5917817) IRI 010105917817

    T'Sou-ke 2 (Sooke 2) (5917818) IRI 000005917818

仅适用于一个括号的代码示例是

def extract_id(s):
m = re.search('\((.*)\)', s)
if m:
i = int(m.group(0)[1:-1])
return i

if __name__ == '__main__':
# Read data
census_subdivision_profile = pd.read_excel('../data/census_subdivision_profile.xlsx', sheetname='Data',
index_col='Geography', encoding='utf-8').T
print(census_subdivision_profile.head())
print(census_subdivision_profile.shape)

census_subdivision_profile.index = census_subdivision_profile.index.map(extract_id)
print(census_subdivision_profile.index)

要查看完整代码,请参阅我之前发布的另一个问题

Merge dataframes that have indices that one contains another (but not the same)

最佳答案

我认为您的意图是'\(([^)]*)\)' ... hth

关于python - 搜索模式不唯一? - 正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44789612/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com