gpt4 book ai didi

python - 如何从新闻摘要中提取股票代码NUMBER?

转载 作者:太空宇宙 更新时间:2023-11-03 20:08:15 25 4
gpt4 key购买 nike

我有一个 Pandas 表,需要从存储在列中的文本中提取股票代码“00981”、“00823”。代码的格式为 (00000)。该代码将位于文本摘要中的不同位置。请指教。

News
1 example(00981)example example example。
2 example example example (00823)text text text

期望的输出:

Code column
981
823

s = TABLE['News'].str.find('(')
e = s + 5
c = TABLE['News'].str[s:e]
TABLE["Code"] = c

最佳答案

这对我有用:

print(df)
News
0 1 example(00981)example example example。
1 2 example example example (00823)text text...
-
df['stock_num'] = df['News'].str.extract('(\d{5})').astype(int)
print(df)
News stock_num
0 1 example(00981)example example example。 981
1 2 example example example (00823)text text... 823

要将字符串更改为数字,您可以利用 .astype() 方法或 pd.to_numeric(df['stock_number'])

关于python - 如何从新闻摘要中提取股票代码NUMBER?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58840216/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com