gpt4 book ai didi

python - 为数据分析构建 Python 代码

转载 作者:太空宇宙 更新时间:2023-11-04 10:21:19 25 4
gpt4 key购买 nike

我为一个数据分析项目编写了代码,但它变得越来越笨拙,我想找到一种更好的结构化方法,以便与他人分享。

为了简洁起见,我有如下内容:

def process_raw_text(txt_file):
# do stuff
return token_text

def tag_text(token_text):
# do stuff
return tagged

def bio_tag(tagged):
# do stuff
return bio_tagged

def restructure(bio_tagged):
# do stuff
return(restructured)

print(restructured)

基本上我希望程序按顺序运行所有函数并打印输出。

在研究构造它的方法时,我阅读了如下类:

class Calculator():

def add(x, y):
return x + y

def subtract(x, y):
return x - y

这在构建项目以允许单独调用单个函数时似乎很有用,例如 add 函数和 Calculator.add(x,y),但我不确定这是我想要的。

有什么我应该研究的函数的顺序运行(旨在构建数据流并提供可读性)?理想情况下,我希望所有函数都在我可以调用一次的“某物”中,这将依次运行其中的所有内容。

最佳答案

将每个函数的输出链接在一起作为下一个函数的输入:

def main():
print restructure(bio_tag(tag_text(process_raw_text(txt_file))

if __name__ == '__main__':
main()

@SvenMarnach 提出了一个很好的建议。一个更通用的解决方案是认识到重复使用输出作为序列中下一个输入的想法正是 reduce功能确实如此。我们想从一些输入 txt_file 开始:

def main():
pipeline = [process_raw_text, tag_text, bio_tag, restructure]
print reduce(apply, pipeline, txt_file)

关于python - 为数据分析构建 Python 代码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32139021/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com