gpt4 book ai didi

java - HTML 页面加载并在 .txt 文件中显示

转载 作者:行者123 更新时间:2023-12-01 09:07:58 26 4
gpt4 key购买 nike

我正在尝试用 java 构建一个搜索引擎,其中有一个文件夹“crawler”来存储下载内容,但是当我打开项目并单击该文件时,我的计算机卡住了,因为它尝试加载所有网址和文本从 html 页面(100k+)解析并尝试在“crawler”文件夹中的 .txt 文件中显示它们。

如何防止在文件中加载和显示它们?

最佳答案

将数据文件存储在项目之外的某个位置。使用例如用于将位置存储到爬网程序文件夹的属性文件。您应该只在项目中包含此类文件,例如源代码。您要上传到 Git 或 SVN 的内容。不是您的应用程序所操作的数据文件。如果您将此数据存储在数据库中,则不会在项目中包含整个数据库,而仅包含用于创建表和 View 的 SQL 文件。

关于java - HTML 页面加载并在 .txt 文件中显示,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41105592/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com