python - BeautifulSoup 和 CSV : Delimiter after every Character-6ren

python - BeautifulSoup 和 CSV : Delimiter after every Character

转载作者：行者123 更新时间：2023-12-01 01:12:43

25

4

我想抓取一个维基百科页面并将所有不带标签的 h2 标题写入 csv 中。我想，这只是一个简单的初学者任务。

现在我遇到了问题，在 csv 中的每个字符后面设置了分号。

我的代码:

from bs4 import BeautifulSoup
import requests
import csv

url = "https://de.wikipedia.org/wiki/%C3%84gypten"
r = requests.get(url).content


soup = BeautifulSoup(r, 'lxml')

for h2 in soup.find_all('h2'):
    # Output is okay
    print(h2.get_text())

    with open('Daten/Test.csv', mode='a') as csv_file:
        write_h2 = csv.writer(csv_file, delimiter=';')
        write_h2.writerow(h2)

csv 中的输出如下所示:

I;n;h;a;l;t;s;v;e;r;z;e;i;c;h;n;i;s

ܻb;e;r;b;l;i;c;k

L;a;n;d;e;s;n;a;m;e

G;e;o;g;r;a;p;h;i;e

B;e;v;��k;e;r;u;n;g

G;e;s;c;h;i;c;h;t;e

P;o;l;i;t;i;k

M;i;l;i;t;伲

V;e;r;w;a;l;t;u;n;g;s;g;l;i;e;d;e;r;u;n;g

S;o;z;i;a;l;e; ;L;a;g;e

W;i;r;t;s;c;h;a;f;t

T;o;u;r;i;s;m;u;s; ;u;n;d; ;V;e;r;k;e;h;r

K;u;l;t;u;r

L;i;t;e;r;a;t;u;r

W;e;b;l;i;n;k;s

E;i;n;z;e;l;n;a;c;h;w;e;i;s;e

N;a;v;i;g;a;t;i;o;n;s;m;e;n;�

我对编程非常陌生，所以如果您的答案对于新手来说很容易理解，我将不胜感激。

控制台的输出运行良好。

最佳答案

writerow 将列表作为输入，因此您必须传递字符串列表，如果您传递字符串，它会将其视为字符列表。

参见下面的示例:

from bs4 import BeautifulSoup
import requests
import csv

url = "https://de.wikipedia.org/wiki/%C3%84gypten"
r = requests.get(url).content


soup = BeautifulSoup(r, 'lxml')

for h2 in soup.find_all('h2'):
    # Output is okay
    h2_text = h2.get_text()

    with open('Daten/Test.csv', mode='a') as csv_file:
        write_h2 = csv.writer(csv_file, delimiter=';')
        write_h2.writerow([h2_text])

关于python - BeautifulSoup 和 CSV : Delimiter after every Character，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54688407/

25

4

0

文章推荐： linq - 分组到键值对，其中 value 是共享相同键的元素列表

文章推荐： python - Python3 中的列表索引是如何工作的？

文章推荐： python - 停止一个正在另一个 Python 脚本中运行的脚本

mysql - 不同的代码 : Delimiter//and Delimiter $$
我想问你有关存储过程的问题。我曾在 MySQL version 5.5.16 中尝试过 Delimiter。我曾经 | DELIMITER // | CREATE PROCEDURE Name
Delphi:即使设置了 Delimiter，TStringList Delimiter 也始终是空格字符
我在 TStringList 类中的分隔符方面遇到问题。看看: var s: string; sl: TStringList; begin sl := TStringList.Create
delimiter - 何时使用术语 “delimiter,” “terminator,”和 “separator”
使用“定界符”，“终止符”和“分隔符”背后的语义是什么？例如，我相信终止符会在每个 token 之后以及每个 token 之间的分隔符之后出现。分隔符是与这两个分隔符一样，还是仅仅是分隔符的形式？ S
python re.split() : how to save some of the delimiters (instead of all the delimiter by using bracket)
对于句子: "I am very hungry, so mum brings me a cake! 我希望它被分隔符分割，我希望除了空格之外的所有分隔符也被保存。所以预期的输出是: "I" "
Python 正则表达式 : words between two delimiters - replace leading delimiters with punctuation, 但删除结尾的
test_str = '**Amount** : $25k **Name** : James' 预期输出: output: Amount: $25k, Name: James 我只能使用re.sub
c - strtok() 问题 : If tokens are delimited by delimiters, 为什么最后一个标记位于分隔符和空值 '\0' 之间？
在下面的程序中，strtok() 在主要部分按预期工作，但我无法理解一个发现背后的原因。我读过有关 strtok() 的内容: To determine the beginning and the e
snowflake-cloud-data-platform - 如何解决错误 "Field delimiter ' ,' found while expecting record delimiter '\n'"while loading json data to the stage
我正在尝试使用“COPY INTO”命令将数据从 s3 加载到雪花以下是我创建舞台并将文件从舞台加载到 Snowflake 所遵循的步骤 JSON 文件 { "Name":"Umesh",
delimiter - Cobol字符串由尾部空格分隔
WORKING-STORAGE. FIRST-STRING PIC X(15) VALUE SPACES. SECOND-STRING PIC X(15) VALUE S
excel - 更改Excel中的默认值 'delimiters'
我在 macOS Sierra 软件上使用 Excel for Mac 2016。尽管我已经成功地将 CSV 文件复制并粘贴到 Excel 中一段时间了，但最近，它们的行为开始变得奇怪。当我粘贴数
Java Delimiter 单独打印字符
我是java新手，我正在尝试创建一个简单的程序，它可以使用分隔符解析字符串。但是，每当我尝试这样做而不是打印这样的行时: Hello World I am Bob how are you 它在自己的行
mysql - $$DELIMITER 附近的语法错误
我在创建存储过程时遇到错误，它说我有语法错误，但我找不到它在哪里... MySql 错误: "You have an error in your SQL syntax; check the manua
sql - DELIMITER//在触发器中做什么？
DELIMITER // 它有什么用？最佳答案它将语句分隔符从 ; 更改为 //。这样您就可以在触发器定义中编写 ; 而不会被 MySQL 客户端误解为意味着您已经完成了它。请注意，当改回来时，
SQL double split on delimiter
所以我将字符串值发送到数据库 @string = 'Value1|Value2|Value3|Value4, OtherVal1|OtherVal2|OtherVal3|OtherVal4' 还有一些
delimiter - 如何更改 Hybris 中导出数据中的分隔符？
我正在从 SAP Hybris 导出数据。我正在导入的数据也有分号 (;)。在导出的数据中，我看到分隔符是 ;这阻止了我拆分数据并完成我的工作。有没有办法将此分隔符更改为其他内容？我知道这可以通
delphi - 覆盖 TStringList.Delimiter
TStringList.Delimiter 是一个 TChar。这使得 Delimitertext 成为可能 Test,Test,Test,Test 但我想用 ' 和 ' 作为结果的分隔符 Test
lua 模式匹配 : delimited captures
我正在尝试解析一个字符串，例如:&1 first &2 second &4 fourth \\ ，并从中建立一个表 t = {1=first, 2=second, 4=fourth} 我一般对正则表达
Mysql错误分隔符: Error at Line Delimiter
我正在尝试使用我发现的 mysql 函数，但我似乎遇到了一些错误。这是函数: SET GLOBAL log_bin_trust_function_creators=1; DROP FUNCTION I
mysql - 错误代码: 1064 | Delimiter
分隔符$$ ALTER ALGORITHM=UNDEFINED DEFINER=`root`@`localhost` SQL SECURITY DEFINER VIEW `v_t_buku_bank`
mysql - phpMyadmin DELIMITER 错误是真是假？
在网上阅读了很多关于存储过程和触发器等使用分隔符的内容后，我有点困惑。根据我的理解，对于分隔符，触发器 block 应该这样编写: DROP TRIGGER IF EXISTS innovation
java - 需要一个正则表达式来提取两个 "delimiting"字符串之间的字符串
这个问题在这里已经有了答案: Java Regex Capturing Groups (4 个答案) 关闭 7 年前。我需要获取 by_ 和 _on 之间的字符串。到目前为止我有这个，但不明白如

首页

博学

6Ren·AI

商城

python - BeautifulSoup 和 CSV : Delimiter after every Character