gpt4 book ai didi

R- 删除字符串中的重音符号

转载 作者:行者123 更新时间:2023-12-04 09:31:01 24 4
gpt4 key购买 nike

我有一个带有 html 文件的库,在 files_dep 中我有它们的列表。我需要将存储在其中的文本转换为表格,但问题是它们有重音和 ñ。我写这个来阅读它并且工作正常。

for (i in files_dep) {
text<-readLines(i,encoding="UTF-8")
aa<-paste(text, collapse=' ')
if (grepl(empieza,aa) & grepl(termina,aa)) {
nota=gsub(paste0("(^.*", empieza, ")(.*?)(", termina, ".*)$"), "\\2", aa)
#nota<-iconv(nota,to="ASCII//TRANSLIT")
df<-rbind(df, data.frame(fileName=i, nota=nota)) }}

我可以阅读以下内容:
Este sábado enfrentarán a un equipo.

所以我只需要删除重音。
我尝试取消注释
nota <- iconv(nota,to="ASCII//TRANSLIT")

但我得到:
 Este sA!bado se enfrentarA!n a un equipo. 

所以,我不知道是什么问题。

另外,我需要删除重音符号和所有特殊字符。谢谢

版:

我在循环结束时获取了存储在 nota 中的最后数据。这就是我所看到的:
nota
[1] " <p>La inclusión del seleccionado argentino en el viejo Tres Naciones significó, hace tres años, la confirmación de que el nivel del rugby argentino estaba a la altura de los grandes equipos del planeta, aunque se preveía que esa transición entre ser un equipo <em>del montón</em>&nbsp;a formar parte de la<em> elite </em>no iba a ser sencilla<em>. </em>Hoy, luego de dos años de competencia en el Rugby Championship, Los Pumas están cada vez más cerca de dar el batacazo y conseguir su primer triunfo en la historia del torneo.</p><p>

如果我做:
iconv(nota,to="ASCII//TRANSLIT")

我得到:
iconv(nota,to="ASCII//TRANSLIT")
[1] " <p>La inclusiA3n del seleccionado argentino en el viejo Tres Naciones significA3, hace tres aA?os, la confirmaciA3n de que el nivel del rugby argentino estaba a la altura de los grandes equipos del planeta, aunque se preveA-a que esa transiciA3n entre ser un equipo <em>del montA3n</em>&nbsp;a formar parte de la<em> elite </em>no iba a ser sencilla<em>. </em>Hoy, luego de dos aA?os de competencia en el Rugby Championship, Los Pumas estA!n cada vez mA!s cerca de dar el batacazo y conseguir su primer triunfo en la historia del torneo.

最佳答案

当我遇到类似的问题时,我使用了函数stri_trans_general来自 stringi包裹。例如你可以试试:stri_trans_general(nota,"Latin-ASCII")

关于R- 删除字符串中的重音符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26393341/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com