gpt4 book ai didi

r - 将文本文件转换为数据框 R

转载 作者:行者123 更新时间:2023-12-05 01:17:53 25 4
gpt4 key购买 nike

我知道这里已经提出了类似的问题,但我仍然相信我的任务更复杂。

我有一个文本文件,其中包含来自项目 geonames.org 的信息,名为 MX.txt,其中数据的排列如下:

MX  20158   Villas del Cobano   Aguascalientes  AGU Aguascalientes  
001 Aguascalientes 01 21.8495 -102.3052 1
MX 20158 Hacienda el Cobano Aguascalientes AGU Aguascalientes
001 Aguascalientes 01 21.8495 -102.3052 1
MX 20159 Alianza Ferrocarrilera Aguascalientes AGU Aguascalientes
001 Aguascalientes 01 21.8495 -102.3052 1
MX 20159 Bosques del Prado Oriente Aguascalientes AGU Aguascalientes
001 Aguascalientes 01 21.8495 -102.3052 1
MX 20160 Francisco Guel Jimenez Aguascalientes AGU Aguascalientes
001 Aguascalientes 01 21.7561 -102.305 1
MX 20160 Las Viñas INFONAVIT Aguascalientes AGU Aguascalientes
001 Aguascalientes 01 21.7561 -102.305 1
MX 20164 Santa Anita 4a Sección Aguascalientes AGU Aguascalientes
001 Aguascalientes 01 21.7561 -102.305 1

该文件有数千行。

我想将其转换为包含 12 个变量的数据框,其中像“Villas del Cobano”这样的字符串只是一个条目,如下所示:

V1  V2      V3                  V4              V5  V6
MX 20158 Villas del Cobano Aguascalientes AGU Aguascalientes
V7 V8 V9 V10 V11 V12
001 Aguascalientes 01 21.8495 -102.3052 1
V1 V2 V3 V4 V5 V6
MX 20158 Hacienda el Cobano Aguascalientes AGU Aguascalientes
V7 V8 V9 V10 V11 V12
001 Aguascalientes 01 21.8495 -102.3052 1

我已经尝试过之前发布在这里的答案,例如: Converting text file into data frame in R , converting multiple lines of text into a data frame

因为英语不是我的第一语言,如果我的问题不够清楚,我愿意通过评论部分回答问题,而不是得到负面标记。

提前致谢!

最佳答案

列之间的分隔符是制表符,然后使用

data <- read.table(file="MX.txt", sep="\t", quote="", comment.char="")

地名数据存在问题。有时他们在地名中使用#。默认情况下,read.table 读取为注释,丢弃该行的其余部分,因此您需要设置comment.char=""

关于r - 将文本文件转换为数据框 R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32750627/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com