gpt4 book ai didi

haskell - 如何将文本文件(CSV)解析为haskell以便我可以对其进行操作?

转载 作者:行者123 更新时间:2023-12-03 06:51:06 25 4
gpt4 key购买 nike

我有一个具有以下格式的纯文本文件:

ID|COUNT|Desc
1|100|Something
2|100|More
1|15|Whatever

我需要将其加载到Haskell中,以便我可以执行一些操作(在GROUP-BY ID和SUM COUNT的情况下),并且我正在寻找方法来做到这一点 - 我不能使用任何额外的模块/包(这是一个学校项目 - 试图用内置的任何东西来解决它)。

我做了一些研究,发现 Text.CSV 作为一个选项,但无法真正理解它是如何工作的(也找不到任何示例 - 这很可怕) - 在我花了很多时间想知道这是否是即使是正确的方法 - 任何建议、想法或示例将不胜感激。

请记住,无论它如何存储,我之后都必须以某种方式处理数据。

<小时/>

我现在正在尝试这种方法:

main::IO()
main = do
dbSales <- readFile "la.txt"
let sales = lines dbSales
(result, x, y) <- mapify sales
print result

mapify :: [String] -> Map Int Int
mapify = Prelude.foldr (\s m -> let (id:count:desc) = (splitWhen (=='|') s)
i = read id
c = read count
in insertWith (+) i c m) empty

但是它提示我调用 mapify 的行:

Couldn't match type `Map Int' with `IO'
Expected type: IO Int
Actual type: Map Int Int
<小时/>

尝试使用新的输入文件,但不确定为什么但出现错误 - 如果我使用以下输入:

ID1|ID2|DATE|SUM
0|0|07/13/2014/100
0|1|07/13/2014/101
0|2|07/13/2014/102
1|0|07/13/2014/100

现在我尝试对 ID2 和 SUM 进行分组(而不是前面示例中的 od ID 和 COUNT):

mapify :: [String] -> Map Int Int
mapify = Prelude.foldr (\s m -> let (id1:id2:date:sum) = (splitWhen (=='|') s)
i = read id1
j = read id2
k = read date
c = read sum
in insertWith (+) j c m) empty

但无论我尝试什么,我都会不断收到这样的错误:

Couldn't match type `[Char]' with `Char'
Expected type: String
Actual type: [[Char]]
In the first argument of `read', namely `sum'
In the expression: read sum
In an equation for `c': c = read sum

最佳答案

mapify :: [String] -> Map Int Int
mapify = foldr (\s m -> let (id:count:desc) = (splitWhen (=='|') s)
i = read id :: Int
c = read count :: Int
in insertWith (+) i c m) empty

我想这应该就是你想要的。它将每个字符串的前两个值读入 Ints,然后 insertWith 将 id 添加到映射(如果不存在),或者增加当前计数(如果存在)。事实上,它会因格式错误的数据而崩溃,因此您可能需要修复该问题,并且它需要 Data.List.SplitData.Map

关于haskell - 如何将文本文件(CSV)解析为haskell以便我可以对其进行操作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25464116/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com