gpt4 book ai didi

C# 存储输入文件中的字符串以供操作和使用的最佳方式?

转载 作者:行者123 更新时间:2023-11-30 13:15:15 24 4
gpt4 key购买 nike

我有一个字符串 block 文件,每个字符串 block 都以特定关键字结尾。我目前有一个流阅读器设置,它将文件的每一行添加到列表中,直到当前 block 的末尾(行包含指示 block 结束的关键字)。

listName.Add(lineFromFile);

每个 block 都包含信息,例如书籍 bookName、作者 AuthorName、期刊 JournalName 等。所以每个 block 假设是一个项目(书籍、期刊、 session 等)。

现在有大约 50 block 左右的信息(项目),我需要一些方法来存储信息,以便我可以操作它并存储每个作者、标题、页面等,并知道什么信息与什么项目等.

在打字时,我想到了可能将每个 Item 存储为名为“Item”的类的对象的想法,但是可能有多个作者,我不确定如何实现这一点,正如我在想的那样也许使用计数器来命名变量,例如

int i = 0;
String Author[i] = "blahblah";
i++;

但据我所知这是不允许的?所以我的问题基本上是什么是存储每个项目的最简单/最简单的方法,以便我可以操纵字符串来存储每个项目以供以后使用。

@yamen 这是文件的示例:

Author Bond, james
Author Smith John A
Year 1994
Title For beginners
Book Accounting
Editor Smith Joe
Editor Doe John
Publisher The University of Chicago Press
City Florida, USA
Pages 15-23
End

Author Faux, M
Author Sedge, M
Author McDreamy, L
Author Simbha, D
Year 2000
Title Medical advances in the modern world
Journal Canadian Journal of medicine
Volume 25
Pages 1-26
Issue 2
End


Author McFadden, B
Author Goodrem, G
Title Shape shifting dinosaurs
Conference Ted Vancouver
City Vancouver, Canada
Year 2012
Pages 2-6
End

最佳答案

更新代替您的样本

如何解析字符串超出了这个答案的范围 - 你可能想自己尝试一下,然后问另一个 SO(我建议阅读 SO 的黄金法则:https://meta.stackexchange.com/questions/128548/what-stack-overflow-is-not)。

因此,我将假设您有一个字符串表示完整的书籍/期刊信息 block (此数据看起来像引文),然后介绍解决方案。我原来的回答的主要变化是你有多个作者。此外,您可能还需要考虑是否要将作者姓名转换回 [first name/initial] [middle names] [surname] .

我提出了两个解决方案 - 一个使用 Dictionary和一个使用 Linq . Linq 解决方案是单行的。

定义一个 Info存储项目的类:

public class Info
{
public string Title { get; private set; }
public string BookOrJournal { get; private set; }
public IEnumerable<string> Authors { get; private set; }
//more members of pages, year etc.
public Info(string stringFromFile)
{
Title = /*read book name from stringFromFile */;
BookOrJournalName = /*read journal name from stringFromFile */;
Authors = /*read authors from stringFromFile */;
}
}

请注意 stringFromFile应该是引用信息的一个 block ,包括换行符。

现在一个字典来存储每个作者的信息:

Dictionary<string, List<Info>> infoByAuthor = 
new Dictionary<string, List<Info>>(StringComparer.OrdinalIrgnoreCase);

注意 OrdinalIgnoreCase比较器 - 处理作者姓名以不同大小写打印的情况。

给定一个 List<string>你要根据你的 listName.Add 添加到,这个简单的循环就可以解决问题:

List<Info> tempList;
Info tempInfo;
foreach(var line in listName)
{
if(string.IsNullOrWhiteSpace(line))
continue;
tempInfo = new Info(line);
foreach(var author in info.Authors)
{
if(!infoByAuthor.TryGetValue(author, out tempList))
tempInfo[author] = tempList = new List<Info>();
tempList.Add(tempInfo);
}
}

现在您可以遍历字典,并且每个 KeyValuePair<string, List<Info>>会有一个 Key等于作者姓名和 Value将是 Info 的列表具有该作者的对象。请注意 AuthorName 的大小写将从文件中保留,即使您不区分大小写地分组,这样两个项目带有 "jon skeet""Jon Skeet"将被分组到同一个列表中,但它们的原始案例将保留在 Info 上.

还编写了代码以确保只有一个 Info实例是根据引用创建的,出于多种原因(内存、集中更新等),这是更可取的。

或者,使用 Linq,您可以简单地执行以下操作:

var grouped = listName.Where(s => !string.IsNullOrWhiteSpace(s))
.Select(s => new Info(s))
.SelectMany(i =>
s.Authors.Select(ia => new KeyValuePair<string, Info>(ia, i))
.GroupBy(kvp => kvp.Key, kvp => kvp.Value, StringComparer.OrdinalIgnoreCase);

现在您有可枚举的组,其中 Key是作者姓名,内部可枚举是所有 Info具有该作者姓名的对象。此处也将观察到关于“两个双向飞碟”的相同大小写保留行为。

关于C# 存储输入文件中的字符串以供操作和使用的最佳方式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10594539/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com