gpt4 book ai didi

c# - 使用 Linq 读取 XML 文件

转载 作者:数据小太阳 更新时间:2023-10-29 02:45:45 26 4
gpt4 key购买 nike

总结:

我知道这是一篇很长的文章。总而言之,我需要不在 documentation 列中的每种语言下的名称、前缀和所有值。而且我还需要存储每个标签所使用的语言。

我的问题是:

读取数据并将其保存在适当的列中 - 主要是如果有一个空白值,它会丢弃所有内容。在上面的 Excel 示例中,对于空白的日文标签,下面的代码实际上会将 gl-plt 移动到 label 列中:

for(int t=0; t<labelLinkValues.Count; t+=labelLinkCol.Count) {

for(int j=0; j<labelLinkCol.Count; j++) {
if(labelLinkCol[j].Value=="prefix")
Response.Write(labelLinkValues[t+j].Value+"<br/>");

if(labelLinkCol[j].Value=="name")
Response.Write(labelLinkValues[t+j].Value+"<br/>");

for(int p=0; p<langList.Count; p++) {
if(j>=langList[p].start&&j<=langList[p].end)
if(labelLinkCol[j].Value!="documentation"&&labelLinkValues[j].Value!="")
Response.Write(langList[p].languageValue+"---"+labelLinkValues[t+j].Value+"<br/>");
}

}

Response.Write("----<br>");
}

整个故事:

我正在尝试使用 Linq 读取 excel 导出的 XML 文件。我能够获取数据,但无法使列与正确的行单元格对齐而正常工作。

在发布代码之前,我应该提及一些事情。该程序旨在读取任意数量的文件,它们可能有多种语言(第二行)。在这个特定的例子中,有两种语言,但将来可能会有 1 种语言、3 种语言,例如语言定义如下:

<Row ss:AutoFitHeight="0">
<Cell ss:StyleID="ColumnHead2" ss:Index="4" ss:MergeAcross="1">
<ss:Data ss:Type="String">en</ss:Data>
</Cell>

<Cell ss:StyleID="ColumnHead2" ss:MergeAcross="1">
<ss:Data ss:Type="String">ja</ss:Data>
</Cell>
</Row>

第一种语言的 index 属性告诉你它从哪里开始,而 merge across 告诉你它跨越了多少列。后续语言仅包含跨值合并,这些值告诉您每种语言之后跨越了多少列。

首先,这是两行示例数据的屏幕截图。

(the resolution is higher of downloded image) enter image description here

这是第一行对应的 XML 代码:

<Row ss:AutoFitHeight="0">
<Cell ss:StyleID="NoBorderNumberCell">
<ss:Data ss:Type="Number">1</ss:Data>
</Cell>

<Cell ss:StyleID="NoBorderCell">
<ss:Data ss:Type="String">gl-cor</ss:Data>
</Cell>

<Cell ss:StyleID="NoBorderCell">
<ss:Data ss:Type="String">account</ss:Data>
</Cell>

<Cell ss:StyleID="NoBorderCell">
<ss:Data ss:Type="String">Tuple: parent container for account numbers and identifiers. No entry is made here, but each detail line may have multiple accounts assigned to it for reporting in different GAAPs, offsetting accounts in Japan</ss:Data>
</Cell>

<Cell ss:StyleID="NoBorderCell">
<ss:Data ss:Type="String">Account Identifier</ss:Data>
</Cell>

<Cell ss:StyleID="NoBorderCell">
<ss:Data ss:Type="String">タプル。勘定科目番号と識別子</ss:Data>
</Cell>

<Cell ss:StyleID="NoBorderCell"/>

<Cell ss:StyleID="NoBorderCell">
<ss:Data ss:Type="String">gl-plt</ss:Data>
</Cell>
</Row>

我需要从给定的 XML 文件中提取 3 个值:

名称和前缀,它们不是语言的一部分并且始终存在,获取它们不是问题。

语言列下没有说明 documentation 的任何值。所以我需要忽略文档

现在这是我的代码,可以在上面阅读:

XElement xdocument=XElement.Load(fpath);
XNamespace ns="urn:schemas-microsoft-com:office:spreadsheet";
XNamespace docProperties="urn:schemas-microsoft-com:office:office";
XNamespace ss="urn:schemas-microsoft-com:office:spreadsheet";
XNamespace search="ss";

var labelLinkCol=(
from worksheets in xdocument.Elements(ns+"Worksheet")
where (string)worksheets.Attribute(ss+"Name")=="Label Link"
from columnHead in worksheets.Descendants(ns+"Cell")
where (string)columnHead.Attribute(ss+"StyleID")=="ColumnHead"
select columnHead
).ToList();

var langValues=(
from worksheets in xdocument.Elements(ns+"Worksheet")
where (string)worksheets.Attribute(ss+"Name")=="Label Link"
from columnHead in worksheets.Descendants(ns+"Cell")
where (string)columnHead.Attribute(ss+"StyleID")=="ColumnHead2"
select columnHead
).ToList();

var labelLinkValues=(
from worksheets in xdocument.Elements(ns+"Worksheet")
where (string)worksheets.Attribute(ss+"Name")=="Label Link"
from columnHead in worksheets.Descendants(ns+"Cell")
where
(string)columnHead.Attribute(ss+"StyleID")!="ColumnHead"
&&
(string)columnHead.Attribute(ss+"StyleID")!="ColumnHead2"
&&
(string)columnHead.Attribute(ss+"StyleID")!="ColumnHead2BL"
select columnHead
).ToList();

int index=0;
List<language> langList=new List<language>();

for(int j=0; j<langValues.Count; j++) {
language languageXML=new language();

//the first value has the index
if(j==0) {
index=Convert.ToInt32(langValues[j].Attribute(ss+"Index").Value);
languageXML.index=index;
languageXML.start=index;
languageXML.end=index+Convert.ToInt32(langValues[j].Attribute(ss+"MergeAcross").Value);
languageXML.languageValue=langValues[j].Value;
}
else {
//get the value of when the first language begins
languageXML.index=index;

//to get the beginning, get the end of the previous location and add 1
languageXML.start=langList[langList.Count-1].end+1;

//to get the last column, add the merge to the beginning
languageXML.end=languageXML.start+Convert.ToInt32(langValues[j].Attribute(ss+"MergeAcross").Value);
languageXML.languageValue=langValues[j].Value;
}

langList.Add(languageXML);
//Response.Write(languageXML.start + "--" + languageXML.end + "--" + languageXML.languageValue + "<br>");
}

language 是一个简单的类,仅包含第一种语言的列、当前语言的起始列和当前语言的结束列。

我相信上面的代码是正确的。它读取所有值并正确识别每种语言的开始和结束位置,问题如帖子前面所述。

最佳答案

在我看来,您使它变得比需要的复杂得多。我最近从事的一个项目要求用户从 excel 中复制数据,这些数据通过剪贴板作为 XML 电子表格读取,然后通过解析器发送并转换为表格格式。

我发现 XML 电子表格引用非常宝贵:http://msdn.microsoft.com/en-us/library/office/aa140066(v=office.10).aspx

您应该注意的一件事是 ss:Index 不是基于零的(第 1 列 = 索引 1),我认为这也是您出现问题的原因。

它真的应该像循环遍历行然后遍历它们的单元格并跟踪单元格的索引一样简单。您可能还想检查所需的单元格是否有子数据元素。

关于c# - 使用 Linq 读取 XML 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15078757/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com