.net - 如何使用非标准代码页读取 EBCDIC 数据，而不是弄乱数字？-6ren

.net - 如何使用非标准代码页读取 EBCDIC 数据，而不是弄乱数字？

转载作者：行者123 更新时间：2023-12-02 07:11:58

26

4

这是老手(er)的一个:-)

我正在从大型机 DB2 表中读取二进制转储。该表具有 varchar、char、smallint、integer 和 float 列。有趣的是，DB2 使用了代码页 424(希伯来语)。我需要我的代码独立于代码页。

所以我使用 System.Text.Encoding 使用流阅读器打开文件，如下所示:

Dim encoding As System.Text.Encoding = System.Text.Encoding.GetEncoding(20424)
Dim sr As New StreamReader(item.Key, encoding)

并根据长度将 VARCHAR 和 CHAR 数据读取到字符数组中，使用

sr.ReadBlock(buffer, 0, iFieldBufferSize)

始终记住应丢弃 VARCHAR 列中的前 2 个字节
并获得正确的字符串

SringValue = encoding.GetString(encoding.GetBytes(buffer))

一切都很棒!

但是现在我进入了 SMALLINT 列，我遇到了麻烦。有符号数的值存储在 2 个字节中，因为它的大端，我做

Dim buffer(iFieldBufferSize - 1) As Byte
buffer(1) = sr.Read ''switch the bytes around!
buffer(0) = sr.Read
Dim byteBuffer(iFieldBufferSize - 1) As Byte
Dim i16 As Int16 = BitConverter.ToUInt16(buffer, 0)

我得到了错误的数字!例如，如果字节是 00 03 我在缓冲区 (1) 中得到 0，在缓冲区 (0) 中得到 3 - 很好。但是当两个字节是 00 20 时，我将 128 读入缓冲区(0)!

因此，在拉我的头发半天之后，我从 streamreader 声明中删除了编码器，现在我将 32 个读入缓冲区(0)，就像它应该的那样!!!

最重要的是，非标准代码页编码器弄乱了字节读数!!!

知道如何解决这个问题吗？

最佳答案

您无法将 EBCDIC 文件转储之类的内容作为流读取。 StreamReader 类是 TextReader 的一种类型，用于阅读字符 .您正在阅读记录 -- 包含混合二进制和文本的复杂数据结构。

您需要使用 FileStream 进行读取，并根据需要读取八位字节块。您将需要一些简单的辅助方法，例如:

private byte[] ReadOctets( Stream input , int size )
{
    if ( size < 0 ) throw new ArgumentOutOfRangeException() ;

    byte[] octets      = new byte[size] ;
    int    octets_read = input.Read( octets , 0 , size ) ;

    if ( octets_read != size ) throw new InvalidDataException() ;

    return octets ;
}

public string readCharVarying( Stream input )
{
    short    size        = readShort( input ) ;

    return readCharFixed( input , size ) ;
}

public string readCharFixed( Stream input , int size )
{
    Encoding e           = System.Text.Encoding.GetEncoding(20424) ;
    byte[]   octets      = ReadOctets( input , size ) ;
    string   value       = e.GetString( octets ) ;

    return value ;
}

private short readShort( Stream input )
{
    byte[] octets            = ReadOctets(input,2) ;
    short  bigEndianValue    = BitConverter.ToInt16(octets,0) ;
    short  littleEndianValue = System.Net.IPAddress.NetworkToHostOrder( bigEndianValue ) ;

    return littleEndianValue ;
}

private int readInt( Stream input )
{
    byte[] octets            = ReadOctets(input,4) ;
    int    bigEndianValue    = BitConverter.ToInt32(octets,0) ;
    int    littleEndianValue = System.Net.IPAddress.NetworkToHostOrder( bigEndianValue ) ;

    return littleEndianValue ;
}

private long readLong( Stream input )
{
    byte[] octets            = ReadOctets(input,8) ;
    long   bigEndianValue    = BitConverter.ToInt64(octets,0) ;
    long   littleEndianValue = System.Net.IPAddress.NetworkToHostOrder( bigEndianValue ) ;

    return littleEndianValue ;
}

IBM 大型机通常在其文件系统中具有固定或可变长度的记录。固定长度很容易:您只需要知道记录长度，您就可以在一次调用 Read() 方法中读取记录的所有字节，然后根据需要转换这些片段。

可变长度记录有点棘手，它们以 4 个八位字节记录描述符字开始，由 2 个八位字节(16 位)逻辑记录长度组成，后跟一个 2 个八位字节(16 位)0 值。逻辑记录长度不包括 4 字节记录描述符字。

您可能还会看到可变的跨区记录。这些类似于可变长度记录，不同之处在于 4 字节前缀是一个段描述符字。前 2 个八位字节包含段长度，下一个八位字节标识段类型，最后一个八位字节是 NUL (0x00)。段类型如下:

0x00 表示完整的逻辑记录

0x01 表示这是跨区记录的第一段

0x10 表示这是跨区记录的最后一段

0x11 表示这是跨区记录的“内部”段，即“除第一个或最后一个段之外的多段记录的段”。

您可以将可变长度记录和可变跨度记录视为相同。要读取其中之一，您首先需要解析段/记录/描述符字并将完整记录从其组成段读取/组装成字节 []，然后执行任何需要执行的操作来转换该字节[] 变成你可以使用的形式。

关于.net - 如何使用非标准代码页读取 EBCDIC 数据，而不是弄乱数字？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5109302/

26

4

0

文章推荐： java - 如何在 Scala 中使用 Java 包 com.example...object

文章推荐： php - 从 PHP 中的文本中提取图像源 - 需要 preg_match_all

文章推荐： sql - t-sql 在 case 语句中将 '=' 更改为 '> or <'

文章推荐： c - 为什么这两个结构的大小不同？

javascript - 正则表达式匹配字符/数字/数字/数字
fiddle :http://jsfiddle.net/rtucgv74/ 我正在尝试将第一个字符与 3 位数字匹配。所以下面的代码应该提醒f234。但反而返回 null ？源代码: var reg
asp正则表达式匹配数字$数字$数字$
复制代码代码如下: Dim strOk,strNo strOk = "12312321$12
c#数字/数字/字符串模式的正则表达式
我想找 {a number} / { a number } / {a string}模式。我可以得到number / number工作，但是当我添加 / string它不是。我试图找到的例子: 15
java - 数字.数字.数字的模式表达式？
我，我正在做一个模式正则表达式来检查字符串是否是: 数字.数字.数字，如下所示: 1.1.1 0.20.2 58.55541.5221 在java中我使用这个: private static Patt
python - 检查字符串是否包含python中的数字/数字/数字
我有一个字符串，我需要检查它是否在字符串的末尾包含一个数字/数字，并且需要将该数字/数字递增到字符串末尾 +1 我会得到下面的字符串 string2 = suppose_name_1 string3
java - (数字/数字)的正则表达式
我正在寻找一个正则表达式 (数字/数字)，如(1/2) 数字必须是 1-3 位数字。我使用 Java。我认为我的问题比正则表达式更深。我无法让这个工作 String s ="(1/15)";
typescript [数字，数字]与数字[]
谁能帮我理解为什么我在使用以下代码时会出现类型错误: function sumOfTwoNumbersInArray(a: [number, number]) { return a[0] +
google-apps-script - Apps 脚本错误 : Cannot find method getRange(number, 数字、数字、数字)
我看到有些人过去也遇到过类似的问题，但他们似乎只是不同，所以解决方案也有所不同。所以这里是: 我正在尝试在 Google Apps 脚本中返回工作表的已知尺寸范围，如下所示: var myRange
Python - 如何将此模式(数字/数字)与正则表达式匹配？
我试图了解python中的正则表达式模块。我试图让我的程序从用户输入的一行文本中匹配以下模式: 8-13 之间的数字“/” 0-15 之间的数字例如:8/2、11/13、10/9 等。我想出的模式
java - 如何将扫描仪输入拆分为(数字)(带空格的字符串)(数字)
简单地说，我当前正在开发的程序要求我拆分扫描仪输入(例如:2 个火腿和奶酪 5.5)。它应该读取杂货订单并将其分成三个数组。我应该使用 string.split 并能够将此输入分成三部分，而不管中间字
c++ - (数字)和(-数字)的含义
(number) & (-number) 是什么意思？我已经搜索过了，但无法找到含义我想在 for 循环中使用 i & (-i)，例如: for (i = 0; i 110000 .对于i没有高于
javascript - 数字 = parseInt(数字);需要从 rel 属性中获取非数字
需要将图像ID设置为数字 var number = $(this).attr('rel'); number = parseInt(number); $('#carousel .slid
typescript - Typescript 可以确保数组具有重复的类型模式吗？例如[字符串，数字，字符串，数字，....(永远)]
我有一个函数，我想确保它接受一个字符串，后跟一个数字。并且可选地，更多的字符串数字对。就像一个元组，但“无限”次: const fn = (...args: [string, number] | [s
javascript - html 输入类型更改=数字 "available"值。还将更改另一个输入类型=数字 "Total"
我想复制“可用”输入数字的更改并将其添加或减去到“总计”中如果此人将“可用”更改为“3”，则“总计”将变为“9”。如果用户将“可用”更改为“5”，则“总计”将变为“11”。 $('#id1').b
r - 如何在 R 中的(字符/数字)和(字符/数字)类型之间进行换行
我有一个与 R 中的断线相关的简单问题。我正在尝试粘贴，但在获取(字符/数字)之间的断线时遇到问题。请注意，这些值包含在向量中(V1=81,V2=55,V3=25)我已经尝试过这段代码: cat(p
c++ - 数字 xor K - K = 数字 + K xor K，为什么？
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
angular - typescript 错误 "Argument of type ' 数字[ ]' is not assignable to parameter of type ' 数字'”
我在 Typescript 中收到以下错误: Argument of type 'number[]' is not assignable to parameter of type 'number' 我
JavaScript 数字
在本教程中，您将通过示例了解JavaScript 数字。在JavaScript中，数字是基本数据类型。例如， const a = 3; const b = 3.13; 与其他一些编程语言不同
JavaScript 数字
我在 MDN Reintroduction to JavaScript 上阅读JavaScript 数字只是浮点精度类型，JavaScript 中没有整数。然而 JavaScript 有两个函数，pa
Excel编程自动完成部分输入(数字)
我们在 Excel 中管理库存。我知道这有点过时，但我们正在发展商业公司，我们所有的钱都被困在业务上，没有钱投资 IT。所以我想知道我可以用Excel自动完成产品编号的方式进行编程吗？这是一个产品

首页

博学

6Ren·AI

商城

.net - 如何使用非标准代码页读取 EBCDIC 数据，而不是弄乱数字？