c++ - C++ getline添加空格-6ren

c++ - C++ getline添加空格

转载作者：行者123 更新时间：2023-11-30 01:58:48

我已经尝试了好几天来解决此问题，但无法解决。基本上，我的代码应该读取wmic生成的.csv文件并将其保存到结构中。我可以读取数据并将其存储，但是每个字符后都有一个额外的空格。我尝试过切换到函数的Unicode版本并使用宽字符串，但是它们只会使数据更加困惑(它们将“n”变成“ÿ”)。

这是我认为是问题的代码:

system("wmic product get name,version,installdate,vendor /format:csv > product.txt");

std::ifstream infoFile("./program.txt"); // The file wmic wrote in csv format.

if(infoFile.is_open())
{
    std::string line;
    int lineNum = 0;

    while(getline(infoFile, line))
    {
        lineNum++;
        std::cout << "\nLine #" << lineNum << ":" << std::endl;

        Program temp;
        std::istringstream lineStream(line);
        std::string cell;
        int counter = 0;
        int cellNum = 0;

        while(getline(linestream, cell, ','))
        {
            cellNum++;
            std::cout << "\nCell #" << cellNum << ":" << cell << std::endl;

            switch(counter)
            {
            case 0:
                break;
            case 1:
                temp.installDate = cell;
                break;
            case 2:
                temp.name = cell;
                break;
            case 3:
                temp.vendor = cell;
                break;
            case 4:
                temp.version = cell;
                break;
            default:
                std::cout << "GetProductInfo(): Invalid switch value: " << counter << std::endl;
                break;
            }
            counter++;
        }

        information->push_back(temp); // Vector to save all of the programs.
    }

    infoFile.close();
}
else
{
    std::cout << "GetProductInfo(): Failed to open the input file." << std::endl;
    return 1;
}

return 0;
}

编辑:
好的，我正尝试编写BOM(FF FE 0D 00 0A)，因为之前没有编写过。我正在用十六进制值编写一个char数组，但是有一个额外的0x0D被添加(FF FE 0D 00 0D 0A)。它还将内部变量与多余的空间一起保存。这可能不是问题，因为我可以修改代码以解决此问题，但这并不是最佳选择。有任何想法吗？

编辑2:
所以我想我不需要BOM。我现在的主要问题是只读取UTF-16LE文件并将数据保存到结构中而没有多余的空间。我需要一些帮助以正确的方式进行操作，因为我想弄清楚将来如何避免这种情况。感谢您对所有人的帮助，此错误至关重要。

最佳答案

这闻起来很像是文本编码问题，所以我继续尝试运行您提供的命令，并且可以肯定的是，输出文件是用UCS16LE编码的。 (这是16位字符，little-endian。)尝试在十六进制编辑器中打开文件，以查看其实际外观。

尝试使用宽字符串时，您走在正确的道路上，但是处理Unicode可能很棘手。接下来的几段将为您提供一些技巧，说明如何以困难的方式进行处理，但是，如果您需要快速简便的解决方案，请跳到最后。

有两件事要注意。首先，请确保您还在使用宽泛的流，例如wcout。值得将每个字符转换为一个int，以仔细检查输出格式是否存在问题。

其次，wcout，wstring等的格式不是标准的。在某些编译器中，每个字符2个字节，在其他字符上为4个字节。通常可以在编译器设置中更改此字节。 C++ 11还提供了std::u16string和std::u32string，它们的大小更加明确。

不幸的是，使用C++库读取Unicode文本可能会有些麻烦，因为即使您具有正确的字符串大小，也需要处理BOM和字节序格式，更不用说规范化了。

有一些库可以帮助您解决此问题，但最简单的解决方案可能只是在记事本中打开txt文件，选择另存为，然后选择您更喜欢的编码，例如ANSI。

编辑:如果您对快速又肮脏的解决方案不满意，并且不想使用更好的Unicode库，则可以对标准库进行此操作，但前提是您使用的编译器必须支持C++ 11，例如Visual Studio 2012。

C++ 11添加了一些codecvt构面来处理不同Unicode文件类型之间的转换。这应该适合您的目的，但是库的这一部分的基础设计是在过去或过去设计的，可能很难理解。抓紧你的裤子。

在打开ifstream的行下方，添加以下代码:

infoFile.imbue(std::locale(infoFile.getloc(), new std::codecvt_utf16<char, 0x10FFFF, std::consume_header>));

我知道这看起来有点吓人。它的作用是从现有语言环境的副本中创建一个“语言环境”，然后向该语言环境中添加一个“构面”以处理格式转换。

“语言环境”处理一堆东西，大部分与本地化有关(例如如何标点货币，例如“100.00”与“100,00”)。语言环境中的每个规则都称为构面。在C++标准库中，文件编码被视为这些方面之一。

(背景:回想起来，将文件编码与本地化混在一起可能不是一个很明智的主意，但是在设计库的这一部分时，文件编码通常由程序的语言决定，因此我们陷入了这种情况。)

因此，上面的 locale构造函数将文件流创建的默认 locale的副本作为其第一个参数，第二个参数是要使用的新构面。
codecvt_utf16是用于与utf-16相互转换的一个方面。第一个参数是“宽”类型，即程序使用的类型，而不是字节流中使用的类型。我在这里指定了 char，该代码可与Visual Studio一起使用，但是根据标准，它实际上是无效的。我稍后再讲。

第二个参数是您希望在不引发错误的情况下接受的最大Unicode值，并且在可预见的将来，0x10FFFF表示最大的Unicode字符。

最终参数是一个位掩码，可更改构面的行为。我认为 std::consume_header对您特别有用，因为 wmic输出BOM(至少在我的机器上)。这将消耗该BOM，并根据获取的内容选择将其作为小端流还是大端流处理。

您还会注意到，我正在使用 new在堆栈上创建构面，但没有在任何地方调用 delete。这不是在现代C++中设计库的非常安全的方法，但是就像我说的那样，语言环境是库中相当老的部分。

请放心，您不需要 delete这个方面。确实没有很好地记录下来(因为在实践中很少使用语言环境)，但是默认构造的构面将由其附加的语言环境自动 delete d。

现在，还记得我曾说过使用 char作为宽类型是无效的吗？该标准说，您必须使用 whcar_t， char16_t或 char32_t，如果要支持非ASCII字符，则一定要这样做。最简单的方法是使用 wchar_t，将 ifstream， string， cout和 istringstream更改为 wifstream， wstring， wcout和 wistringstream，然后确保字符串/字符常量前面有一个 L，就像这样:

std::wcout << L"\nLine #" << lineNum << L":" << line << std::endl;

这些就是您使用宽字符串所需的全部更改。但是，还要注意Windows控制台不能处理非ANSI字符，因此，如果您尝试输出这样的字符(当我运行代码时，我打了一个™字符)，则wcout流将无效并停止输出任何内容。如果要输出到文件，这应该不是问题。

您可能会说，我对标准库的这一部分并不特别满意。实际上，大多数想使用Unicode的人都将使用其他库(例如我在评论中提到的库)，或者使用自己的编码器/解码器。

关于c++ - C++ getline添加空格，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16864471/

文章推荐： c++ - 按成员降序对多个对象进行排序？

文章推荐：二进制文件中的 Java 对象流

c++ - C c;之间有什么区别吗？和 C c = C();?
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
c++ - C 风格字符串差异 : C/C++
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
c++ - c\c++ 转换为 C#
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。此帖子已于 8 个月
c# - C、C++、C# 的功能测试工具
除了调试之外，是否有任何针对 c、c++ 或 c# 的测试工具，其工作原理类似于将独立函数复制粘贴到某个文本框，然后在其他文本框中输入参数？最佳答案也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
c# - C/C++/C# 在监视器上设置窗口位置
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法，例如将分辨率加倍或输入负值，但它永远无法将窗口放在我的第二台显示器上。关于如何在 C/C++/c# 中执行此操作的任何线索最
c# - C/C++/C#中的DES实现
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。我正在尝试编写一个 C# 程序，它将使用 DES 算法进行加密和解密。我需要一些实
c# - 在条件中使用赋值是否安全？ C/C++、C#
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
c++ - C/C++/C# 强制窗口在最上面
有没有办法强制将另一个窗口置于顶部？不是应用程序的窗口，而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
c# - 套接字服务器应用程序的选择 : C/C++ or C#
假设您可以在 C/C++ 或 Csharp 之间做出选择，并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例，那么构建套接字服务器应用程序的最明智选择是什么？最佳答案如
c++ - C/C++ 运行时库和 C/C++ 标准库的区别
你们能告诉我它们之间的区别吗？顺便问一下，有什么叫C++库或C库的吗？最佳答案 C++ 标准库和 C 标准库是 C++ 和 C 标准定义的库，提供给 C++ 和 C 程序使用。那是那些词的共同
c++ - &C::c 和 &(C::c) 有什么区别？
下面的测试代码，我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
c++ - 什么 C++(通用 (c/c++) 与 (通用 c)/c++ )
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它，visit the help center 。已关
c# - 通过网络在 C/C++ 服务器、C/C++ 和 C# 客户端之间发送数据结构
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端我想也许我应该使用
c# - C/C++ - 如何将 Buffer.BlockCopy (C#) 转换为 C/C++
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
c++ - C/C++ - 对其他人隐藏 C 或 C++ 函数代码
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码，但我不想与雇主共享该函数的代码。相反，我只想让他有权在他自己的代码中调用该函数。是否可以？我想到了这两种方法 - 在
c# - 在托管代码(C++、C、C++/CLI、C#)中使用非托管代码时处理错误
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等，
c# - C#、C/C++ 或 Objective-C 中的眼动追踪库
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 7 年前。
c++ - C/C++/Objective-C 文本识别库
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，因为
c# - 将 C/C++ 函数导入 C#
我有一些 C 代码，将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
c - C语言中 "c -= --c - c++;"的结果应该是什么？
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - C++ getline添加空格