- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个流,其接下来的 N 个字节是 UTF8 编码的字符串。我想以最少的开销创建该字符串。
这个有效:
var bytes = new byte[n];
stream.Read(bytes, 0, n); // my actual code checks return value
var str = Encoding.UTF8.GetString(bytes);
在我的基准测试中,我看到大量时间以 byte[]
的形式收集垃圾临时工。如果我能摆脱这些,我就可以有效地将堆分配减半。
UTF8Encoding
类没有处理流的方法。
如果有帮助,我可以使用不安全的代码。我不能重复使用 byte[]
缓冲区没有 ThreadLocal<byte[]>
这似乎引入了比减轻更多的开销。我确实需要支持 UTF8(ASCII 不会削减它)。
这里有我缺少的 API 或技术吗?
最佳答案
如果使用可变长度的 UTF8 编码,则无法避免分配 byte[]
。因此,只有在读取所有这些字节后才能确定结果字符串的长度。
让我们看看 UTF8Encoding.GetString
方法:
public override unsafe String GetString(byte[] bytes, int index, int count)
{
// Avoid problems with empty input buffer
if (bytes.Length == 0) return String.Empty;
fixed (byte* pBytes = bytes)
return String.CreateStringFromEncoding(
pBytes + index, count, this);
}
它调用 String.CreateStringFromEncoding
方法首先获取结果字符串长度,然后分配它并用字符填充它而无需额外分配。 UTF8Encoding.GetChars
也不分配任何内容。
unsafe static internal String CreateStringFromEncoding(
byte* bytes, int byteLength, Encoding encoding)
{
int stringLength = encoding.GetCharCount(bytes, byteLength, null);
if (stringLength == 0)
return String.Empty;
String s = FastAllocateString(stringLength);
fixed (char* pTempChars = &s.m_firstChar)
{
encoding.GetChars(bytes, byteLength, pTempChars, stringLength, null);
}
}
如果您将使用固定长度的编码,那么您可以直接分配一个字符串并在其上使用Encoding.GetChars
。但是多次调用 Stream.ReadByte
会降低性能,因为没有 Stream.Read
接受 byte*
作为参数。
const int bufferSize = 256;
string str = new string('\0', n / bytesPerCharacter);
byte* bytes = stackalloc byte[bufferSize];
fixed (char* pinnedChars = str)
{
char* chars = pinnedChars;
for (int i = n; i >= 0; i -= bufferSize)
{
int byteCount = Math.Min(bufferSize, i);
int charCount = byteCount / bytesPerCharacter;
for (int j = 0; j < byteCount; ++j)
bytes[j] = (byte)stream.ReadByte();
encoding.GetChars(bytes, byteCount, chars, charCount);
chars += charCount;
}
}
所以您已经使用了更好的方法来获取字符串。在这种情况下唯一可以做的就是实现 ByteArrayCache
类。它应该类似于 StringBuilderCache
.
public static class ByteArrayCache
{
[ThreadStatic]
private static byte[] cachedInstance;
private const int maxArraySize = 1024;
public static byte[] Acquire(int size)
{
if (size <= maxArraySize)
{
byte[] instance = cachedInstance;
if (cachedInstance != null && cachedInstance.Length >= size)
{
cachedInstance = null;
return instance;
}
}
return new byte[size];
}
public static void Release(byte[] array)
{
if ((array != null && array.Length <= maxArraySize) &&
(cachedInstance == null || cachedInstance.Length < array.Length))
{
cachedInstance = array;
}
}
}
用法:
var bytes = ByteArrayCache.Acquire(n);
stream.Read(bytes, 0, n);
var str = Encoding.UTF8.GetString(bytes);
ByteArrayCache.Release(bytes);
关于c# - 流式传输到 UTF8 字符串,不带 byte[],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34478171/
我一直在做一些关于测量数据传输延迟的实验 CPU->GPU 和 GPU->CPU。我发现对于特定消息大小,CPU->GPU 数据传输速率几乎是 GPU->CPU 传输速率的两倍。谁能解释我为什么会这样
我将 ElasticSearch 用作我的 Post 模型的 Rails pet 项目应用程序的全文引擎。在我的 posts_controller.rb 索引操作中: def index
概述 流经网络的数据总是具有相同的类型:字节,这些字节如何传输主要取决于我们所说的网络传输。用户并不关心传输的细节,只在乎字节是否被可靠地发送和接收 如果使用 Java 网络编程,你会发现,某些时候当
我正在编写一些代码,以便将共享点从该页面转移到另一个页面: Server.Transfer("/DefectManagement/DefectList/default.aspx") 但是我遇到了这个问
我有这个泄漏,任何猜测?这个类有一些奇怪的引用。我的代码的任何地方都没有 contentobserver In com.example:1.5.0:27. com.example.ui.record
我听说过点对点内存传输并阅读了一些关于它的内容,但无法真正理解与标准 PCI-E 总线传输相比它的速度有多快。 我有一个使用多个 GPU 的 CUDA 应用程序,我可能对 P2P 传输感兴趣。我的问题
ftping 文件时,Transmit 中是否有忽略或过滤器列表?我希望它忽略上传 .svn 文件等。 最佳答案 是的。转到首选项并选择 Rules标签。在那里您可以定义要跳过哪些文件的规则。实际上,
我有以下片段来生成声音,在 while 循环中,我想动态更改它,以便它在声音生成期间创建不同频率的声音。 for(uint16_t i = 0; i < sample_N; i++) { da
我正在尝试使用 Delphi 2010 和 Indy 对 Web 服务进行概念验证。我此时的代码是: procedure TForm1.Log(const sEvent, sMsg: String);
我有一个 ActiveMQ JMS 代理,在端口 61616 上使用默认的 openwire TCP 传输公开。 我有许多远程客户端可以绑定(bind)到此代理来监听他们的消息。 如果我想打开 kee
reconnection strategies文档仅使用 JMS 示例,但是 FTP transport documentation确实说明了重新连接策略的使用,但没有任何细节或示例。 进一步,如果你
我有 2 个 TreeView,第一个填充有项目。 try { CheckBoxTreeItem treeRoot = new CheckBoxTreeItem("Root"); tr
在我为学校开发的一个网站上,用户输入他们的学校电子邮件和密码,如果他们已注册,则登录。如果没有,则会显示登录的第二部分,要求输入笔名称并确认密码。正因为如此,以及我复杂的业余 Django 编程,我有
我正在开发一个 Web 服务,我们在其中使用 LINQ-to-SQL 进行数据库抽象。当客户使用我们的网络服务时,对象被序列化为 XML,一切都很好。 现在我们希望开发我们自己的使用本地数据类型的客户
我应该创建一个名为“Backwards”的方法,该方法将列表从尾部横向到头部,但是当我运行代码时,它出现说(第 88 行)它找不到光标 = cusor.prev;象征。我需要在循环中再次设置上一个链接
给定像 Uint8Array 这样的类型化数组,似乎有两种方法可以通过 worker 传输它们。 选项 1 直接发送缓冲区并在接收端进行转换: 发件人:postMessage({fooBuffer:
在 PHP + jQuery 环境中,我和我的 friend 无法得出最佳解决方案。我们正在使用 Ajax 从数据库中获取数据。 解决方案 1 - Ajax 应该只传输数据,而不是 HTML 好处:我
大家好,非常感谢您的宝贵时间。 有一个 std::stringstream 需要传输到远程机器。网络库允许我用以下方法构建数据包: CreatePacket( const void * DATA, s
我正在使用 libcurl 通过 FTP 传输二进制文件 (.exe),并将其保存到本地文件。问题是文件传输后,它已被更改,不再是有效的 Win32 应用程序,因此无法运行。这是我的做法: CURL
各位程序员, 当我将它上传到我的 FTP 时,我的网站出现此错误:资源被解释为样式表,但使用 MIME 类型文本/纯文本传输 BlahBlahi
我是一名优秀的程序员,十分优秀!