gpt4 book ai didi

file - Lua - 从文件中读取一个 UTF-8 字符

转载 作者:行者123 更新时间:2023-12-04 21:13:22 28 4
gpt4 key购买 nike

是否可以从文件中读取一个 UTF-8 字符?

file:read(1) 在我打印时返回奇怪的字符。

function firstLetter(str)
return str:match("[%z\1-\127\194-\244][\128-\191]*")
end

函数从字符串 str 返回一个 UTF-8 字符。我需要以这种方式读取一个 UTF-8 字符,但是从输入文件(不想将某些文件读入内存 - 通过 file:read("*all"))

问题与这篇文章非常相似:
Extract the first letter of a UTF-8 string with Lua

最佳答案

function read_utf8_char(file)
local c1 = file:read(1)
local ctr, c = -1, math.max(c1:byte(), 128)
repeat
ctr = ctr + 1
c = (c - 128)*2
until c < 128
return c1..file:read(ctr)
end

关于file - Lua - 从文件中读取一个 UTF-8 字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29856166/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com