- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
在 C 数组/字符串中,如果文件有 BOM,我如何正确检测文件的开头是否有内容,因为有时 BOM 占用 1 个字符,有时 BOM 占用 3 个字符,等等次 BOM 不存在,导致 x 的实际位置并不总是从索引 0 开始
大多数时候是这个(十六进制)“ef bb bf”例如:
ef bb bf 23 21 2f 62 69 6e 2f 62 61 73 68 0a 61 20 26 26 20 62 0a 67 20 : ...#!/bin/bash.a && b.g
会是这样吗?
#include <stdio.h>
#include <stdlib.h>
#include <stdbool.h>
struct BOM {
int is_BOM;
int length;
int type;
char * type_as_string;
char * BOM;
}
int matches(char * BOM_, char * string_, int length_) {
char * b = BOM_+1;
for(int i = 0; i < length_; i++) {
if (string_[i] == b[i]) matches = 1;
else {
matches = 0;
break;
}
}
return matches;
}
#define ifbom(bom_struct, is_BOM_, length_, type_, type_as_string_, BOM_, string_) if (matches(BOM_, string_, length_)) { \
bom_struct.is_BOM = is_BOM_; \
bom_struct.length = length_; \
bom_struct.type = type_; \
bom_struct.type_as_string = type_as_string_; \
bom_struct.BOM = BOM_+1 /* remove the ^ at the start */ ; \
}
#define elifbom(bom_struct, is_BOM_, length_, type_, type_as_string_, BOM_, string_) else ifbom(bom_struct, is_BOM_, length_, type_, type_as_string_, BOM_, string_)
#define elbom(bom_struct, is_BOM_, length_, type_, type_as_string_, BOM_) else { \
bom_struct.is_BOM = is_BOM_; \
bom_struct.length = length_; \
bom_struct.type = type_; \
bom_struct.type_as_string = type_as_string_; \
bom_struct.BOM = BOM_; \
}
#define cat 0
#define hex 1
#define both 2
#define json 3
int mode;
void __hexdump(unsigned char *buffer, unsigned long index, unsigned long width)
{
unsigned long i;
if (mode == both || mode == hex) {
for (i = 0; i < index; i++)
printf("%02x ", buffer[i]);
}
if (mode == both) {
for (unsigned long spacer = index; spacer < width; spacer++)
printf("\t");
printf(": ");
}
if (mode == cat || mode == both || mode == json) {
for (i = 0; i < index; i++)
{
if (buffer[i] < 32 || buffer[i] >= 127)
printf(".");
else
printf("%c", buffer[i]);
}
}
printf("\n");
}
int __hexdump_string(char *infile, unsigned long start, unsigned long stop, unsigned long width)
{
char ch;
unsigned long f_index = 0;
unsigned long bb_index = 0;
unsigned char *byte_buffer = malloc(width);
if (byte_buffer == NULL)
{
printf("Could not allocate memory for byte_buffer\n");
return -1;
}
while (*infile)
{
ch = *infile;
if ((f_index >= start) && (f_index <= stop))
{
byte_buffer[bb_index] = ch;
bb_index++;
}
if (bb_index >= width)
{
__hexdump(byte_buffer, bb_index, width);
bb_index = 0;
}
f_index++;
infile++;
}
if (bb_index)
__hexdump(byte_buffer, bb_index, width);
free(byte_buffer);
return 0;
}
#define builtin__BOM_print(bom_struct) { \
printf("%s.is_BOM = %s\n%s.length = %d\n%s.type = %d\n%s.type_as_string = %s\n%s.BOM = ", #bom_struct, bom_struct.is_BOM?"yes":"no", #bom_struct, bom_struct.length, #bom_struct, bom_struct.type, #bom_struct,bom_struct.type_as_string, #bom_struct); \
mode = both; \
__hexdump_string(bom_struct.BOM, 0, bom_struct.length, 5); \
}
struct BOM builtin__BOM_get(char * string) {
struct BOM bom;
ifbom(bom, true, 3, 1, "UTF-8", "^\xef\xbb\xbf", string)
elifbom(bom, true, 2, 2, "UTF-16 (BE)", "^\xfe\xff", string)
elifbom(bom, true, 2, 3, "UTF-16 (LE)", "^\xff\xfe", string)
elifbom(bom, true, 4, 4, "UTF-32 (BE)", "^\x00\x00\xfe\xff", string)
elifbom(bom, true, 4, 5, "UTF-32 (LE)", "^\xff\xfe\x00\x00", string)
elifbom(bom, true, 5, 6, "UTF-7", "^\x2b\x2f\x76\x38\x3d", string)
elifbom(bom, true, 4, 7, "UTF-7", "^\x2b\x2f\x76\x38", string)
elifbom(bom, true, 4, 8, "UTF-7", "^\x2b\x2f\x76\x39", string)
elifbom(bom, true, 4, 9, "UTF-7", "^\x2b\x2f\x76\x2b", string)
elifbom(bom, true, 4, 10, "UTF-7", "^\x2b\x2f\x76\x2f", string)
elifbom(bom, true, 3, 11, "UTF-1", "^\xf7\x64\x4c", string)
elifbom(bom, true, 4, 12, "UTF-EBCDIC", "^\xdd\x73\x66\x73", string)
elifbom(bom, true, 3, 13, "SCSU", "^\x0e\xfe\xff", string)
elifbom(bom, true, 3, 14, "BOCU-1", "^\xfb\xee\x28", string)
elifbom(bom, true, 4, 15, "GB-18030", "^\x84\x31\x95\x33", string)
elbom(bom, false, 0, 0, "Not present", "Not present")
return (struct BOM) bom;
}
int main()
{
struct BOM t = builtin__BOM_get("test");
builtin__BOM_print(t);
return 0;
}
最佳答案
您应该阅读第一个字符以了解 BOM 是否存在。
根据 BOM 长度,您知道实际文件数据从哪个索引开始。
您可以在维基百科页面上找到更完整的 BOM 列表:https://en.wikipedia.org/wiki/Byte_order_mark#Byte_order_marks_by_encoding
关于C检查x是否在文件开头时如何跳过BOM,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51518244/
我有一个 if 语句,如下所示 if (not(fullpath.lower().endswith(".pdf")) or not (fullpath.lower().endswith(tup
然而,在 PHP 中,可以: only appears if $foo is true. only appears if $foo is false. 在 Javascript 中,能否在一个脚
XML有很多好处。它既是机器可读的,也是人类可读的,它具有标准化的格式,并且用途广泛。 它也有一些缺点。它是冗长的,不是传输大量数据的非常有效的方法。 XML最有用的方面之一是模式语言。使用模式,您可
由于长期使用 SQL2000,我并没有真正深入了解公用表表达式。 我给出的答案here (#4025380)和 here (#4018793)违背了潮流,因为他们没有使用 CTE。 我很欣赏它们对于递
我有一个应用程序: void deleteObj(id){ MyObj obj = getObjById(id); if (obj == null) { throw n
我的代码如下。可能我以类似的方式多次使用它,即简单地说,我正在以这种方式管理 session 和事务: List users= null; try{ sess
在开发J2EE Web应用程序时,我通常会按以下方式组织我的包结构 com.jameselsey.. 控制器-控制器/操作转到此处 服务-事务服务类,由控制器调用 域-应用程序使用的我的域类/对象 D
这更多是出于好奇而不是任何重要问题,但我只是想知道 memmove 中的以下片段文档: Copying takes place as if an intermediate buffer were us
路径压缩涉及将根指定为路径上每个节点的新父节点——这可能会降低根的等级,并可能降低路径上所有节点的等级。有办法解决这个问题吗?有必要处理这个吗?或者,也许可以将等级视为树高的上限而不是确切的高度? 谢
我有两个类,A 和 B。A 是 B 的父类,我有一个函数接收指向 A 类型类的指针,检查它是否也是 B 类型,如果是将调用另一个函数,该函数接受一个指向类型 B 的类的指针。当函数调用另一个函数时,我
有没有办法让 valgrind 使用多个处理器? 我正在使用 valgrind 的 callgrind 进行一些瓶颈分析,并注意到我的应用程序中的资源使用行为与在 valgrind/callgrind
假设我们要使用 ReaderT [(a,b)]超过 Maybe monad,然后我们想在列表中进行查找。 现在,一个简单且不常见的方法是: 第一种可能性 find a = ReaderT (looku
我的代码似乎有问题。我需要说的是: if ( $('html').attr('lang').val() == 'fr-FR' ) { // do this } else { // do
根据this文章(2018 年 4 月)AKS 在可用性集中运行时能够跨故障域智能放置 Pod,但尚不考虑更新域。很快就会使用更新域将 Pod 放入 AKS 中吗? 最佳答案 当您设置集群时,它已经自
course | section | type comart2 : bsit201 : lec comart2 :
我正在开发自己的 SDK,而这又依赖于某些第 3 方 SDK。例如 - OkHttp。 我应该将 OkHttp 添加到我的 build.gradle 中,还是让我的 SDK 用户包含它?在这种情况下,
随着 Rust 越来越充实,我对它的兴趣开始激起。我喜欢它支持代数数据类型,尤其是那些匹配的事实,但是对其他功能习语有什么想法吗? 例如标准库中是否有标准过滤器/映射/归约函数的集合,更重要的是,您能
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 9 年前。 Improve
我一直在研究 PHP 中的对象。我见过的所有示例甚至在它们自己的对象上都使用了对象构造函数。 PHP 会强制您这样做吗?如果是,为什么? 例如: firstname = $firstname;
...比关联数组? 关联数组会占用更多内存吗? $arr = array(1, 1, 1); $arr[10] = 1; $arr[] = 1; // <- index is 11; does the
我是一名优秀的程序员,十分优秀!