- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
长期以来,每当我需要使用正则表达式时,我都会标准化地使用版权符号 ©
作为定界符,因为它是一个不在键盘上的符号,我确定不会在正则表达式中使用它,不像 ! @ #\或/(它们有时都在正则表达式中使用)。
代码:
$result=preg_match('©<.*?>©', '<something string>');
但是,今天我需要使用带有重音字符的正则表达式,其中包括:
代码:
[a-zA-ZàáâäãåąćęèéêëìíîïłńòóôöõøùúûüÿýżźñçčšžÀÁÂÄÃÅĄĆĘÈÉÊËÌÍÎÏŁŃÒÓÔÖÕØÙÚÛÜŸÝŻŹÑßÇŒÆČŠŽ∂ð \,\.\'-]+
在我的 IDE (Eclipse PDT) 的 PHP 文件中包含这个新的正则表达式后,系统提示我将 PHP 文件保存为 UTF-8 而不是默认的 cp1252。
保存并运行 PHP 文件后,每次我在 preg_match() 或 preg_replace() 函数调用中使用正则表达式时,它都会生成一个通用的 PHP 警告(警告:第 x 行的 file.php 中的 preg_match)和正则表达式未处理。
那么——两个问题:
1) 是否有另一个符号适合用作键盘上通常找不到的分隔符 ( `~!@#$%^&*()+=[]{};\':",./<>?|\
) 我可以对其进行标准化,而不必担心必须检查每个正则表达式才能看到如果该符号实际上在表达式中的某处使用?
2) 或者,当文件格式为 UTF-8 时,是否可以使用版权符号作为标准分隔符?
最佳答案
需要纠正的一件事是,如果您的正则表达式和/或输入数据以 UTF-8 编码(在本例中是这样,因为它直接来自 UTF-8 编码文件),您必须使用u
正则表达式修饰符。
另一个问题是版权字符不应用作 UTF-8 中的分隔符,因为 PCRE 函数认为 the first byte of your pattern encodes your delimiter (这可以合理地称为 PHP 中的错误)。
当您尝试使用 copyright sign作为UTF-8中的分隔符,实际保存到文件中的是字节序列0xC2
0xA9
。 preg_match
查看第一个字节 0xC2
并确定它是一个字母数字字符,因为在您当前的语言环境中该字节对应于字符 带有抑扬音符 < 的拉丁大写字母 A/em> (参见 extended ASCII table)。因此会生成警告并立即中止处理。
鉴于这些事实,理想的解决方案是从 ASCII 字符集中选择一个不寻常的分隔符,因为该字符在单字节编码和 UTF-8 中都将编码为相同的字节序列。
我认为可打印的 ASCII 字符对于此目的来说还不够不寻常,因此一个不错的选择是控制字符之一(ASCII 代码 1 到 31)。例如,STX (\x02
) 就符合要求。
连同 u
正则表达式修饰符,这意味着您应该像这样编写正则表达式:
$result = preg_match("\x02<.*?>\x02u", '<something string>');
关于PHP 正则表达式分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17725993/
使用 ListView.separated 我们可以在列表项之间添加 Divider(),但是,一旦我转换到 SliverList,我就看不到我的分隔线了。 delegate: SliverChild
使用 ListView.separated 我们可以在列表项之间添加 Divider(),但是,一旦我转换到 SliverList,我就看不到我的分隔线了。 delegate: SliverChild
我对 Angular 还很陌生。我有一个由一些数据填充的列表项: {{content.Company}} {{content.Town}}, {{content.P
我正在尝试从 SwiftUI 中的 List 中删除“行”分隔符(在 SwiftUI 中称为分隔符)。 我浏览了 List 文档,但我没能找到它的修饰符。 如有任何帮助,我们将不胜感激。 最佳答案 i
我有一个带有 4 个按钮的网格...1 行 4 列。我正在寻找一种方法将左侧的两个按钮与右侧的两个按钮进行视觉分组。我一直在寻找一种使用分隔符执行此操作的方法,但它似乎与 Grid 一起玩得不好,更喜
我对 R 语言相当陌生。所以我有这个包含以下内容的向量: > head(sampleVector) [1] "| txt01 | 100 | 200 | 123.456
我正在尝试连接两列中的值,当我使用 =CONCAT(A2,",",B2) 时,它将连接两列并获得正确的结果 (P0810,P1)。但我正在寻找的是这样的东西(“P0810”,“P1”)。我尝试了 =C
我在这里创建了一个简单的演示。在 amount 字段编辑时,我想显示 , 分隔符?目前,它仅在不处于编辑模式时显示 ,。知道如何实现这一目标吗? DEMO IN DOJO var data = [{
这里是java菜鸟... 这让我抓狂,因为我知道这很简单,但我已经为此工作了 30 分钟...... 这是来自代码战斗: 对于参数 = ["Code", "Fight", "On", "!"] 且分隔
基于这个pywin32基础script如何向托盘菜单 menu_options 添加分隔符? 我还可以让菜单在左键单击时弹出,而不仅仅是右键单击吗? 最佳答案 将 notify 函数(从 URL 中的
我正在使用这段代码: StringTokenizer tokenizer=new StringTokenizer(line, "::"); 拆分以下字符串: hi my name is visghal
- Dropbox login fix - Updated iris viewer * other aspects are to be improved + fix crash on viewing
我试图在每个菜单组之间显示一个分隔线。我已经尝试过为每个组提供一个唯一的 ID,但这没有用。我找到了一些其他解决方案,但它们看起来有点奇怪,比如创建高度为 1dp 的 LinearLayout。 这是
我想为 CONCAT_WS() 选择一个与字段值不冲突的分隔符例如,如果我选择“,”,则字段值可能包含带有“,”的字符串我想选择一个与字段值不冲突的分隔符:( 最佳答案 来自here : CONCAT
我想知道 Sphinx 引擎是否可以使用任何定界符(如普通 MySQL 中的逗号和句点)。我的问题来自于一种冲动,根本不使用它们,而是逃避它们,或者至少在使用 FULLTEXT 搜索执行 MATCH
我正在尝试使用 svg 或纯 css3 制作 header 分隔符,如下所示: preview from design 在 header 中我有标准的 bootstrap 4 轮播
我在使用 CSS 分隔符时遇到了一些难题。看看:http://jsfiddle.net/fVxC6/1/ .div-line { border-bottom: 1px solid #f0f0f
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 关闭 7 年前。 编辑问题以包含 desired behavior, a specific probl
嘿,我正在尝试使用 getline 读取以下行 (15,0,1,#) (2,11,2,.) (3,20,0,S) 我希望能够将整数提取为 int,将字符提取为 char,但我不知道如何只提取它们。 最
我有 2 列,每边 float 一列,我想使用 1px 宽度的线分隔符,从最长列的顶部到底部。 我宁愿远离 TABLE 布局,而且我不知道哪一个将是最长的列,或者它会有多长。 我怎么能只用 css 做
我是一名优秀的程序员,十分优秀!