- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我有一个 MySQL 表,其中有 120,000 行以 UTF-8 格式存储。有一个字段,产品名称,包含带有许多重音符号的文本。在将其转换为 url 友好形式 (ASCII) 后,我需要使用相同的名称填充第二个字段。
由于 PHP 不直接处理 UTF-8,我使用:
$value = iconv ('UTF-8', 'ISO-8859-1', $value);
将名称转换为 ISO-8859-1,然后是一个巨大的 strstr 语句,将任何带重音的字符替换为其无重音的等效字符(例如,à 变为 a)。
但是,原始文本名称是用智能引号输入的,每次遇到 iconv 都会卡住——我得到:
Unknown error type: [8]iconv() [function.iconv]: Detected an illegal character in input string
为了在使用 iconv 之前去掉智能引号,我尝试使用如下三个语句:
$value = str_replace('’', "'", $value);
(’是UTF-8智能单引号的原始值)
因为文本文件太长,这些str_replace导致脚本每次都超时。
在运行 iconv 之前,从 UTF-8 字符串中删除智能引号(或任何无效字符)的最快方法是什么?
或者,对于整个问题是否有更简单的解决方案?将 UTF-8 中有很多重音符号的名称转换为没有重音符号且拼写正确的 ASCII 名称的最快方法是什么?
最佳答案
Glibc (和 GNU libiconv )supports //TRANSLIT
和 //IGNORE
后缀。
因此,在 Linux 上,这工作得很好:
$ echo $'\xe2\x80\x99'’$ echo $'\xe2\x80\x99' | iconv -futf8 -tiso8859-1iconv: illegal input sequence at position 0$ echo $'\xe2\x80\x99' | iconv -futf8 -tiso8859-1//translit'
我不确定 PHP 使用的是什么 iconv
,但文档暗示 //TRANSLIT
和 //IGNORE
将也在那里工作。
关于mysql - iconv 给 "Illegal Character"加上智能引号——如何去掉它们?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/911587/
#include #include using namespace std; //void multiply(int b); int main() { float total = 0; flo
我正在尝试加载存储在 HDFS 中的 Hadoop 集群上的 informatica 日志文件。我在 Python 中使用 subprocess 来执行此操作,但相信由于文件名而出现错误,我不确定如何
我尝试制作用于 Symfony 2 上传的 ajax 脚本。Chrome 返回此错误: Uncaught TypeError: Illegal invocation jquery.min.js:4 我
这只是一个简单的代码,用于检查一个数字是否是质数,我不知道这是编译器还是代码的问题。如果您能提供一些帮助,我们将不胜感激。 这是代码: #include "stdio.h" int main() {
当我运行这个 bash 脚本时: if [ [$EUID -ne 0] ]; then echo "This script must be run as root" 1>&2 exit 1
我最近偶然发现了 this jcstress 中的示例: @JCStressTest @State @Outcome(id = "10", expect =
我不理解这个错误(C2100:非法间接)。我标记了三个实例——都在底部附近。我在网上看过,我知道这与我的指示有关,但在 8 小时后,我完全迷路了。这里可能还有其他一些错误,但我什至无法分辨,因为我无法
我们正在运行一个 Create React App (CRA) Web 应用程序,我们已向其中添加了 Google Analytics v4。我们使用 ga-4-react 启动分析npm 包。 in
我想将多个图像对象发布到 testphp.php。但控制台打印错误说非法调用。 我已经尝试过: submit $("#sub").click(function(){ // get th
当文本框为空时尝试禁用按钮时,我在 google chrome 控制台中收到此错误: function isEmpty() { var r = document.getElementById;
我只是在玩 timesheet.js的源代码(参见具体行)并遇到一个小错误,请参见下面的代码行: '', 当我生成 HTML 并将其分成两行时,一切正常,但如果我执行以下操作将
public class Flatten { public static int[] flatten(int[][] x) { int totalLength = 0;
我的计算机上有一个 python3 脚本,我可以使用 python3motion_detection.py 运行它,并且该脚本有效,我尝试在我的 Raspberry 上使用它,但失败并显示消息非法指令
我正在尝试最近学到的一些多线程概念,但无法运行它。 它给出了 IllegalMonitorStateException 但没有弄清楚错误发生的原因。 因此,关于代码2线程引用名称填充器和写入器都共享一
这是 html 这是脚本 $('#submit').click(function() { var files = $("[type='file']")[0].fil
我尝试通过ajax提交表单,下面是表单。 Date Upload File
我几天前买了 C++ Primer 这本书,我开始学习这门新语言了! 此刻,我想弄明白为什么我自己写的这个 block 是非法的: 我将一个 const int 初始化为 512;我初始化一个指向 n
我收到以下错误消息 [Err] 1267 - Illegal mix of collations (latin1_swedish_ci,IMPLICIT) and (utf8_general_ci,C
我正在尝试使用本教程创建一个 PostgreSQL 数据库: http://tutorials.jumpstartlab.com/topics/environment/environment.html
我想弄乱 Speech Recognition API,所以我从简单的页面开始,该页面在单击 body 元素时开始识别。我的 scripts.js 文件是: var recognition = new
我是一名优秀的程序员,十分优秀!