- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个数据库,其中一些元素由 HTML 特殊字符组成:
| Universidad Tecnológica Nacional - UTN |
| Instituto Tecnológico de Buenos Aires |
| Instituto Superior del Profesorado "Dr. Joaquín V. González" |
| Escuela Nacional de Náutica "Manuel Belgrano" |
| Conservatorio Nacional de Música "Carlos López Buchardo" |
| Instituto Argentino de Computacion - IAC |
| Conservatorio de Superior de Música "Manuel de Falla" |
我需要将其转换为正确的 UTF 格式。 除了遍历数据库并将每个代码映射到等效符号之外,我还能做得更好吗?
á -> 'á'
" -> '"'
...
最佳答案
如 my comment above 中所述,非常不清楚您在自己的情况下要做什么。
Can I do better than just iterating through the database, and having a mapping from each code to the equivalent symbol?
嗯,是的。您可以用替换字符替换字符代码实体(例如 {
和 ƫ
),而无需在“映射”中查找字符代码。但是命名实体(例如 "
)总是需要被查找。
这是我解决一般情况的尝试:
创建一个表来存储在 HTML 中定义的命名字符实体:
CREATE TABLE ents (
ref VARCHAR(8) NOT NULL COLLATE utf8_bin,
rep CHAR(1) NOT NULL,
PRIMARY KEY (ref)
);
填充此表 - 我建议使用脚本,例如来自 PHP 的脚本:
$dbh = new PDO("mysql:dbname=$dbname", $username, $password);
$dbh->setAttribute(PDO::ATTR_EMULATE_PREPARES, FALSE);
$ins = $dbh->prepare('INSERT INTO ents (ref, rep) VALUES (?, ?)');
$t = get_html_translation_table(HTML_ENTITIES);
foreach ($t as $k => $v) $ins->execute([substr($v, 1, -1), $k]);
定义一个 SQL 函数来执行实体替换(在适用的情况下使用此表,否则使用字符代码):
DELIMITER ;;
CREATE FUNCTION dhe(s TEXT) RETURNS TEXT
BEGIN
DECLARE n, p, i, t INT DEFAULT 0;
DECLARE r VARCHAR(12);
entity_search: LOOP
SET n := LOCATE('&', s, n+1);
IF (!n) THEN
LEAVE entity_search;
END IF;
IF (SUBSTRING(s, n+1, 1) = '#') THEN
CASE
WHEN SUBSTRING(s, n+2, 1) RLIKE '[[:digit:]]' THEN
SET t := 2, p := n+2, r := '[[:digit:]]';
WHEN SUBSTRING(s, n+2, 1) = 'x' THEN
SET t := 3, p := n+3, r := '[[:xdigit:]]';
ELSE ITERATE entity_search;
END CASE;
ELSE
SET t := 1, p := n+1, r := '[[:alnum:]_]';
END IF;
SET i := 0;
reference: LOOP
IF SUBSTRING(s, p+i, 1) NOT RLIKE r THEN
IF SUBSTRING(s, p+i, 1) RLIKE '[[:alnum:]_]' THEN
ITERATE entity_search;
END IF;
LEAVE reference;
END IF;
IF i = 8 THEN ITERATE entity_search; END IF;
SET i := i + 1;
END LOOP reference;
SET s := CONCAT(
LEFT(s, n-1),
CASE t
WHEN 1 THEN COALESCE(
(SELECT rep FROM ents WHERE ref = SUBSTRING(s, p, i))
, SUBSTRING(s, n, i + IF(SUBSTRING(s, p+i, 1)=';',1,0))
)
WHEN 2 THEN CHAR(SUBSTRING(s, p, i))
WHEN 3 THEN CHAR(CONV(SUBSTRING(s, p, i), 16, 10))
END,
SUBSTRING(s, p + i + IF(SUBSTRING(s, p+i, 1)=';',1,0))
);
END LOOP entity_search;
RETURN s;
END;;
DELIMITER ;
两次应用此函数来解码您的(显然)双重编码的表格:
UPDATE my_table SET my_column = dhe(dhe(my_column));
关于mysql用UTF等价物替换html特殊字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13890363/
我以一种特殊的方式收到以下错误。 The point at which the driver is attempting to click on the element was not scrolle
我有一些包含如下方法的编译库: public boolean foo(String userID) { Class ntSystemClass = Thread.currentThread()
假设我有下表 name | genre --------------------- book 1 | scifi book 2 | horror book 3
我正在用代码进行语言翻译。 self.title.text = [NSString stringWithFormat:NSLocalizedString(@"Q%ld", nil), (long)qu
我想这样做,但到目前为止,我所拥有的只是: print("Will you go out with me?") 我希望代码能够正常工作,以便人们可以回答“是/否”,如果回答是"is",则将返回一条消息
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: How can I decode html characters in c#? 我有来自 HTML 的字符,
我想在 JavaScript 中对以下形式的字符串执行 ucwords(),它应该返回 Test1_Test2_Test3。 我已经在 SO 上找到了一个 ucwords 函数,但它只需要空格作为新词
“任何长度的正数表示为数字字符数组,因此介于‘0’和‘9’之间。我们知道最重要的密码位于数组索引 0 的位置。 例子: - 号码是 10282 - 数组将是数字 = [1,0,2,8,2] 考虑到这一
我目前正在开发一个显示特殊 unicode 字符(例如 ꁴ)的应用 现在我遇到了在旧设备上无法显示这些符号的问题。我如何知道它是否适用于当前设备? 我是否必须为每个 SDK 版本创建一个虚拟 Andr
在 HTML、XML 和部分 DTD 中,有两种特殊的标记结构: 以感叹号开头的标签结束,例如 和 以问号开头的标签 ,例如 和 我的问题是,这些构造类型中的每一种是否都有不同的名称,或者我是否必
我目前正在用 python 构建一个 shell。shell 可以执行 python 文件,但我还需要添加使用 PIPE 的选项(例如“|”表示第一个命令的输出将是第二个命令的输入)。 为了做到这一点
我的 MVC 项目中的路由无法正常工作... 我希望我所有的 View 都在 Views > Shared 文件夹中,如下所示: Error.cshtml (default) Index.cshtml
我有一个函数: public static ImageIcon GetIconImageFromResource(String path){ URL url = ARMMain.class.g
好的,所以我想在我的 html 页面中包含下面的字符。看起来很简单,只是我找不到它们的 HTML 编码。 注意:我想在没有大小元素的情况下执行此操作,纯文本就可以了 ^_^。 干杯。 最佳答案 你可以
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 3 年前。
我是 C# 的新手,正在尝试使用 ASP.Net GridView(框架 3.5),当 gridView 文本包含以下内容时,我发现了一个大问题: ñ/Ñ/á/Á/é/É/í/Í/ó/Ó/ú/Ú or
在 Java 中,我尝试编写一个正则表达式来匹配特殊类型的 HTTP URL: http:///# 所以字符串有 4 段: 字符串文字:“http://”;那么 任意 1 个以上字符的字符串;那么 字
当我写查询时,我在表中有“to”列 SELECT to FROM mytable mysql_error 返回错误,如果将单词to插入``引号,即 SELECT `to` FROM mytable 查
我遇到了一个问题。事实上,我使用越南语文本,我想找到每个包含大写字母(大写字母)的单词。当我使用“re”模块时,我的函数 (temp) 没有捕捉到像“Đà”这样的词。另一种方法 (temp2) 是一次
在我的文本中,我想用一个空格替换以下特殊字符: symbols = ["`", "~", "!", "@", "#", "$", "%", "^", "&", "*", "(", ")", "_",
我是一名优秀的程序员,十分优秀!