gpt4 book ai didi

python - 匹配第一个字母数字字符跳过(|An?)

转载 作者:可可西里 更新时间:2023-11-01 08:22:48 27 4
gpt4 key购买 nike

我有一个艺术家、专辑和轨道的列表,我想使用它们各自名称的首字母进行排序。当我想忽略“The”、“A”、“An”和其他各种非字母数字字符时,问题就来了(Talking to you "Weird Al"Yankovic and [dialog])。 Django 有一个很好的开始 '^(An?|The) +' 但我想忽略那些和我选择的其他一些。

我在 Django 中执行此操作,使用带有 utf8_bin 排序规则的 MySQL 数据库。

编辑

好吧,我没有提到这一点是我的错,但我正在访问的数据库已经准备就绪了。它由 Amarok 创建和维护如果没有一大堆问题,我无法改变它。话虽如此,艺术家表中的 The Chemical Brothers 列为 The Chemical Brothers,所以我想我被困在这里了。它可能会很慢,但这对我来说并不是什么大问题,因为这是一个个人项目。

最佳答案

您要求的可能不是您需要的。您可能不想只按第一个字母排序。如果第一个字母相同,那么您通常还想查看第二个字母,依此类推。这会导致在按艺术家排序时同一艺术家的所有歌曲被归为一组。

更新的答案

您说过不允许更改数据库。然后你可以使用TRIM(LEADING ... FROM ...)去除不感兴趣的单词,但请注意,这会很慢,因为查询将无法在列上使用索引。

SELECT *
FROM song
WHERE SUBSTRING(TRIM(LEADING 'The ' FROM TRIM(LEADING 'A ' FROM title)), 1, 1) = 'B'
ORDER BY TRIM(LEADING 'The ' FROM TRIM(LEADING 'A ' FROM title))

结果:

'The Bar'   -- "The" is ignored when sorting.'Baz A'    

Test data:

CREATE TABLE song (title NVARCHAR(100) NOT NULL);
INSERT INTO song (title) VALUES
('The Bar'),
('Baz A'),
('Foo'),
('Qux'),
('A Quux');

原始答案

另请注意,如果您ORDER BY 一个列的函数,当您有大量记录时它会非常慢,因为该列的索引无法使用。相反,您应该存储另一列,在其中删除所有无趣的词(the、an 等)并按该列排序。您可以在插入行时从应用程序插入该列,也可以在数据库中使用触发器。

关于python - 匹配第一个字母数字字符跳过(|An?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2614919/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com