我有一个艺术家,专辑和曲目的列表,我想使用它们各自名称的首字母进行排序.当我想忽略“ The”,“ A”,“ An”和其他各种非字母数字字符时(与您交谈“ Weird Al” Yankovic和[dialog]),问题就来了. Django有一个不错的开始’^(An?| The)’,但我想忽略这些以及其他一些我选择的东西.
我在Django中使用带有utf8_bin排序规则的MySQL数据库执行此操作.
编辑
好吧,我的错是没有提到这个,但是我正在访问的数据库只是准备好了.它是由Amarok创建和维护的,没有很多问题,我无法更改它.话虽如此,艺术家表中的The Chemical Brothers列为The Chemical Brothers,所以我想我留在这里了.这可能会很慢,但这对我来说不是什么大问题,因为它是一个个人项目.
最佳答案
您所要的可能不是您所需要的.您可能不想仅按首字母排序.如果第一个字母相同,则通常还需要查看第二个字母,依此类推.这将导致在按艺术家排序时,同一艺术家的所有歌曲都被分组在一起.
更新的答案
您说您不允许更改数据库.然后,您可以使用TRIM(LEADING ... FROM ...)
去除不感兴趣的单词,但是请注意,这将很慢,因为查询将无法在列上使用索引.
SELECT *
FROM song
WHERE SUBSTRING(TRIM(LEADING 'The ' FROM TRIM(LEADING 'A ' FROM title)),1,1) = 'B'
ORDER BY TRIM(LEADING 'The ' FROM TRIM(LEADING 'A ' FROM title))
结果:
'The Bar' -- "The" is ignored when sorting. 'Baz A'
测试数据:
CREATE TABLE song (title NVARCHAR(100) NOT NULL);
INSERT INTO song (title) VALUES
('The Bar'),('Baz A'),('Foo'),('Qux'),('A Quux');
原始答案
另请注意,如果您对某列的函数进行ORDER BY,则当您有很多记录时,它将非常缓慢,因为该列的索引无法使用.相反,您应该存储另一列,在其中删除所有无用的单词(the,an等),并按该列排序.您可以在插入行时从应用程序将其插入该列,也可以在数据库中使用触发器.