Основное различие сортирует точность (при сравнении символов на языке) и производительность. Единственный специальный является utf8_bin, который является для сравнения символов в двоичном формате.
utf8_general_ci
несколько быстрее, чем utf8_unicode_ci
, но менее точен (для сортировки). определенный язык utf8 кодирование (такой как utf8_swedish_ci
) содержит дополнительные правила языка, которые делают их больше всего с точностью до вида для тех языков. Большую часть времени я использую utf8_unicode_ci
(я предпочитаю точность маленьким повышениям производительности), если у меня нет серьезного основания предпочесть определенный язык.
можно читать больше на определенных unicode наборах символов на руководстве MySQL - http://dev.mysql.com/doc/refman/5.0/en/charset-unicode-sets.html
По существу Вы ищете это приложение http://www.mediaatelier.com/CheatSheet/ , но для человечности. Я также надеялся найти что-то вроде этого.