Кодировка вордпресс и блогджет - часть 1.
В очередной раз та же ситуация – ставлю вордпресс, предварительно забывая проставить кодировки в базе – все выходит в win1251 по умолчанию, после очередного апгрейда слетают кодировки и я долго и упорно ищу почему это у меня кракозябры вместо текста.
После того как кракозябры первращаются в текст, меня ждет очередной сбрприз – вордпрес напрочь разучивается находить общий язык с блогджетом и публикует от него те же кракоязбры. В моем случае блогджет видимо ВСЕ шлепает в 1251, а мой продвинутый ВП желает общаться исключительно на УТФе, на почве чего у них продолжительный конфликт.
Дяди гуру говорят – нужно их мирить на всех этапах “коммуникации”, то есть в БД все должно
быть в единой кодировке , проставить в сравнении ту же кодировку, в файле установки wp-config.php прописать кодировку
define(’DB_CHARSET’, ‘КОДИРОВКА’);
да, и в установках вордпресса в options указать ту самую единую кодировку чтения. Все гуру по моим наблюдениям в силу разных не интересующих меня причин говорят – только UTF. И типа жизнь наладится – что ж проверим, не просто так же ж они гуру.
Этап первый – смотрим на кошмар в моей базе – там все почему-то в перемешку, в структуре и обзоре вижу мешанину кодировок, часть в utf_general_c часть в cp1251_general_ci. Буду тыкать тыковкой. Может и есть способ проще…. : ( Заменяю 1251 на утф… в “структуре” для записей и в “операциях” для таблиц…
…
… тыкаю…
… все еще тыкаю…
… и все еще тыкаю….
… это ужасно, знаете-ли?…
… почти…
проверила все таблицы и записи, проверяю сравнение для всей таблицы (операции) – есть, закончено.
Этап второй – в меню ВП смотрю оptions – reading & writing, параметр в
Encoding for pages and feeds: utf8
Опля – текст новый появился, старый превратился в кракозябры. Тоесть мой блогджет научился писать тексты в кодировке UTF-8. УРА! Но все старые записи, получается, храняться в базе в кодировке windows-1251.
Хм… /*чешу за ухом*/
Значит, придется идти на экстренные меры
Идем в базу, делаем экспорт на вкладке Экспорт - можно всей базы, если кодировка летит повсеместно, можно только отдельные таблицы, если например посты выводятся кракозябрами, а вот технические тексты типа заголовков, слов Рубрика, Архив и т. п., выводятся правильно в UTFe. Берем полученый текстик (вообще круто сохранять дамп базы именно как *.sql), открываем его через Internet Explorer - все-таки у этого браузера есть хоть что-то хорошее. Он позволяет сохранять обычный тестовый файл в заданой кодировке. Если у нас база целиком в одной кодировке, то это легко, пересохраняем в УТФе и дело с концом. Если нет - придется покопипастить, чтобы она вся была одинаковая После этого импортируем ее обратно и все. Наш сайт ведет теперь себя адекватно!
Но! Если вдруг ИЕ не захотел работать так же, как не захотел конкретно в этот раз работать у меня, не отчаиваемся а идем в гугл и спрашиваем у него программу для перекодировки текста. Мне он предложил Shtirlitz IV 4.01, который и впрямь спас мою жизнь в этот казалось бы безвыхдный момент. Через него пропускаем текст базы, он все распознает, сохраням в формате УТФ и заливаем обратно на сервер.
Как можно видеть, у меня все сложилось ![]()









