Блог ведет Univers
Пишу на темы полезные для человека в общих понятиях и человека интересующегося веб-программированием, unix-системами и Интернетом в целом
Генерация файла sitemap.xml - подразумевает сбор всех ссылок расположенных на страницах вашего сайта, для последующего предоставления поисковикам. Сам файл имеет xml формат (состоит из xml тегов и использует utf-8 кодировку), создан он для предоставления информации о ваших страницах поисковым системам (Google.com, Yandex.ru, Bing.com, Mail.ru, Nigma.ru, Meta.ua, Baidu.com, Turtle.ru и другим). Полезен файл тем, что помогает определять местонахождение страниц вашего сайта и дополнительную информацию, такую как последнее обновление, приоритет (важность) страниц относительно других и частоту обновления той или иной страницы.
В последнее время, можно встретить сообщения о том, что sitemap.xml бесполезен и отчасти - это так. Поисковые роботы и без того найдут все страницы Вашего сайта, однако исходя из текста на "http://support.google.com/webmasters/bin/answer.py?hl=ru&answer=182072" о GoogleBot, "Процедура сканирования начинается с получения списка URL веб-страниц, который создается на основе результатов предыдущих сеансов сканирования. Его дополняют данные из файлов Sitemap, предоставленных веб-мастером." - можно предположить, что наличие этого файла и его своевременное обновление, способствует более быстрой индексации сайта. Приоритеты, частота обновления и информация о последнем изменении страницы - думаю не будут лишними и так уж бесполезными. Также хочется отметить, что поисковик Bing.com, при добавлении нового сайта просит добавить ссылку на файл sitemap.xml - что думаю сделано не просто так и имеет смысл.
Хочется отметить, что если у Вас готовая CMS (Wordpress, Joomla, Modx, Eleanor, Bitrix и другие) - то дальше Вам читать нету смысла, ибо для большинства CMS уже созданы моды/плагины/расширения для генерации карты сайта. Полезен же скрипт будет тем, кто использует самописные сайты или не может найти плагин для своей CMS. Лично я, пользуюсь собственнонаписанной CMS, поэтому создание этого скрипта было необходимостью. Конечно, существуют готовые решения для генерации, онлайн сервисы генерации и сложные скрипты, которые я какое-то время адаптировал под себя, но обилие лишних настроек и непонятного (местами лишнего) кода - стало для меня весьма надоедливо. Поэтому был написан этот простой и лёгкий скрипт, выполняющий основные действия для генерации sitemap.xml, с минимальными и понятными настройками.
Код скрипта размещён на http://makefuture.net/article/view/generator-karty-sajta-xml-php/, хочу заметить, что код тестовый и стоит его проверить на роботоспособность под вашим проектом, прежде, чем вы запустите его на продакшене.
Теги: sitemap, sitemap.xml, карта сайта