Тормоз! Продли домен!
Мля, что-то я совсем забил на свой бомжебложек. Постюсь раз в месяц, это вообще уже до какой степени охренеть надо. Год начался уже как месяц назад, а я никак не могу прийти в норму. Вечно нахожу себе оправдания для нихренанеделания. То работы непочатый край, то устал от нее – отдохнуть надо, то убунту поставлю – винт нах наверну со всем добром своим нажитым, то ещё какая-нибудь халера. Хватаюсь за то, за это, а конечного результата как-то и не видно.
Ладно, харэ хныкать. Во-первых, хочу поблагодарить Тормоза за бесплатную блогоферму. Было очень приятно получить такой новогодний подарочек. Уже 23 февраля на носу, а я ещё про новый год талдычу. Кто из нас ещё тормоз? Ну да ладно.
Признаться, от блогофермы я ожидал немного большего. В плане функциальности что-ли, юзабельности. Хотя это конкретно для меня, это – не главное. Сама идея использовать связку Yahoo Pipes->Блогоферма->Blogger это уже открытие. И Тормоз отлично показал, как стандартными и подручными инструментами добиться работоспособности данной схемы.Поковырявшись в скриптах блогофермы, я загорелся желанием, написать свою блогораму, которая будет удовлетворять моим требованиям. Посмотрим что из этого желания получиться.
Ммда. Чуть не забыл. Опрос-то висит себе целый месяц уже как просраченный, а я и в ус не дую.
Итак, оглашаю результаты голосования. На вопрос «Как вы благодарите блоггера за хороший пост?»:
- 8% опрошенных ответили «Пусть скажет спасибо, что я вообще зашел!» Тем самым говоря, что выразили благодарность в самом факте своего присутствия на блоге;
- 14% – вообще никак не реагируют;
- 21% – оставляют комментарий;
- 23% – просто и без сантиментов тырят понравившийся контент;
- 31% – ссылаются на статью в своем блоге.
Всего в опросе участвовало 89 респондентов. Такие вот дела, братцы кролики.
ЗЫ. А и ещё прикол зашел сейчас на http://brokenbrake.biz. И первая мысль, – «Оба! Тормоз дизайн поменял. С тетками
«. Присмотрелся лучше, а там надпись «This domain name expired on Jan 30, 2008».

Тормоз! Продли домен!
Выкидываем сами себя из SERP’a
SEO-оптимизация блоггерского темплейта
Предпосылкой к написанию данного поста явилась статья Бананового Рая. Пересказывать своими словами не буду, лучше сошлюсь на первоисточник с цитированием.
Казалось бы, чем больше страниц в индексе, тем больше посетителей придет на ваш сайт. Ан нет. Часто бывает с точностью до наоборот. Вот живой пример. Вы делаете блог на каком-нибудь вордпрессе. Собираете посты по определенным кеям, оптимизируете их, раскладываете по категориям. В общем все по-взрослому. Гугл потиху индексирует ваш сайт, посетители начинают заходить из серпа, но, вдруг, поток посетителей резко уменьшается, а половина страниц которые вы так упорно позиционировали по своим фразам ушла в саплиментал. Вы начинаете пристально разглядывать как там в гугле проиндексировался ваш сайт, и к своему ужасу узнаете, что страницы с самими постами ушли в сплиментал, а вместо них в основную выдачу попали списки статей по категориям. Естественно эти списки в серпе гугла по вашим кеям будут сидеть далеко не на первых местах, и чаще всего даже не на первых страницах. Вот и получилось, что гугл просто выдавил из основного поиска ваши правильные страницы, причем выдавил их в пользу ваших же страниц списков категорий. Так что после этого вебмастеру остается только robots.txt править и запрещать гуглю индексировать на вашем сайте что-то в ущерб основным страницам.
Я полагаю всем всё предельно ясно.
Соглашусь с автором статьи по поводу того, что “не стоит отдавать свой сайт просто так на откуп поисковому боту”, так как самолично не раз наблюдал в SERP’e картину, когда архивы по месяцам красовались на топовых позициях, вытесняя из выдачи правильные постовые страницы.
Все бы ничего, поправил robots.txt и спи спокойно, жди когда поисковые боты прочитают правила и примут их на карандаш. Однако прамблема в том, что наш горячо-любимый Blogger не предоставляет доступ к robots.txt.
Ну как говориться, если гора не идет к Магомету, то … попробуем подойти к проблеме с другой стороны. Вариант со сменой хостинга на свой собственный я не рассматриваю, так как смысла в этом я особо не вижу. Если уже менять хостинг, то зачем тогда вообще на Blogger’е оставаться.
Итак, что нам нужно сделать? Правильно. Нам нужно сделать так чтобы страницы архива не индексировались поисковиком, т.е. выкидываем все непотребное из SERP’a. Сделать это можно, через соответствующий мета-тэг:
<meta content='noindex,follow' name='robots'/>
Однако если взять его и тупо вставить в блоггерский темплейт, то уверяю вас, – ничего хорошего из этого не получится. Так что, тупо нам не надо.
Нужно найти условие, при котором можно было бы определить является ли загружаемая страница архивом за какой-то период или нет. Если является, то получи с полки пирожок, если нет, то – нет.
Порыскав по внутренностям темплейта, искомое условие, было найдено. И тот час же применено на блоге в виде заветных комбинаций строк:
<b:if cond='data:blog.pageType == "archive"'> <meta content='noindex,follow' name='robots'/><b:else/> <meta content='all' name='robots'/></b:if>
Через пару недель, архивные страницы полностью ушли из SERP’a, оставив после себя ссылки на правильные посты с осмысленными заголовками.
Вот и сказочке конец, кто прочёл, тому зач0т
Защита от сервиса с непристойным названием
или Окапываемся в SAPE (часть 3)
После нахождения в сети злополучного для всех саповцев сервиса определения продажных ссылок, и даже подняв вокруг него небольшую шумиху на ньюсе2.ру (отдельное спасибо s13 за размещение новости). Я несколько был поражен и озадачен алгоритмом, с помощью которого система, в моем случае, безошибочно определяла автоматически расставленные ссылки. В скором времени я разобрался, что и по чем, тем самым обезопасил свои ресурсы от грозного сервиса с незвучным названием.
Вкратце поясню, принцип работы сервиса для тех, кто в бронетранспортёре.
Как, в общем-то, и ожидалось, алгоритм оказался до безобразия простым. Получая на вход исследуемую ссылку, сервис подставлял к урлу мусор в виде дополнительных параметров, тем самым нагло изменяя ссылку, которую сравнивает саповский скрипт с находящейся в файле links.db.
Проще говоря, получая на вход такой линк http://site.ru/, сервис загружает сраницу, затем генерит примерно следующий урл http://site.ru/?vsyakiy_musor=!@#$^%&*() и по нему загружает вторую страницу. Сравнивает их, берет разность по ссылкам и считает ее продажной.
Зная этот ключевой момент, просто делаем так чтобы саповский скрипт правильно сравнивал полученный урл с имеющемся с базе линков.
Расскажу что я сделал для того чтобы обмануть сервис. Для этого залез в sape.php
С помощью метода тыка и добрался до этого блока.
... // Убиваем PHPSESSID if (strlen(session_id())) { $session = session_name() . '=' . session_id(); $this->_request_uri = str_replace(array('?'.$session,'&'.$session), '', $this->_request_uri); }...
В данном блоке производится выкашивание из $this->_request_uri идентификатора сессии. И мне показалось данная операция является очень схожей с той которая нам нужна. Только в моем случае надо убивать не только сессию, но и все что приходит после символа ‘?’.
Вдоволь повозившись мануалом по регулярным выражениям в php, через некоторое время добавил следующую строчку.
$this->_request_uri = preg_replace('/\?\S*/',"",$this->_request_uri);
Сохранил изменения. Проверяю…
Еззз! После этих манипуляций чудо-сервис прекратил определять все автоговнолинки.
Ну что господа?! Кто ещё не в Sape?! Бегом регаться, пока ироды какой-нибудь другой бяки не придумали
А чуть не забыл. Хочу предупредить, данное решение работает только на урлах без параметров и/или поверх ЧПУ-ссылок. То есть если сравниваемые урлы будут с параметрами, то задача по противостоянию усложняется в разы. Как я вижу, нужно будет определять все допустимые параметры и с помощью тех же регулярных выражений, но более извращенных, производить их фильтрацию. Но это охрененное усложнение. Лучше и проще, на мой взгляд, юзать mod_rewrite, тем более в популярных движках поддержка ЧПУ-ссылок уже является стандартом де-факто.
Ещё на всякий случай, сниму всю ответственность за неправильное истолкование и использование представленной здесь информации. Короче люди, если что-то у кого-то не заработает – я не виноват. Перед экспериментами советую сделать бэкап скрипта, а лучше всего сайта.
Я бычок подниму горький дым затяну, люк открою, полезу домой ... (с)
