Парсеобразный парсер для парсинга па…
В свою студенческую бытность, на втором или третьем курсе был у нас предмет не помню как назывался, но помню точно, что мы должны были изучить язык для каких-то Бизонов, Якков, Лексов и Флексов чтобы научится создавать собственные лексические и синтаксические анализаторы каких-то там левосторонних контекстно-свободных грамматик, и в свою очередь, с помощью их, без промблем писать собственные компилированные языки программирования.
Ага. Так вот именно тогда я и услышал это страшное слово парсер, которое мне ровным счетом ничего не говорило. Однако сама фраза «процесс парсинга и синтаксического анализа лексем контекстно-свободных формальных грамматик Бэкуса—Наура» наводила на меня кроличий трепет чего-то охрененно умного, непознанного, сакрального, за гранью моего и не только моего разума. Так как каждый из нас понимал, что собственный язык программирования ему создавать врядли понадобиться, то над предметом особо не заморачивались ни студенты, ни сами преподы, а тем более над такими страшными словами типа парсер, анализатор лексем, БНФ-конструкции и т.д.
Экзамен с горем пополам я сдал и всё связанное с предметом благополучно потер в мозгу за ненадобностью…
Как мы видим, с прошествием времени, пришлось снова вплотную столкнуться с этими заумными терминами и понятиями. В действительности, разобравшись с понятиями по понятиям, выяснилось что ничего страшного и особо заумного в парсинге нет. Если своими словами, парсинг – это процесс обработки текстовой информации при котором происходит определение конкретных участков текста – лексем, подчиняющимся некоторым регулярным правилам. Проводя параллель с SEOшными задачами, то в одна из основных задач сводится к выуживанию нужной информации из выдачи поисковых систем по определённым запросам. Процессом выуживания данных из страницы и является парсинг, средство парсинга, соответственно — парсер.
Ага. Парсер – эта такая полезная и необходимая в хозяйстве тулза из джентльменского набора любого сеошника, будь-то белого, будь-то не очень. Реализаций парсеров море, от скриптов, заточенных под конкретный поисковик, до десктопных программулин в которых парсер, является простым дополнением ко всему комплекту. Глаза разбегаются от обилия оных.
Посему обращен к почтенным моим читателям и братьям SEOшникам. Дорогие, посоветуйте хороший, удобный, многофункциональный парсер для соответственно парсинга поисковой выдачи. Желательно десктопный, желательно биплатный…
Обзор новых возможностей Блогуна.
SEO плагины для Opera, Firefox, IE
Все-таки есть какой-то «коллективный разум». Cегодня решил написать пост про плагины для SEOшников под определенные браузеры (Opera, Firefox, IE). И открыв feedreader, для прочтения последних новостей, увидел такой заголовок: “SEO плагин для пользователей Opera’ы”. И такая ситуация повторяется довольно часто. Только решишь осветить какой-то вопрос, а тут на тебе «топор в плечи». Но все равно раз решил, буду писать.
Opera. Данный браузер у меня пользуется самой большой популярностью, но последние версии не очень радуют (некоторые вопросы с версткой). Итак, SEO-плагин для данного браузера называется — SEObar. Довольно неплохой инструмент написанный на JavaScript. Вполне подходит для SEO-аналитики основных рейтингов по основным поисковым системам. Прочесть про него и скачать можно тут. В догонку про сеошные примочки для Оперы можно почитать у матерого сеошника Дениса Иванова.
Как истинный вебмастер
, я конечно же не ограничиваюсь юзанием только одной Оперой. Посему пользуюсь (исключительно в тестовых целях) и другими не менее популярными веб-бродилками, в которых тоже необходимы аналогичные seo-тулзы, для облегчения работы в сфере поисковой оптимизации. Мощнейший плагин SeoQuake для Mozilla Firefox и IE, позволяющий помимо определения параметров, вплотную работать с ключевиками, определять их частоту, встраивать результаты как непосредственно в поисковую выдачу так и отдельно запрос с панели. Кратко говоря, для того чтобы удивиться от количества предоставляемых данным плагином фич, нужно просто скачать, установить его в свой браузер и радоваться жизнью. Единственное что меня в последние время стало смущать, так это сбор Adsense-идентификаторов для AdsSpy.
Считаю данные плагины просто необходимыми для SEOшников. Соответствующие сервисы для определения различных поисковых параметров меня не особо устраивают, так как все необходимые параметры нужно узнавать на лету. С тулбарами жизнь сеошника становится проще.
Удачи.
Ликбез-памятка по SSH. Список основных (unix os) команд при работе с хостингом
или управляем хостингом через SSH посредством (*nix) команд
В целях экономии трафа, времени, да и вообще для себя, — полезно иметь некоторые знания по работе с SSH-протоколом (Secure Shell).
Немного теории:
SSH он же Secure SHell — сетевой протокол, позволяющий производить удалённое управление компьютером и передачу файлов. Сходен по функциональности с протоколом Telnet и rlogin, однако использует алгоритмы шифрования передаваемой информации.
Криптографическая защита протокола SSH не фиксирована, возможен выбор различных алгоритмов шифрования. Клиенты и серверы, поддерживающие этот протокол, доступны для различных платформ. Кроме того, протокол позволяет не только использовать безопасный удалённый shell на машине, но и туннелировать графический интерфейс — X Tunnelling (только для Unix-подобных ОС или приложений, использующих графический интерфейс X Window System). SSH также способен передавать через безопасный канал (Port Forwarding) любой другой сетевой протокол, обеспечивая (при надлежащем конфигурировании) возможность безопасной пересылки не только X-интерфейса, но и, например, звука.
Поддержка SSH реализована во всех UNIX системах, и на большинстве из них в числе стандартных утилит присутствуют клиент и сервер ssh. Существует множество реализаций SSH-клиентов и для не-UNIX ОС. Большую популярность протокол получил после широкого развития sniffer’ов, как альтернативное небезопасному телнету решение для управления важными узлами.
На данный момент известно две ветки версий — 1 и 2. Однако ветка 1 остановлена, так как в конце 90-x в ней было найдено много уязвимостей, некоторые из которых до сих пор накладывают серьёзные ограничения на её использование, поэтому перспективной, развивающейся и наиболее безопасной является версия 2.
Для работы с хостингом предлагается использовать бесплатным SSH-клиентом — Putty.
Putty — Популярный Telnet и SSH-клиент, т.е. программа для безопасного подключения к удаленному компьютеру (например, веб-серверу) и выполнения на нем различных команд. Чудо программа ведет логи, позволяет настраивать шрифты, цвета и разрешение консоли, допускает сохранение в своей памяти ключей авторизации, поддерживает работу через прокси-сервер.
Таким образом если нам нужно мобильно, безопасно и быстро соединиться с нашим хостингом, скачиваем отсюда писанный клиент и пользуемся. Можно юзать на любом другом компьютере без опаски.
Дальше представлю список основных (unix, linux, bsd) команд, с помощью которых можно легко и быстро управлять своим хостингом:
- cd [директория] — смена/переход в указанную директорию;
- ls -la [директория] — просмотр файловой системы указанной директории;
- cp [опции] [путь источник] [путь назначения] — копирование файлов и директорий;
- rename [старый путь] [новый путь] - изменить имя или расположение файла;
- cat — слияние файлов и выдача на стандартный вывод;
- who - посмотреть кто сейчас находиться в системе;
- id — посмотреть идентификаторы пользователя и группы системы;
- passwd -изменить пароль текущего пользователя;
- mc — запуск Midnight Commander’a, программы (файлого менеджера), предназначенной для просмотра содержимого каталогов и выполнения основных функций управления файлами в UNIX-подобных операционных системах. Help-файл для Midnight Commander (http://www.lib.ru/MAN/mc.txt)
- rm -r [директория] — рекурсивное удаление файловой системы начиная с указанной директории.
ВНИМАНИЕ! Использовать очень ОСТОРОЖНО, на свой страх и риск. Можно йобнуть всё одним нажатием клавиши. - du -ch [директория] — определить суммарный объем занимаемого дискового пространства указанной директории с рекурсивным выводом всех вложенных директорий.
Пример вывода информации только о занимаемом объеме:
[xxx@zxc homelessinbelarus.com]$ du -ch | grep total
5.4M total - unzip [zip-архив] — разархивирование zip-архива в текущую директорию.
- tar — GNU (ГНУ) `tar’ (тар) saves (сохраняет) many (много) files (файлов) together (вместе) into a single tape (в единое целое) or (или) disk archive (архив на диске), and (и) can (может) restore (востанавливать) individual files (индивидуальные файлы) from (из) the archive (архива).
tar xf archive.tar — разархивирование tar-архива в текущую директорию
tar xfz archive.tar.gz — разархивирование gzip-архива в текущую директорию
tar xfj archive.tar.bz2 — разархивирование bzip2-архива в текущую директорию
tar cfz archive.tar.gz dir1/ dir2/file1 — создание gzip-архива
tar cfj archive.tar.bz2 dir1/ dir2/file1 — создание bzip2-архива
Я бычок подниму горький дым затяну, люк открою, полезу домой ... (с)
