Автоблог на переводном контенте

Список лент новостей
Управление каталогом лент новостей

Скрипт собирает и переводит онлайн-переводчиками новости с заданных сайтов-источников, следит за их обновлением через ленты RSS, парсит полные тексты новостей непосредственно со страниц сайтов. Ленты новостей можно группировать с помощью тематического каталога.

Парсинг без шаблонов производится разработанным специально для этого проекта автоматическим парсером страниц. Парсер без шаблонов на основе статистического анализа кода страницы определяет текстовый блок новости с вероятностью успеха около 9 случаев из 10. Не поддаются парсингу без шаблонов только сайты с нестандартной версткой или очень короткими в несколько слов статьями.

Затем собранные статьи переводятся в заданном языковом направлении, формируя таким образом уникальный контент для автоблогов. Поддерживаются онлайн-переводчики Google и Pragma, возможен многопоточный перевод.

Переведенные статьи публикуются на блогах соответственно с заданной для каждого блога периодичностью публикации. Скрипт не ограничен определенным движком блога, он теоретически может публиковать статьи на любых блогах, поддерживающих протокол MetaWeblog для удаленной публикации постов. Этот протокол хорошо поддерживается блогом WordPress.