Интервью

"Если сервис окажется востребованным, реклама ему не потребуется" - Иван Бегтин

"Если сервис окажется востребованным, реклама ему не потребуется" - Иван Бегтин

На прошлой неделе Иван Бегтин предложил читателям своего блога принять участие в закрытом тестировании нового сервиса. Проект с рабочим названием «Скиур» позволяет создавать RSS-потоки любых веб-страниц - даже тех, где отсутствуют RSS-трансляции.

О преимуществах своего сервиса перед многочисленными конкурентами в интервью TelNews рассказал сам разработчик.

- Как появилась идея создания такого сервиса?

- Идея появилась примерно год назад. Поскольку в силу особенностей основного рода своей деятельности я читаю многие государственные сайты, я давно уже столкнулся с тем, что RSS среди них поддерживают единицы. Поначалу удавалось обходиться использованием Page2RSS, но его RSS-ленты - это ленты изменений страниц, а не новостей, и в фиды попадало много мусора.

Создавать же парсер под каждый сайт - много мороки. В итоге я в качестве эксперимента решил создать собственный алгоритм, который «восстанавливал» бы новости из новостных веб-страниц автоматически. Учитывая, что одновременно с этим я занимался и занимаюсь решением других задач по распознаванию смысловых блоков на веб-страницах, эта оказалась не столь уж сложной и достаточно интересной.

- В чем заключаются ключевые отличия вашего сервиса от аналогов - «Ревизора 2.0», Yahoo!Pipes, Feed 43 и других?

- «Ревизор 2.0»  и Page2RSS позволяют создавать ленты изменений на веб-страницах вне зависимости от того, где и как эти изменения произошли. Максимум, что позволяют сделать подобные сервисы, - это настройка чувствительности по размеру измененного блока. В результате их использование не требует специальных знаний HTML, но отличается определенной неточностью.

Yahoo Pipes, Dapper, openkapow и Feed43 позволяют пользователю самостоятельно настраивать правила извлечения информации и получать качественные RSS-фиды, но для этого необходимо обладать хотя бы минимальными навыками работы с HTML, регулярными выражениями, пониманием DOM-модели веб-страницы. В итоге, это сервисы не для всех, и под каждый ресурс необходимо формировать свои правила извлечения данных.

Основные отличия заключаются в том, что мой сервис «восстанавливает новостную ленту» и делает это полностью автоматически, не требуя от пользователей каких-либо технических знаний. Единственное, что нужно для его работы - это чтобы на веб-странице присутствовала лента новостей с проставленными датами; все остальное - распознавание даты, заголовка, нахождение тела новости и ссылки - алгоритм проделает полностью автоматически и сформирует RSS-ленту из распознанных новостных блоков страницы.

- Когда будет представлена окончательная версия сервиса, и что вы хотели бы добавить к нему до этого времени?

- Ориентировочно публичная версия будет доступна в начале октября. Текущая версия сознательно сделана упрощенной - из страницы сейчас извлекается только один обобщенный поток, пока еще не поддерживается часть форматов англоязычных дат и меня не все устраивает в производительности алгоритма - я думаю, что именно эти изменения появятся в первую очередь. И, конечно, будут учтены пожелания пользователей, которые сейчас используют алгоритм в закрытом тестировании. Также практически наверняка будет экспорт новостей в форматах RSS и ATOM, а также, скорее всего, публичный API.

- Как будут обстоять дела с частотой обновлений?

- Сейчас частота обновлений ограничена 2 часами. В дальнейшем все будет зависеть от числа отслеживаемых страниц и пользователей, но в любом случае обновление будет происходить не реже раза в сутки. Собственно, ограничения здесь исключительно в области задействованных ресурсов, и если вариант коммерческого сервиса окажется востребованным, то там частота обновлений может быть доведена и до 10 минут.

- Планируете ли вы представить пользователям возможность настройки внешнего вида каналов?

- Хотелось бы, но вряд ли в первой публичной версии. В дальнейшем, конечно, это возможно.

- Собираетесь ли вы как-либо рекламировать сервис, когда он будет готов?

- Я создавал этот алгоритм для себя и решения личных задач в качестве эксперимента. Идея же сделать общедоступный сервис возникла уже только, когда я заметил, что с подобной проблемой получения новостей сталкиваюсь не только я один. Коммерческих целей его продвижения изначально я не преследовал. Если сервис окажется востребованным, то подозреваю, что реклама ему не потребуется - если не окажется, то и реклама ему не поможет.

- Хотели бы вы продать кому-либо эту технологию?

- В большей степени мой интерес состоит в продаже не технологий, а сервисов на их основе. Сама же технология сейчас - часть общей библиотеки смыслового анализа веб-страниц, построения так называемой «объектной карты». Если будут интересные предложения, то именно этот алгоритм можно будет из нее выделить. Продажа библиотеки целиком в мои ближайшие планы не входит.

- Вы говорили о возможности создания на основе этого сервиса поисковика по созданным RSS-лентам. Расскажите подробнее об этой идее.

- Это лишь как один из вариантов развития. Фактически алгоритм сейчас позволяет создать поисковик по новостям с большим охватом, чем существующие новостные поисковики поскольку теперь в него можно будет включить RSS-ленты даже с тех сайтов, где их нет, причем подключение этих лент может производиться автоматически. В долгосрочной перспективе возможно построение поисковой машины со смысловым анализом индексируемых данных и различными формами их представления.

- Насколько я понимаю, вы также рассматриваете возможность интеграции этого сервиса с другими «связанными» с ним проектами. Как это могло бы выглядеть?

- Да, в частности, ранее я работал над алгоритмами геоклассификации (геокодинга) вебсайтов и отдельных страниц, а также сейчас продолжаю работать над тематической классификацией текстов и новостей. Одним из направлений развития этого сервиса может быть создание классифицированных новостных потоков с расширенными возможностями по фильтрации и группировке новостей. Также возможна интеграция со смежными сетевыми сервисами, такими как FeedBurner  и Google Reader.

telnews.ru

28.08.2008

на печать


Комментарии

Написать комментарий

 Проверочный код

Архив

Пн Вт Ср Чт Пт Сб Вс

Рассылка

Подписка на рассылку

E-mail:
 

Также нашу рассылку вы можете получать через

E-mail:  

Есть мнение ...

"В Москве общий уровень дизайна улучшается, а хороший уровень..."В Москве общий уровень дизайна улучшается, а хороший уровень...
Как менялись московские вывески на протяжении последних трех десятилетий, чем московские вывески отличаются от европейских и почему дизайнеры наших вывесок, равно как и навигации в метро, не помогают горожанам сориентироваться. Об этом «Москвич Mag» рассказали владельцы дизайнерских студий, разработчики дизайн-кода Москвы, графические дизайнеры и участники фестиваля шрифтовиков Typomania. 
Sabre Award 2019: забота о здоровье, инфлюенсеры, цифровые технологии...Sabre Award 2019: забота о здоровье, инфлюенсеры, цифровые технологии...
22 мая состоялось награждение победителей одного из самых престижных конкурсов в сфере PR SabreAward 2019. Специалисты аналитического агентства Смыслография проанализировали кейсы победителей и номинантов и отметили актуальные направления развития мирового PR рынка.
Поколение Z. Смогут ли его представители стать хорошими...Поколение Z. Смогут ли его представители стать хорошими... (1)
Поколение Z — люди, рожденные после 1995-ого года. Уже сейчас «зетовцы» составляют почти четверть всего населения РФ и, судя по подсчетам прогнозистов, к 2020-ому штат каждой российской компании на 40% будет состоять именно из сотрудников этого поколения. Насколько компетентными и квалифицированными PR-специалистами могут стать эти пока еще очень молодые и даже совсем юные ребята? О перспективах поколения Z в PR рассуждает Дарья Субоч, СЕО коммуникационного агентства SlavaPR.
PR-бюджет в 50 тысяч рублей приводит московский бизнес к разочарованиюPR-бюджет в 50 тысяч рублей приводит московский бизнес к разочарованию
Коммуникационное агентство «Со-общение» провело исследование удовлетворенности компаний Москвы и Санкт-Петербурга результатами использования PR как инструмента продвижения своих товаров и услуг.
Как видео помогает сайтам улучшать позиции в поискеКак видео помогает сайтам улучшать позиции в поиске
Специалисты сервиса Rookee провели эксперимент и выяснили, влияет ли видео на ранжирование сайта в поисковых системах.

Книги по дизайну

Загрузка ...

Репортажи

В ЦДХ прошел День социальной рекламыВ ЦДХ прошел День социальной рекламы
28 марта в Центральном доме художника состоялась 25-ая выставка маркетинговых коммуникаций «Дизайн и реклама NEXT». Одним из самых ярких её событий стал День социальной рекламы, который организовала Ассоциация директоров по коммуникациям и корпоративным медиа России (АКМР) совместно с АНО «Лаборатория социальной рекламы» и оргкомитетом LIME.
Форум "Матрица рекламы": к рекламе в интернете особое...Форум "Матрица рекламы": к рекламе в интернете особое...
На VII Международном форуме «Матрица рекламы», прошедшем в ЦВК «Экспоцентр» в рамках международной выставки  «Реклама-2018», большой интерес у профессиональной аудитории вызвала VI Конференция «Интернет-реклама».
87% компаний используют три и более каналов для внутренних...87% компаний используют три и более каналов для внутренних...
«Лучшие кейсы по внутрикорпоративным коммуникациям. Ключевые тенденции последнего времени. Изменения стремительны, успеваем ли мы за ними?» - данную тему 25 апреля 2018 года обсудили на заседании  Комитета по внутрикорпоративным  коммуникациям Ассоциации менеджеров.
New media, new creativity! "Серебряный меркурий" расширяет...New media, new creativity! "Серебряный меркурий" расширяет...
21-22 марта в Санкт-Петербурге состоялся IV Фестиваль рекламы и маркетинговых услуг «Серебряный Меркурий. Северо-Запад», в рамках  которого прошла Большая конференция. Организатором мероприятия стало ведущее брендинговое агентство России – Brandson (Total Identity Group), во главе с Генеральным директоров агентства, Членом совета АБКР, Еленой Юферевой.
Выставка, посвящённая 100-летию со дня рождения Георгия ЩетининаВыставка, посвящённая 100-летию со дня рождения Георгия Щетинина (6)
В Государственном музее А. С. Пушкина открылась выставка, посвященная не столь широко известному, но заслуживающему пристального внимания художнику-иллюстратору ХХ века Георгию Щетинину.

Форум

Вакансии

  • Загрузка ...

на правах рекламы

20.07.2019 - 10:17
RSS-каналы Advertology.RuRSS    Читать Advertology.Ru на Facebookfacebook    Читать Advertology.Ru ВКонтактеВКонтакте    Читать Advertology.Ru на Twittertwitter   
Advertology.Ru - все о рекламе, маркетинге и PR

Вход | Регистрация