Интервью

"Если сервис окажется востребованным, реклама ему не потребуется" - Иван Бегтин

"Если сервис окажется востребованным, реклама ему не потребуется" - Иван Бегтин

На прошлой неделе Иван Бегтин предложил читателям своего блога принять участие в закрытом тестировании нового сервиса. Проект с рабочим названием «Скиур» позволяет создавать RSS-потоки любых веб-страниц - даже тех, где отсутствуют RSS-трансляции.

О преимуществах своего сервиса перед многочисленными конкурентами в интервью TelNews рассказал сам разработчик.

- Как появилась идея создания такого сервиса?

- Идея появилась примерно год назад. Поскольку в силу особенностей основного рода своей деятельности я читаю многие государственные сайты, я давно уже столкнулся с тем, что RSS среди них поддерживают единицы. Поначалу удавалось обходиться использованием Page2RSS, но его RSS-ленты - это ленты изменений страниц, а не новостей, и в фиды попадало много мусора.

Создавать же парсер под каждый сайт - много мороки. В итоге я в качестве эксперимента решил создать собственный алгоритм, который «восстанавливал» бы новости из новостных веб-страниц автоматически. Учитывая, что одновременно с этим я занимался и занимаюсь решением других задач по распознаванию смысловых блоков на веб-страницах, эта оказалась не столь уж сложной и достаточно интересной.

- В чем заключаются ключевые отличия вашего сервиса от аналогов - «Ревизора 2.0», Yahoo!Pipes, Feed 43 и других?

- «Ревизор 2.0»  и Page2RSS позволяют создавать ленты изменений на веб-страницах вне зависимости от того, где и как эти изменения произошли. Максимум, что позволяют сделать подобные сервисы, - это настройка чувствительности по размеру измененного блока. В результате их использование не требует специальных знаний HTML, но отличается определенной неточностью.

Yahoo Pipes, Dapper, openkapow и Feed43 позволяют пользователю самостоятельно настраивать правила извлечения информации и получать качественные RSS-фиды, но для этого необходимо обладать хотя бы минимальными навыками работы с HTML, регулярными выражениями, пониманием DOM-модели веб-страницы. В итоге, это сервисы не для всех, и под каждый ресурс необходимо формировать свои правила извлечения данных.

Основные отличия заключаются в том, что мой сервис «восстанавливает новостную ленту» и делает это полностью автоматически, не требуя от пользователей каких-либо технических знаний. Единственное, что нужно для его работы - это чтобы на веб-странице присутствовала лента новостей с проставленными датами; все остальное - распознавание даты, заголовка, нахождение тела новости и ссылки - алгоритм проделает полностью автоматически и сформирует RSS-ленту из распознанных новостных блоков страницы.

- Когда будет представлена окончательная версия сервиса, и что вы хотели бы добавить к нему до этого времени?

- Ориентировочно публичная версия будет доступна в начале октября. Текущая версия сознательно сделана упрощенной - из страницы сейчас извлекается только один обобщенный поток, пока еще не поддерживается часть форматов англоязычных дат и меня не все устраивает в производительности алгоритма - я думаю, что именно эти изменения появятся в первую очередь. И, конечно, будут учтены пожелания пользователей, которые сейчас используют алгоритм в закрытом тестировании. Также практически наверняка будет экспорт новостей в форматах RSS и ATOM, а также, скорее всего, публичный API.

- Как будут обстоять дела с частотой обновлений?

- Сейчас частота обновлений ограничена 2 часами. В дальнейшем все будет зависеть от числа отслеживаемых страниц и пользователей, но в любом случае обновление будет происходить не реже раза в сутки. Собственно, ограничения здесь исключительно в области задействованных ресурсов, и если вариант коммерческого сервиса окажется востребованным, то там частота обновлений может быть доведена и до 10 минут.

- Планируете ли вы представить пользователям возможность настройки внешнего вида каналов?

- Хотелось бы, но вряд ли в первой публичной версии. В дальнейшем, конечно, это возможно.

- Собираетесь ли вы как-либо рекламировать сервис, когда он будет готов?

- Я создавал этот алгоритм для себя и решения личных задач в качестве эксперимента. Идея же сделать общедоступный сервис возникла уже только, когда я заметил, что с подобной проблемой получения новостей сталкиваюсь не только я один. Коммерческих целей его продвижения изначально я не преследовал. Если сервис окажется востребованным, то подозреваю, что реклама ему не потребуется - если не окажется, то и реклама ему не поможет.

- Хотели бы вы продать кому-либо эту технологию?

- В большей степени мой интерес состоит в продаже не технологий, а сервисов на их основе. Сама же технология сейчас - часть общей библиотеки смыслового анализа веб-страниц, построения так называемой «объектной карты». Если будут интересные предложения, то именно этот алгоритм можно будет из нее выделить. Продажа библиотеки целиком в мои ближайшие планы не входит.

- Вы говорили о возможности создания на основе этого сервиса поисковика по созданным RSS-лентам. Расскажите подробнее об этой идее.

- Это лишь как один из вариантов развития. Фактически алгоритм сейчас позволяет создать поисковик по новостям с большим охватом, чем существующие новостные поисковики поскольку теперь в него можно будет включить RSS-ленты даже с тех сайтов, где их нет, причем подключение этих лент может производиться автоматически. В долгосрочной перспективе возможно построение поисковой машины со смысловым анализом индексируемых данных и различными формами их представления.

- Насколько я понимаю, вы также рассматриваете возможность интеграции этого сервиса с другими «связанными» с ним проектами. Как это могло бы выглядеть?

- Да, в частности, ранее я работал над алгоритмами геоклассификации (геокодинга) вебсайтов и отдельных страниц, а также сейчас продолжаю работать над тематической классификацией текстов и новостей. Одним из направлений развития этого сервиса может быть создание классифицированных новостных потоков с расширенными возможностями по фильтрации и группировке новостей. Также возможна интеграция со смежными сетевыми сервисами, такими как FeedBurner  и Google Reader.

telnews.ru

28.08.2008

на печать


Комментарии

Написать комментарий

 Проверочный код

Архив

Пн Вт Ср Чт Пт Сб Вс

Рассылка

Подписка на рассылку

E-mail:
 

Также нашу рассылку вы можете получать через

E-mail:  

на правах рекламы

Есть мнение ...

Telegram - важный инструмент в арсенале PR-специалистовTelegram - важный инструмент в арсенале PR-специалистов
Владимир Ступников, Генеральный директор коммуникационного агентства АУРА в составе Газпром-Медиа Холдинга. Социальные медиа становятся все более важным инструментом в работе каждого PR-специалиста, и одной из относительно новых, но стремительно растущих платформ, является Telegram. Этот мессенджер, изначально позиционировавшийся как безопасный и приватный инструмент связи, приобретает все большую популярность и привлекает внимание маркетологов и PR-специалистов по всему миру.
PR-специалисты будущего: какие компетенции и требования профессии...PR-специалисты будущего: какие компетенции и требования профессии... (1)
Татьяна Жигаленкова, управляющий партнер LotUS Communications, рассказала какие компетенции, и требования PR-специалистов будут актуальны через 5 лет.
Маркетинг с AR и VR от HICLICKМаркетинг с AR и VR от HICLICK
В 2024 году маркетологи все чаще начинают использовать метавселенные. По сравнению с социальными сетями, вовлеченность пользователей в иммерсивных площадках гораздо больше. Одним из самых интересных для клиентов форматов являются АR и VR. Как технологии будущего применять в маркетинге уже сегодня, разобрали в агентстве высоких откликов HICLICK.
Коkос Group: ИИ в рекламной индустрии: модный тренд или революция?Коkос Group: ИИ в рекламной индустрии: модный тренд или революция?
Искусственный интеллект уже давно среди нас. Он прочно вошел в нашу жизнь, используется абсолютно в разных её сферах и кардинально меняет лицо современного бизнеса. Рекламная индустрия - не исключение. Самый яркий и известный пример - это нейросети, на основе которых построен поиск рекламных систем Яндекса. Использование нейросетей и других алгоритмов ИИ, делает рекламу еще более эффективной и качественной. Евгений Халин, директор по продуктам Коkос Group рассказывает о том, как работает ИИ, в чем его преимущество и какие перспективы нас ждут.
Как подготовить маркетинг к 8 марта и 23 февраляКак подготовить маркетинг к 8 марта и 23 февраля
В период гендерных праздников предприниматели отмечают 50%-ый рост продаж. – Даже в случае торговли сепараторами или двигателями, при должном подходе. Для маркетологов это время – забег на короткие дистанции. Поэтому важно грамотно подойти к выбору инструментов.

Книги по дизайну

Загрузка ...

Репортажи

Дизайн под грифом "секретно"Дизайн под грифом "секретно"
На чем раньше ездили первые лица страны? Эскизы, редкие фотографии и прототипы уникальных машин.
"Наша индустрия – самодостаточна": ГПМ Радио на конференции..."Наша индустрия – самодостаточна": ГПМ Радио на конференции...
Чего не хватает радио, чтобы увеличить свою долю на рекламном рынке? Аудиопиратство: угроза или возможности для отрасли? Каковы первые результаты общероссийской кампании по продвижению индустриального радиоплеера? Эти и другие вопросы были рассмотрены на конференции «Радио в глобальной медиаконкуренции», спикерами и участниками которой стали эксперты ГПМ Радио.
Форум "Матрица рекламы" о технологиях работы в период...Форум "Матрица рекламы" о технологиях работы в период...
Деловая программа 28-й международной специализированной выставки технологий и услуг для производителей и заказчиков рекламы «Реклама-2021» открылась десятым юбилейным форумом «Матрица рекламы». Его организовали КВК «Империя» и «Экспоцентр».
В ЦДХ прошел День социальной рекламыВ ЦДХ прошел День социальной рекламы (3)
28 марта в Центральном доме художника состоялась 25-ая выставка маркетинговых коммуникаций «Дизайн и реклама NEXT». Одним из самых ярких её событий стал День социальной рекламы, который организовала Ассоциация директоров по коммуникациям и корпоративным медиа России (АКМР) совместно с АНО «Лаборатория социальной рекламы» и оргкомитетом LIME.
Форум "Матрица рекламы": к рекламе в интернете особое...Форум "Матрица рекламы": к рекламе в интернете особое... (2)
На VII Международном форуме «Матрица рекламы», прошедшем в ЦВК «Экспоцентр» в рамках международной выставки  «Реклама-2018», большой интерес у профессиональной аудитории вызвала VI Конференция «Интернет-реклама».

Форум

на правах рекламы

19.04.2024 - 00:37
RSS-каналы Advertology.RuRSS    Читать Advertology.Ru ВКонтактеВКонтакте    Читать Advertology.Ru на Twittertwitter   
Advertology.Ru - все о рекламе, маркетинге и PR
реклама

Вход | Регистрация