Parsers : «Мы движемся к новой модели поиска в интернете».

Parsers : «Мы движемся к новой модели поиска в интернете».

Люди перестанут кликать по ссылкам из поисковой выдачи.

«Google как Сталин — ты ему слово, он тебе ссылку». Эта шутка актуальна уже четверть века и пришла пора обновить подход. Поиск нового поколения будет давать пользователю информацию вместо ссылок на нее. Одни из тех, кто меняет подход к поиску — стартап Parsers, родом из Беларуси, сообщает medium.com, передает FinBiz.kz.

Что делает Parsers

Сегодня команда предлагает расширение для браузера, позволяющее без навыков программирования извлекать и визуализировать неструктурированные данные из веб-страниц.

Пользователю достаточно выбрать подходящие данные только на одной странице и сервис найдет аналогичные автоматически по заданному шаблону. Нужно собрать сто тысяч заголовков новостей? Parsers поможет найти их и структурировать в единую таблицу.

Алгоритм умеет собирать ссылки, изображения, тексты, таблицы, скрипты. Структурированные в таблицы и чарты данные можно скачать в разных форматах c сайта или по API. Можно настроить автоматический парсинг по расписанию. Удобно для сравнения цен, например.

Читайте также: Студент-недоучка создал финтех-стартап с оценкой в $2 млрд

Сервис продается по подписке, цена которой зависит от обьема собираемой информации. На бесплатном плане можно обработать до тысячи страниц одного сайта, а самый дорогой профессиональный план за 199$/мес. позволяет работать со ста тысячами страниц.

Продуктом Parsers пользуются в Microsoft, Cisco, Ebay и других крупных компаниях. Но на простом парсинге по запросу команда останавливаться не намерена. Планы куда более масштабные. Фаундер компании Евгений Гуринович рассказал подробнее.

Новый поиск

Мы движемся к созданию новой модели поиска, когда человек получает ответ на его вопрос сразу, а не тратит много времени на открытие ссылок из поисковой системы. Фактически парсингом вебсайтов занимаются все поисковые системы. Слово парсинг они заменяют индексацией, но суть от этого не меняется. Поисковые системы парсят все подряд, то есть неструктурированную информацию.

В таком виде пользователи и получают ответ на вопрос в поисковой выдаче. Поисковики дают ссылку на страницу, где может быть, что-то похожее на ваш запрос. Если вы спросите «сколько стоит iPhone», то поисковик не даст вам ответ на странице, а пошлет искать на сайтах. Поисковики не знают где на сайте цена и есть ли она вообще.

Читайте также: Аэрокосмические гиганты и стартапы разрабатывают электрические самолеты

Они не могут определить, что попало им в базу. Структуры сайтов настолько разнообразны, что отличить цену товара, вес, цвет и другие параметры невозможно с помощью технического решения. Это под силу только человеку, и то не всегда. Но частично автоматизировать процесс можно.

Google, Яндекс слишком большие, чтобы быстро изменить модель поиска, но маленькими шажками они двигаются к запуску поиска по структурированным данным, запуская «колдунщики», «острова», «Функции поиска Google», но это остается на основе отдельных сайтов, а не всего интернета в целом.

Уже эти кейсы показывают, что подход работает, пользователям удобно получать информацию сразу, без лишних кликов. Настолько удобно, что Avito, ЦИАН, «2ГИС» недавно пожаловались на «колдунщики» Яндекса, которые забирают у них до половины всего трафика.

Читайте также: В Акмолинской области состоялся Международный форум молодых ученых

Мы идем по пути создания выдачи структурированных данных на основе сбора неструктурированных. У нас уже работает поисковик по компаниям. Это бета-версия, для него мы собрали данные о 130 тысячах бизнесов из интернета и продолжаем пополнять базу.

Пользователю достаточно зайти на одну страницу, чтобы увидеть всю нужную информацию. Для него решается проблема открытия десятков вкладок в браузере. Со структурированными фактами могут работать и голосовые помощники.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *