Разработан алгоритм определения продажности сайтов

А вы в состоянии понять, что за сайт перед вами — чья-то личная страница или корпоративный проект, особенно если на нем расположена некая коммерческая информация? Специалисты в сфере IT из Индии и Японии утверждают, что нашли автоматический способ отличить чью-то персональную страничку от коммерческого сайта, сделанного с целью одурачивания потребителей.

Такахиро Хаваши с коллегами из университета Ниигаты объясняют, что их метод извлекает субъективно воспринимаемые выражения, расположенные на вэб-странице. Затем система подсчитывает степень субъективности и выносит вердикт, выражает ли содержание страницы чье-то личное мнение или это такая маркетинговая уловка.

Ученые протестировали систему в работе, проанализировав 1200 страниц, тематически относящихся к четырем направлениям — конкретный товар, туризм, ресторан и кино. Выяснилось, что данный метод намного более эффективен для нахождения именно личных страниц, чем любой поисковик. А происходит это потому, что большинство популярных поисковых машин оценивает личные странички невысоко и они редко встречаются даже на первых десяти страницах результатов поиска.

Личные сайты, блоги и форумы расцениваются поисковиками, например Google или Яндекс, как личные странички, и как правило они никогда не займут места в первой десятке результатов поиска (SERPs). Именно чье-то личное мнение о том или ином продукте найти в интернете несравнимо труднее, чем коммерческие резюме и релизы.

Новая система основывается на том факте, что составители проплаченных сообщений чаще всего не употребляют критических или негативных отзывов о какой-либо продукции или услуге. Личные же мнения обычно пестрят и положительными, и негативными сообщениями.

В японском письменном это могут быть: выражения с негативной окраской, завершающие частицы, междометия и определенные символы — Кандзи — наподобие наших смайликов. Существуют эквивалентные выражения и на других языках.

Вот примерно такие выражения и извлекаются из текста страницы, а системный алгоритм разбирается, сколько из них положительных, а сколько отрицательных. Это и служит основным индикатором принадлежности страницы.

Подобный подход было бы неплохо применять в результатах поиска всех поисковиков, чтобы те, кому это важно, могли искать мнения потребителей, а не штампованные на заказ тексты.

21.05.2009

Оценка:

Подписаться в Telegram



Net&IT

Прекратите гуглить и поспите днем, чтобы снизить риск деменции
Прекратите гуглить и поспите днем, чтобы снизить риск деменции

Канадский учёный Мохамед И. Элмасри считает, ч...

App.System Innovation: Управлять умными колонками оказалось слишком сложно
App.System Innovation: Управлять умными колонками оказалось слишком сложно

Благодаря удобству и возможности управлят...

Инженеры воссоздали голопалубу Star Trek с помощью ChatGPT и видеоигр
Инженеры воссоздали голопалубу Star Trek с помощью ChatGPT и видеоигр

В сериале Звездный путь: Следующее поколение к...

Physical Review X: Сеть квантовых датчиков повышает точность измерений
Physical Review X: Сеть квантовых датчиков повышает точность измерений

Квантовые системы, используемые в квантов...

Scientific Reports: ИИ показал больший творческий потенциал, чем человек
Scientific Reports: ИИ показал больший творческий потенциал, чем человек

Еще один балл в пользу искусственного инт...

Крошечную метку на замену RFID сделали еще надежнее
Крошечную метку на замену RFID сделали еще надежнее

Несколько лет назад исследователи Массачу...

Ученые приблизились к более легким и гибким оптоэлектронным устройствам
Ученые приблизились к более легким и гибким оптоэлектронным устройствам

Органические оптоэлектронные устройства, такие...

PNAS Nexus: ИИ пока еще далеко до человеческих способностей мыслить
PNAS Nexus: ИИ пока еще далеко до человеческих способностей мыслить

Атанасиос С. Фокас рассматривает актуальный во...

Nature: ИИ генерирует белки с исключительной прочностью связывания
Nature: ИИ генерирует белки с исключительной прочностью связывания

В новом исследовании, опубликованном 18 декабр...

Nature Computational Science: ИИ может предсказывать события в жизни людей
Nature Computational Science: ИИ может предсказывать события в жизни людей

Искусственный интеллект, разработанный для&nbs...

Nature Electronics: Изменение памяти дает новые вычислительные возможности
Nature Electronics: Изменение памяти дает новые вычислительные возможности

Ученые Рочестерского университета разработали ...

Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта
Nature: 2D-материал изменяет форму 3D-электроники для искусственного интеллекта

Многофункциональные компьютерные чипы эволюцио...

Поиск на сайте

Знатоки клуба инноваций


ТОП - Новости мира, инновации

В экоиндексе городов Казани не нашлось места в первой тройке
В экоиндексе городов Казани не нашлось места в первой тройке
Новый кампус БФУ станет центром физики высоких технологий
Новый кампус БФУ станет центром физики высоких технологий
В Московском Политехе рассказали, как новые технологии меняют облик автомобиля
В Московском Политехе рассказали, как новые технологии меняют облик автомобиля
Scientific Reports: Создан ультразвуковой настраиваемый ЖК-рассеиватель света
Scientific Reports: Создан ультразвуковой настраиваемый ЖК-рассеиватель света
PLOS Global Public Health: В США падает потребление сигарет, сахара и опиоидов
PLOS Global Public Health: В США падает потребление сигарет, сахара и опиоидов
Раннее слабоумие встречается все чаще — заболеваемость болезнью Альцгеймера растет
Раннее слабоумие встречается все чаще — заболеваемость болезнью Альцгеймера растет
APL Materials: Открыт метод лазерной печати для создания запоминающих устройств
APL Materials: Открыт метод лазерной печати для создания запоминающих устройств
Уникальное наноустройство открывает путь к новым беспроводным каналам связи
Уникальное наноустройство открывает путь к новым беспроводным каналам связи
Химики СПбГУ создали сенсор для определения гистамина по слюне
Химики СПбГУ создали сенсор для определения гистамина по слюне
Пестициды могут повышать риск развития некоторых видов рака, как и курение
Пестициды могут повышать риск развития некоторых видов рака, как и курение
В КФУ создают препарат для лечения ишемии-реперфузии нервной ткани
В КФУ создают препарат для лечения ишемии-реперфузии нервной ткани
JRSSIG: Пик формы легкоатлетов-олимпийцев — чуть меньше 27 лет
JRSSIG: Пик формы легкоатлетов-олимпийцев — чуть меньше 27 лет
Учёные ЛЭТИ создали прототип системы для прогноза осадков и диагностики фруктов
Учёные ЛЭТИ создали прототип системы для прогноза осадков и диагностики фруктов
В России предложили новую классификацию камней в почках по структуре и составу
В России предложили новую классификацию камней в почках по структуре и составу
ACS Nano: Благодаря 3D-печати ученые впервые увидели, как светятся наноструктуры
ACS Nano: Благодаря 3D-печати ученые впервые увидели, как светятся наноструктуры

Новости компаний, релизы

Университетская разработка поможет повысить качество инвитро-диагностики в РФ
Новая "Кантиана" поможет студентам быстрее адаптироваться к калининградскому климату
Ведущие игроки агрорынка представят новинки на «Дне поля» в Агробиотехнопарке Казанского ГАУ
Сеченовский Университет выводит на рынок инновационный крем-эмолент для сухой, очень сухой и атопичной кожи
Стартовал пятый юбилейный конкурс Мэра «Новатор Москвы»