Разработан алгоритм определения продажности сайтов

А вы в состоянии понять, что за сайт перед вами — чья-то личная страница или корпоративный проект, особенно если на нем расположена некая коммерческая информация? Специалисты в сфере IT из Индии и Японии утверждают, что нашли автоматический способ отличить чью-то персональную страничку от коммерческого сайта, сделанного с целью одурачивания потребителей.

Такахиро Хаваши с коллегами из университета Ниигаты объясняют, что их метод извлекает субъективно воспринимаемые выражения, расположенные на вэб-странице. Затем система подсчитывает степень субъективности и выносит вердикт, выражает ли содержание страницы чье-то личное мнение или это такая маркетинговая уловка.

Ученые протестировали систему в работе, проанализировав 1200 страниц, тематически относящихся к четырем направлениям — конкретный товар, туризм, ресторан и кино. Выяснилось, что данный метод намного более эффективен для нахождения именно личных страниц, чем любой поисковик. А происходит это потому, что большинство популярных поисковых машин оценивает личные странички невысоко и они редко встречаются даже на первых десяти страницах результатов поиска.

Личные сайты, блоги и форумы расцениваются поисковиками, например Google или Яндекс, как личные странички, и как правило они никогда не займут места в первой десятке результатов поиска (SERPs). Именно чье-то личное мнение о том или ином продукте найти в интернете несравнимо труднее, чем коммерческие резюме и релизы.

Новая система основывается на том факте, что составители проплаченных сообщений чаще всего не употребляют критических или негативных отзывов о какой-либо продукции или услуге. Личные же мнения обычно пестрят и положительными, и негативными сообщениями.

В японском письменном это могут быть: выражения с негативной окраской, завершающие частицы, междометия и определенные символы — Кандзи — наподобие наших смайликов. Существуют эквивалентные выражения и на других языках.

Вот примерно такие выражения и извлекаются из текста страницы, а системный алгоритм разбирается, сколько из них положительных, а сколько отрицательных. Это и служит основным индикатором принадлежности страницы.

Подобный подход было бы неплохо применять в результатах поиска всех поисковиков, чтобы те, кому это важно, могли искать мнения потребителей, а не штампованные на заказ тексты.

Что почитать: Как открыть интернет-магазин

Оценка:
2 комментария

Комментарии

алгоритм продажности сайтов
Мне казалось, Яндекс с Гуглом и так неплохо борются с сайтами, которые барыжат ссылками.
Зонин Алексей · 31.01.2010
алгоритм продажности сайтов
это не продажности, это скорее хитрости муркетологов Спасибо, хороший текст
Оценка:

mech · 21.05.2009

Бесплатный Интернет поможет развитию Коста-Рики
19.07.2010

Член Партии Социал-Христианского Союза Коста-Рики, Родольфо Сотомайор, выдвинул инициативу обеспечения бесплатного доступа в Интернет для всех жителей страны.

0 комментариев
Мошенники в онлайне охотятся на молодежь
08.07.2010

Каждый 10-й интернет-пользователь в Австралии, а это более 1,3 млн человек, за прошлый год потерял в среднем 1000 долларов США.

0 комментариев

Настольные книги редакции InnovaNews.ru


Net&IT



Интернет не резиновый

Эксперты предсказывают, что меньше, чем через год в мире закончатся Интернет адреса.

0 комментариев
Бесплатный Интернет поможет развитию Коста-Рики

Член Партии Социал-Христианского Союза Коста-Рики, Родольфо Сотомайор, выдвинул инициативу обеспечения бесплатного доступа в Интернет для всех жителей страны.

0 комментариев
Мошенники в онлайне охотятся на молодежь

Каждый 10-й интернет-пользователь в Австралии, а это более 1,3 млн человек, за прошлый год потерял в среднем 1000 долларов США.

0 комментариев
"Как заняться сексом" - вопрос №1 у юных австралийцев

Когда в поисковой системе Google австралийцы стараются найти ответ на тот или иной вопрос, начинающийся со слова как, то чаще всего этот вопрос связан с сексом.

0 комментариев
Интернет-зависимость и игровая зависимость никак не связаны между собой

Исследование, проведенное студентами, не выявило связи между чрезмерным использованием Интернета и пристрастием к азартным играм.

0 комментариев
Apple iPhone вдвое популярнее BlackBerry

Согласно опросу, более четверти владельцев смартфонов имеют модель Apple iPhone.

0 комментариев
Создание и организация юмористического сайта

Современный мир интернета переполнен самыми разнообразными сайтами с различным содержанием и направленностью.

0 комментариев
Toshiba анонсировала ноутбук Libretto W100

Японская компания Toshiba выпускает новый ноутбук Libretto W100, оснащенный сразу двумя сенсорными экранами.

0 комментариев
В Китае взрослые обеспокоены интернет-зависимостью детей

Многие родители в Китае опасаются, что чрезмерное пользование Интернетом может привести к падению успеваемости.

0 комментариев
Каждый час британцы получают 42000 фальшивых писем

А каждые 7 секунд в Великобритании кто-нибудь становится жертвой киберпреступления.

0 комментариев


Новости партнеров


Загружается, подождите...

Новости технологий и инноваций


ТОП - Новости, инновации

Одиночество вдвоем. Как с этим бороться

Нередко бывает такое, что, живя с любимым человеком мы чувствуем себя одинокими.

Бары и рестораны с курилкой опасны для здоровья

Концентрация вторичного табачного дыма в ресторанах и барах исключительно опасна для здоровья.

Хорошие каникулы лучше материальной выгоды

Ученые выяснили: удачный отпуск способен осчастливить больше, чем материальные блага.

Худые люди чаще полных заходят в дорогие магазины

Тучность — это проблема не только здравоохранения, но и экономики.

Чтобы не хандрить - путешествуйте

Ученые выяснили, что на большинство людей путешествие действует как противоядие от депрессии.

В человеческом организме обнаружена естественная защита от рака

Канадские ученые выявили молекулярный механизм, который предотвращает развитие рака.

Углекислый газ - это вам не шутки

В долгосрочной перспективе температура Земли может на 30-50% сильнее реагировать на содержание углекислого газа.



Тэги мира инноваций



Показать все теги