Как мы составляли семантическое ядро
2008-10-05 14:28Я принимаю участие в разработке и запуске сайта на основе нашего движка, в котором применена модная концепция "тегов": способ ручного описания смысла статей, основанный на перечислении для каждой из них небольшого количества понятий, которые они описывают. Обычно, это ручная работа, выполняемая самими пользователями, но на стадии запуска проекта мы столкнулись с проблемой "курицы и яйца": нет достаточного множества готовых тегов - пользователи сайта не используют теги - теги не появляются.
Но я-то знаю, что существуют различные автоматические методики соотнесения текстов со смысловыми категориями, основанные на ключевых словах. Я попробовал воспользоваться имя для генерации списка понятий - тегов - предметной области и достиг определенного успеха. Подробности можно прочитать в статье "Об автоматическом составлении семантического ядра".




