Запис Детальніше

Категоризація електронних документів

Електронний науковий архів Науково-технічної бібліотеки Національного університету "Львівська політехніка"

Переглянути архів Інформація
 
 
Поле Співвідношення
 
Title Категоризація електронних документів
 
Creator Годич, О. В.
Наконечний, Ю. С.
Щербина, Ю. М.
 
Subject карти Кохонена
зменшення розмірності
категоризація доку- ментів
кластеризація
візуалізація даних
Self-Organizing Map
dimensionality reduction
document categorization
clustering
data visualization
 
Description Nowadays, a number of document clustering algorithms are available with number of benefits and trade-offs. The proposed in this article algorithm is an attempt to provide a compromise between quality and complexity, while remaining independent of the language. It uses keyword-based dimensionality reduction technique to create an input space, and then
applies Self-Organizing Map for clustering and visualization.Нині існує багато алгоритмів кластеризації документів, кожен з яких має певні
переваги та недоліки. Запропонований у цій статті алгоритм є спробою компромісу між якістю категоризації документів і вимогами до обчислювальних ресурсів, залишаючись незалежним від мови документів. Алгоритм використовує техніку пошуку ключових слів документів для формування вхідних даних та карти Кохонена в поєднанні з ієрархічною кластеризацією для категоризації та візуалізації документів.
 
Date 2010-12-09T14:21:54Z
2010-12-09T14:21:54Z
2010
 
Type Article
 
Identifier Годич О. В. Категоризація електронних документів / О. В. Годич, Ю. С. Наконечний, Ю. М. Щербина // Вісник Національного університету "Львівська політехніка". – 2010. – № 673 : Інформаційні системи та мережі. – С. 233-248. – Бібліографія: 14 назв.
http://ena.lp.edu.ua:8080/handle/ntb/6725
 
Language ua
 
Publisher Видавництво Львівської політехніки