Категоризація електронних документів
Електронний науковий архів Науково-технічної бібліотеки Національного університету "Львівська політехніка"
Переглянути архів Інформація| Поле | Співвідношення | |
| Title |
Категоризація електронних документів
|
|
| Creator |
Годич, О. В.
Наконечний, Ю. С. Щербина, Ю. М. |
|
| Subject |
карти Кохонена
зменшення розмірності категоризація доку- ментів кластеризація візуалізація даних Self-Organizing Map dimensionality reduction document categorization clustering data visualization |
|
| Description |
Nowadays, a number of document clustering algorithms are available with number of benefits and trade-offs. The proposed in this article algorithm is an attempt to provide a compromise between quality and complexity, while remaining independent of the language. It uses keyword-based dimensionality reduction technique to create an input space, and then applies Self-Organizing Map for clustering and visualization.Нині існує багато алгоритмів кластеризації документів, кожен з яких має певні переваги та недоліки. Запропонований у цій статті алгоритм є спробою компромісу між якістю категоризації документів і вимогами до обчислювальних ресурсів, залишаючись незалежним від мови документів. Алгоритм використовує техніку пошуку ключових слів документів для формування вхідних даних та карти Кохонена в поєднанні з ієрархічною кластеризацією для категоризації та візуалізації документів. |
|
| Date |
2010-12-09T14:21:54Z
2010-12-09T14:21:54Z 2010 |
|
| Type |
Article
|
|
| Identifier |
Годич О. В. Категоризація електронних документів / О. В. Годич, Ю. С. Наконечний, Ю. М. Щербина // Вісник Національного університету "Львівська політехніка". – 2010. – № 673 : Інформаційні системи та мережі. – С. 233-248. – Бібліографія: 14 назв.
http://ena.lp.edu.ua:8080/handle/ntb/6725 |
|
| Language |
ua
|
|
| Publisher |
Видавництво Львівської політехніки
|
|