Запис Детальніше

Методи нечіткої кластеризації політематичних текстових документів

Електронного архіву Харківського національного університету радіоелектроніки (Open Access Repository of KHNURE)

Переглянути архів Інформація
 
 
Поле Співвідношення
 
Creator Волкова, В. В.
 
Date 2013-12-10T09:34:39Z
2013-12-10T09:34:39Z
2010
 
Identifier Волкова В. В. Методи нечіткої кластеризації політематичних текстових документів : автореф. дис. ... канд. техн. наук : 05.13.23 – "Системи та засоби штучного інтелекту" / В. В. Волкова ; Харк. нац. ун-т радіоелектроніки. – Х., 2010. – 21 с.
http://hdl.handle.net/123456789/999
 
Description Дисертацію присвячено розробці методів кластеризації політематичних текстових
документів у режимі послідовної обробки даних та наявності кластерів, що перетинаються.
Розглянуто задачу кластеризації політематичних текстових документів, основні методи обробки документів та існуючі методи їх кластеризації, визначено основні недоліки та переваги розглянутих методів. Вперше запропоновано адаптивну нечітку нейронну мережу,що самоорганізується, та ймовірнісний і можливісний методи її навчання, які дозволяють виконувати нечітку кластеризацію політематичних текстових документів, що в послідовному режимі надходять на вхід мережі, а також у процесі навчання знаходити нові кластери. Запропоновані методи навчання відрізняються своєю швидкодією та незначною
обчислювальною складністю. Вперше запропоновано модель нейро-нечіткої системи
кластеризації політематичних текстових документів з нечітким виведенням на основі
комбінованого методу навчання. Набув подальшого розвитку метод навчання для нейронних мереж, що самоорганізуються, який дозволяє підвищити швидкість обробки інформації,поліпшити якість кластеризації за наявності кластерів, що перетинаються, шляхом
використання нечіткого виведення.
Вперше запропоновано метод автоматичної кластеризації політематичних текстових
документів на основі генетичного алгоритму зі штучним відбором, який базується на
комплекс-методі адаптаційної оптимізації та дозволяє знаходити екстремум довільних
функцій великої кількості аргументів в умовах істотної невизначеності про характер цих функцій.
The thesis is devoted to developing of multi-topic texts clustering methods in the real time
using the adaptive fuzzy self-organizing neural network and genetic algorithm with the artificial
selection. I consider the existent methods of text documents processing and their clusterization.
Basic advantages and disadvantages have been revealed. For the first time, the adaptive fuzzy selforganizing
neural network has been developed. The probabilistic and possibilistic methods of the
self-organization for this neural network are first proposed. These methods allow to execute the
fuzzy clusterization of multi-topic text documents entering on the entrance of the network in the real
time. As a result, methods find new clusters. The proposed methods of learning differ from other
ones by the fast operation and low requirements to computational recourses. The model of the
neuro-fuzzy system of clusterization of multi-topic text documents is first developed with an fuzzy
inference applying the combined method of learning. This is based on simultaneous usage of the
probabilistic and possibilistic methods of self-organization, and takes into account fuzzy clusters
during the clusterization process of the multi-topic text documents. The method of learning of selforganizing
maps have got further development allowing to increase the speed of the information
processing, improve quality of the clusterization in the presence of intersecting clusters using of
fuzzy inference.
For the first time, the method of the automatic clusterization of the multi-topic text
documents have been developed using the genetic algorithm with the artificial selection. The
method is simple in realization and intended for the applications in Genetic Mining of large
collections of text documents in the mode of the sequential processing.
 
Language uk
 
Publisher Харк. нац. ун-т радіоелектроніки
 
Subject політематичні текстові документи
нечітка кластеризація
генетичні алгоритми
методи навчання
нечітке виведення
штучні нейронні мережі
multi-topic text documents
fuzzy clusterization
artificial neural networks
learning procedures
genetic algorithms
fuzzy inference
 
Title Методи нечіткої кластеризації політематичних текстових документів
 
Type Abstract