Запис Детальніше

Iндуктивнi методи та алгоритми самоорганiзацiї моделей даних на основi карт Кохонена

Електронний науковий архів Науково-технічної бібліотеки Національного університету "Львівська політехніка"

Переглянути архів Інформація
 
 
Поле Співвідношення
 
Title Iндуктивнi методи та алгоритми самоорганiзацiї моделей даних на основi карт Кохонена
Индуктивные методы и алгоритмы самооргани- зации моделей данных на основе карт Кохонена
Inductive methods and algorithms for self-organising data modeling based on Kohonen’s maps
 
Creator Годич, Олесь Васильович
 
Subject карти Кохонена
iнтелектуальний аналiз даних
вiзуа лiзацiя даних
iндуктивне моделювання
паралельнi обчислення
карты Кохонена
интеллектуальный анализ данных
визуализация данных
индуктивное моделирование
параллельные вычисления
Self-Organising Maps
data mining
data visualisation
induc tive modelling
parallel computing
 
Description The goal of this thesis is to advance the state of inductive data modeling
methods and algorithms based on Kohonen’s self-organising maps (SOM) with
an emphasis on exploratory data analysis, descriptive data models and data
visualisation. All developed improvements and new methods have been eva-
luated on a number of datasets from UCI Machine Learning Repository. At
the same time an important part of the research is related to the practical
applications of the developed methods and algorithms, which cover cases of
modeling both structured (medical applications) and unstructured (image seg-
mentation) data, including visualisation. In light of the recent trends in the
CPU industry moving towards multi-core architectures, the developed during
the research software incorporates modifications of SOM training algorithms
optimised for symmetric multiprocessing.
The first chapter of the thesis introduces all important definitions and
provides an interpretation of SOM as an algebraic system provided with a
self-organising learning process. It also contains a detailed overview of recent
theoretical and practical advancements in SOM. The second chapter provides
an in-depth review of the main SOM features and the results of the developed
methodology for selecting optimal parameter values for a number of training
algorithms in application to analysis of the real-life medical data. As the re-
sult the classification success has been increased from 81.92% to 91.43%. The
details of a new training method “Neural Migration” and a new dynamic inter-
val self-organising map are provided in chapter three. Their application to the
test datasets yields significant improvements over alternatives. The improved
algorithm for data visualisation based on SOM and a derived from it image
segmentation method is discussed in the fourth chapter. The obtained results
correlate with the results of U-Matrix, but in addition it determines groups
of map elements responsible for modeling of individual data clusters. The last
chapter provides a detailed overview of the developed data mining software and
the proposed multi-threaded training algorithm, which yields on average up to
2.8 times performance improvement over the sequential version when execut-
ing on Intel Xeon E5504 CPU. An important aspect of the developed software
is the use of strictly free and open source libraries, programming languages
(Java 1.6 and Scala 2.7) and an environment (Eclipse IDE under Ubuntu OS).
The Scala programming language was used for its functional features provid-
ing a flexible way for implementing actor-based parallel computations while
remaining fully compatible with the Java code-base of the developed software.Диссертация посвящена процессам моделирования данных с исполь-
зованием карт Кохонена. На основании разработанной методики опреде-
ления оптимальных значений параметров обучающих методов получен
прирост качества классификации с 81.92% до 91.43%. Разработан метод
“нейронной миграции” обучения, который основан на идее повышения то-
пологического упорядочения карт, а также динамично-интервальная са-
моорганизуемая карта, которые обеспечили существенный прирост каче-
ства классификации. Усовершенствован метод визуализации кластерной
структуры данных, результаты работы которого согласуются с методом
U-Matrix. На его основании разработан алгоритм сегментации изображе-
ний, который был использован при построении тренажера украинского
жестового языка. Разработано математическое и программное обеспече-
ние интеллектуального анализа данных, которое включает многопотоко-
вый алгоритм обучения, который на системе с 4-х ядерным процессором
обеспечивает увеличение производительности в 2.8 раза, по сравнению с
последовательным алгоритмом.Дисертацiю присвячено процесам моделювання даних на основi карт
Кохонена. На основi розробленої методики визначення оптимальних зна-
чень параметрiв навчальних методiв досягнуто прирiст успiшностi класи-
фiкацiї з 81.92% до 91.43%. Розроблено метод “нейронної мiґрацiї” навчан-
ня, що ґрунтується на iдеї пiдвищення топологiчного впорядкування карт,
та розроблено динамiчно-iнтервальну самоорганiзовну карту, якi забезпе-
чили iстотний прирiст успiшностi класифiкацiї. Удосконалено метод вiзу-
алiзацiї кластерної структури даних, результати роботи якого узгоджую-
ться з методом U-Matrix. На його основi розроблено алгоритм сеґментацiї
зображень, який використано при побудовi тренажера української жесто-
вої мови. Розроблено математичне та програмне забезпечення для iнте-
лектуального аналiзу даних, яке iнкорпорує багатопотоковий алгоритм
навчання карт, що на системi з чотириядерним процесором забезпечує
збiльшення швидкодiї у 2.8 раза, порiвняно з послiдовним алгоритмом.
 
Date 2011-01-17T11:58:14Z
2011-01-17T11:58:14Z
2010
 
Type Autoreferat
 
Identifier Годич, О. В. Індуктивні методи та алгоритми самоорганізації моделей даних на основі карт Кохонена : автореферат дисертації кандидата технічних наук : 01.05.03 / О. В. Годич ; Національний університет "Львівська політехніка". - Львів, 2010. - 20 с.
http://ena.lp.edu.ua:8080/handle/ntb/7036
 
Language ua
 
Publisher Національний університет "Львівська політехніка"