Iндуктивнi методи та алгоритми самоорганiзацiї моделей даних на основi карт Кохонена
Електронний науковий архів Науково-технічної бібліотеки Національного університету "Львівська політехніка"
Переглянути архів ІнформаціяПоле | Співвідношення | |
Title |
Iндуктивнi методи та алгоритми самоорганiзацiї моделей даних на основi карт Кохонена
Индуктивные методы и алгоритмы самооргани- зации моделей данных на основе карт Кохонена Inductive methods and algorithms for self-organising data modeling based on Kohonen’s maps |
|
Creator |
Годич, Олесь Васильович
|
|
Subject |
карти Кохонена
iнтелектуальний аналiз даних вiзуа лiзацiя даних iндуктивне моделювання паралельнi обчислення карты Кохонена интеллектуальный анализ данных визуализация данных индуктивное моделирование параллельные вычисления Self-Organising Maps data mining data visualisation induc tive modelling parallel computing |
|
Description |
The goal of this thesis is to advance the state of inductive data modeling methods and algorithms based on Kohonen’s self-organising maps (SOM) with an emphasis on exploratory data analysis, descriptive data models and data visualisation. All developed improvements and new methods have been eva- luated on a number of datasets from UCI Machine Learning Repository. At the same time an important part of the research is related to the practical applications of the developed methods and algorithms, which cover cases of modeling both structured (medical applications) and unstructured (image seg- mentation) data, including visualisation. In light of the recent trends in the CPU industry moving towards multi-core architectures, the developed during the research software incorporates modifications of SOM training algorithms optimised for symmetric multiprocessing. The first chapter of the thesis introduces all important definitions and provides an interpretation of SOM as an algebraic system provided with a self-organising learning process. It also contains a detailed overview of recent theoretical and practical advancements in SOM. The second chapter provides an in-depth review of the main SOM features and the results of the developed methodology for selecting optimal parameter values for a number of training algorithms in application to analysis of the real-life medical data. As the re- sult the classification success has been increased from 81.92% to 91.43%. The details of a new training method “Neural Migration” and a new dynamic inter- val self-organising map are provided in chapter three. Their application to the test datasets yields significant improvements over alternatives. The improved algorithm for data visualisation based on SOM and a derived from it image segmentation method is discussed in the fourth chapter. The obtained results correlate with the results of U-Matrix, but in addition it determines groups of map elements responsible for modeling of individual data clusters. The last chapter provides a detailed overview of the developed data mining software and the proposed multi-threaded training algorithm, which yields on average up to 2.8 times performance improvement over the sequential version when execut- ing on Intel Xeon E5504 CPU. An important aspect of the developed software is the use of strictly free and open source libraries, programming languages (Java 1.6 and Scala 2.7) and an environment (Eclipse IDE under Ubuntu OS). The Scala programming language was used for its functional features provid- ing a flexible way for implementing actor-based parallel computations while remaining fully compatible with the Java code-base of the developed software.Диссертация посвящена процессам моделирования данных с исполь- зованием карт Кохонена. На основании разработанной методики опреде- ления оптимальных значений параметров обучающих методов получен прирост качества классификации с 81.92% до 91.43%. Разработан метод “нейронной миграции” обучения, который основан на идее повышения то- пологического упорядочения карт, а также динамично-интервальная са- моорганизуемая карта, которые обеспечили существенный прирост каче- ства классификации. Усовершенствован метод визуализации кластерной структуры данных, результаты работы которого согласуются с методом U-Matrix. На его основании разработан алгоритм сегментации изображе- ний, который был использован при построении тренажера украинского жестового языка. Разработано математическое и программное обеспече- ние интеллектуального анализа данных, которое включает многопотоко- вый алгоритм обучения, который на системе с 4-х ядерным процессором обеспечивает увеличение производительности в 2.8 раза, по сравнению с последовательным алгоритмом.Дисертацiю присвячено процесам моделювання даних на основi карт Кохонена. На основi розробленої методики визначення оптимальних зна- чень параметрiв навчальних методiв досягнуто прирiст успiшностi класи- фiкацiї з 81.92% до 91.43%. Розроблено метод “нейронної мiґрацiї” навчан- ня, що ґрунтується на iдеї пiдвищення топологiчного впорядкування карт, та розроблено динамiчно-iнтервальну самоорганiзовну карту, якi забезпе- чили iстотний прирiст успiшностi класифiкацiї. Удосконалено метод вiзу- алiзацiї кластерної структури даних, результати роботи якого узгоджую- ться з методом U-Matrix. На його основi розроблено алгоритм сеґментацiї зображень, який використано при побудовi тренажера української жесто- вої мови. Розроблено математичне та програмне забезпечення для iнте- лектуального аналiзу даних, яке iнкорпорує багатопотоковий алгоритм навчання карт, що на системi з чотириядерним процесором забезпечує збiльшення швидкодiї у 2.8 раза, порiвняно з послiдовним алгоритмом. |
|
Date |
2011-01-17T11:58:14Z
2011-01-17T11:58:14Z 2010 |
|
Type |
Autoreferat
|
|
Identifier |
Годич, О. В. Індуктивні методи та алгоритми самоорганізації моделей даних на основі карт Кохонена : автореферат дисертації кандидата технічних наук : 01.05.03 / О. В. Годич ; Національний університет "Львівська політехніка". - Львів, 2010. - 20 с.
http://ena.lp.edu.ua:8080/handle/ntb/7036 |
|
Language |
ua
|
|
Publisher |
Національний університет "Львівська політехніка"
|
|