Методи та засоби аналізу текстів публікацій для дослідження діяльності наукових шкіл
Електронний науковий архів Науково-технічної бібліотеки Національного університету "Львівська політехніка"
Переглянути архів ІнформаціяПоле | Співвідношення | |
Title |
Методи та засоби аналізу текстів публікацій для дослідження діяльності наукових шкіл
Методы и средства анализа текстов публикаций для исследования деятельности научных школ Methods and tools for text analysis publications to identify and study the functioning scientific schools |
|
Creator |
Нога, Роман Юрійович
|
|
Subject |
наукова школа
аналіз тексту публікації екстракція інформації кластеризація тематичне моделювання научная школа анализ текста публикации экстракция информации кластеризация тематическое моделирование scientific school publication text analysis information extraction clustering thematic design |
|
Description |
У дисертаційній роботі розв’язано актуальне наукове завдання розроблення математичних методів і програмних засобів аналізу текстів наукових публікацій для виявлення та дослідження результатів функціонування наукових шкіл, що дає змогу підвищити якість прийняття рішень щодо доцільності підтримки наукових досліджень за рахунок виявлення нових знань у слабоструктурованих документах. Проаналізовано методи опрацювання текстової інформації з множини розрізнених інформаційних ресурсів та визначено можливість їх застосування до аналізу наукових публікацій. Удосконалено метод екстракції даних з наукової публікації. Розроблено алгоритм попередньої рубрикації наукових публікацій з метою визначення ймовірної кількості кластерів. Удосконалено метод кластеризації k-середніх для поділу наукових статей за науковими школами. Визначено метрику якості кластерного рішення. Розроблено алгоритми аналізу наукових публікацій та прогнозування зміни кількісних характристик наукових шкіл таких як кількість публікацій, захисти дисертацій. Спроектовано архітектуру системи аналізу текстів публікацій для формування та аналізу наукових шкіл. Апробовано розроблені методи для електронної бібліотеки та для наукової установи. В диссертационной работе решено актуальное научное задание разработки математических методов и программных средств анализа текстов научных публикаций для выявления и исследования результатов функционирования научных школ, что позволяет повысить качество принятия решений о целесообразности поддержки научных исследований за счет выявления новых знаний в слабоструктурированных документах. Проанализированы методы обработки текстовой информации из множества разрозненных информационных ресурсов. Рассматриваются существующие методы анализа и работы с текстовыми данными, их преимущества, области применения, ограничения и проблемы. Проанализирована возможность их применения к анализу научных публикаций. Определены элементы текстовых документов, которые должны быть получены на основе полнотекстового поиска и экстракции. Усовершенствованы методы экстракции данных из научной публикации и кластеризации k-средних для разделения научных статей по научным школами. Определена метрика качества кластерного решения. Разработан метод определения вероятности появления новых публикаций в научных школах. Предложены алгоритмы анализа научных публикаций и прогнозирования изменения количественных характристик научных школ, таких как количества публикаций и защит диссертаций. Разработан алгоритм классификации публикаций по известным научными школами (рубрикам). Спроектирована архитектура системы анализа текстов публикаций для формирования и анализа научных школ. Определено качество кластеризации. Построено схему базы данных и основные программные модули. Они могут использоваться не только для выявления научных школ на базе анализа текстов публикаций, но и библиотеками для хранения и поиска публикаций, и центрами развития и инноваций для выявления тематик, по которым за определенный период больше публикаций. The dissertation solved the problem of current scientific development of mathematical methods and software tools to analyze texts to identify scientific publications and research results of functioning scientific schools, allowing to increase the quality of decision-making regarding the advisability support research through the discovery of new knowledge in semistructured documents. There are described the methods of processing text information from a plurality of disparate information resources. The method of extraction of data from scientific publications is given. The method of k-means clustering to split research papers for academic schools. There is defined the quality metric of cluster solution. The method of determining the likelihood of new publications in scientific schools is described. There is designed system architecture development and evaluation of scientific schools are given. Developed methods were tested for e-libraries and for academic institutions.
|
|
Date |
2015-06-03T12:24:39Z
2015-06-03T12:24:39Z 2015 |
|
Type |
Autoreferat
|
|
Identifier |
Нога Р. Ю. Методи та засоби аналізу текстів публікацій для дослідження діяльності наукових шкіл : автореферат дисертації на здобуття наукового ступеня кандидата технічних наук : 10.02.21 – структурна, прикладна і математична лінгвістика / Роман Юрійович Нога ; Міністерство освіти і науки України, Національний університет “Львівська політехніка”. – Львів, 2015. – 22 с. – Бібліографія: с. 17–18 (14 назв).
http://ena.lp.edu.ua:8080/handle/ntb/27646 |
|
Language |
ua
|
|
Publisher |
Національний університет "Львівська політехніка"
|
|