Semantic Analysis and Natural Language Text Search for Internet Portal
Институционный репозиторий Киевского университета имени Бориса Гринченко
Переглянути архів ІнформаціяПоле | Співвідношення | |
Relation |
http://elibrary.kubg.edu.ua/id/eprint/27551/
http://ceur-ws.org/Vol-2362/ |
|
Title |
Semantic Analysis and Natural Language Text Search for Internet Portal Cемантичний аналіз і пошук текстів природною мовою для Інтернет-порталу Семантический анализ и поиск текстов на естественном языке для Интернет-портала |
|
Creator |
Kovaliuk, Tetiana
Kobets, Nataliya |
|
Subject |
Scopus
Міжнародні |
|
Description |
The article is devoted to solving the set of problems related to natural language texts semantic analysis. The following problems are addressed: automation of generating metadata files describing the semantic representation of a web page; semantic network construction for a given set of texts; semantic search execution for a given set of texts using metadata files; and semantic network export to RDF format. The algorithms for knowledge extraction from text, semantic network construction and query execution on a given semantic network are described. The lexico-syntactic patterns method was used as a basis to approach these problems. A specification for describing lexico-syntactic patterns has been developed and a pattern interpreter based on the morphological dictionary of the Ukrainian language has been created as a part of the software implementation of the method. Experimental studies have been carried out for the «classification of living organisms» subject environment set of patterns. Modified Boyer–Moore–Horspool algorithm was used to address the problem of interpreting. Стаття присвячена розв’язанню комплексу задач з семантичного аналізу текстів природною мовою. Розглянуті такі задачі: автоматизація процесу генерації файлів метаданих, що описують семантичне представлення веб-сторінки; побудова семантичної мережі по заданій множині текстів; виконання семантичного пошуку по заданій множині текстів з використанням файлів метаданих; експорт семантичної мережі в формат RDF. Для розв’язання поставлених задач описані алгоритми відокремлення знань із текстів, представлення їх у вигляді семантичної мережі і виконанні запитів до побудованої мережі. Основним підходом до розв’язання цих задач слугував метод лексико-синтаксичних шаблонів.Для програмної реалізації методу розроблено специфікацію опису лексико-синтаксичних шаблонів, створено інтерпретатор шаблонів на основі морфологічного словнику української мови. Експериментальні дослідження проведені для набор шаблонів предметного середовища «класифікація живих організмів». Для розв’язання задачі інтерпретації лексико-синтаксичних шаблонів використовувався модифікований алгоритм Бойера–Мура–Хорпускула. Статья посвящена решению комплекса задач семантического анализа текстов на естественном языке. Рассмотрены следующие задачи: автоматизация процесса генерации файлов метаданных, описывающих семантическое представление веб-страницы; построение семантической сети по заданному множеству текстов; выполнения семантического поиска по заданному множеству текстов с использованием файлов метаданных; экспорт семантической сети в формат RDF. Для решения поставленных задач описаны алгоритмы выделения знаний из текстов, представление их в виде семантической сети и выполнении запросов к построенной сети. Основным подходом к решению этих задач служил метод лексико-синтаксических шаблонов. Для программной реализации метода разработаны спецификации описания лексико-синтаксических шаблонов, создан интерпретатор шаблонов на основе морфологического словаре украинского языка. Экспериментальные исследования проведены для набор шаблонов предметной среды «классификация живых организмов». Для решения задачи интерпретации лексико-синтаксических шаблонов использовался модифицированный алгоритм Бойера-Мура-Хорпускула |
|
Publisher |
CEUR Workshop Proceedings
|
|
Date |
2019-05-15
|
|
Type |
Стаття
PeerReviewed |
|
Format |
text
|
|
Language |
ru
|
|
Identifier |
http://elibrary.kubg.edu.ua/id/eprint/27551/1/T_Kovaliuk_N_Kobets_CEUR-WS_vol-2362_paper25_FITU.pdf
Kovaliuk, Tetiana та Kobets, Nataliya (2019) Cемантичний аналіз і пошук текстів природною мовою для Інтернет-порталу CEUR Workshop Proceedings Volume 2362, 2019 3rd International Conference on Computational Linguistics and Intelligent Systems, COLINS 2019; Kharkiv; Ukraine; 18 April 2019 до 19 April 2019, 2362. с. 277-287. ISSN 1613-0073 |
|