Запис Детальніше

Semantic Analysis and Natural Language Text Search for Internet Portal

Институционный репозиторий Киевского университета имени Бориса Гринченко

Переглянути архів Інформація
 
 
Поле Співвідношення
 
Relation http://elibrary.kubg.edu.ua/id/eprint/27551/
http://ceur-ws.org/Vol-2362/
 
Title Semantic Analysis and Natural Language Text Search for
Internet Portal
Cемантичний аналіз і пошук текстів природною мовою для Інтернет-порталу
Семантический анализ и поиск текстов на естественном языке для Интернет-портала
 
Creator Kovaliuk, Tetiana
Kobets, Nataliya
 
Subject Scopus
Міжнародні
 
Description The article is devoted to solving the set of problems related to natural language texts semantic analysis. The following problems are addressed: automation of generating metadata files describing the semantic representation of a web page; semantic network construction for a given set of texts; semantic search execution for a given set of texts using metadata files; and semantic network export to RDF format. The algorithms for knowledge extraction from text, semantic network construction and query execution on a given semantic
network are described. The lexico-syntactic patterns method was used as a basis to approach these problems. A specification for describing lexico-syntactic patterns has been developed and a pattern interpreter based on the
morphological dictionary of the Ukrainian language has been created as a part of the software implementation of the method. Experimental studies have been carried out for the «classification of living organisms» subject environment set of patterns. Modified Boyer–Moore–Horspool algorithm was used to address the problem of interpreting.
Стаття присвячена розв’язанню комплексу задач з семантичного аналізу текстів природною мовою. Розглянуті такі задачі: автоматизація процесу генерації файлів метаданих, що описують семантичне представлення веб-сторінки; побудова семантичної мережі по заданій множині текстів; виконання семантичного пошуку по заданій множині
текстів з використанням файлів метаданих; експорт семантичної мережі в формат RDF. Для розв’язання поставлених задач описані алгоритми відокремлення знань із текстів, представлення їх у вигляді семантичної
мережі і виконанні запитів до побудованої мережі. Основним підходом до розв’язання цих задач слугував метод лексико-синтаксичних шаблонів.Для програмної реалізації методу розроблено специфікацію опису лексико-синтаксичних шаблонів, створено інтерпретатор шаблонів на основі морфологічного словнику української мови. Експериментальні дослідження проведені для набор шаблонів предметного середовища «класифікація живих організмів». Для розв’язання задачі інтерпретації лексико-синтаксичних шаблонів використовувався модифікований алгоритм Бойера–Мура–Хорпускула.
Статья посвящена решению комплекса задач семантического анализа текстов на естественном языке. Рассмотрены следующие задачи: автоматизация процесса генерации файлов метаданных, описывающих семантическое представление веб-страницы; построение семантической сети по заданному множеству текстов; выполнения семантического поиска по заданному множеству текстов с использованием файлов метаданных; экспорт семантической сети в формат RDF. Для решения поставленных задач описаны алгоритмы выделения знаний из текстов, представление их в виде семантической
сети и выполнении запросов к построенной сети. Основным подходом к решению этих задач служил метод лексико-синтаксических шаблонов. Для программной реализации метода разработаны спецификации описания лексико-синтаксических шаблонов, создан интерпретатор шаблонов на основе морфологического словаре украинского языка. Экспериментальные исследования проведены для набор шаблонов предметной среды «классификация живых организмов». Для решения задачи интерпретации лексико-синтаксических шаблонов использовался модифицированный алгоритм Бойера-Мура-Хорпускула
 
Publisher CEUR Workshop Proceedings
 
Date 2019-05-15
 
Type Стаття
PeerReviewed
 
Format text
 
Language ru
 
Identifier http://elibrary.kubg.edu.ua/id/eprint/27551/1/T_Kovaliuk_N_Kobets_CEUR-WS_vol-2362_paper25_FITU.pdf
Kovaliuk, Tetiana та Kobets, Nataliya (2019) Cемантичний аналіз і пошук текстів природною мовою для Інтернет-порталу CEUR Workshop Proceedings Volume 2362, 2019 3rd International Conference on Computational Linguistics and Intelligent Systems, COLINS 2019; Kharkiv; Ukraine; 18 April 2019 до 19 April 2019, 2362. с. 277-287. ISSN 1613-0073