Паралельний корпус текстів ПарКУМ
ENPUIR - електронний архів наукових публікацій Національного педагогічного університету імені М. П. Драгоманова
Переглянути архів ІнформаціяПоле | Співвідношення | |
Title |
Паралельний корпус текстів ПарКУМ
Параллельный корпус текстов ПарКУМ Parallel corpus of texts ПарКУМ |
|
Creator |
Дарчук, Н. П.
Лангенбах, М. О. Сорокін, В. М. Ходаківська, Я. В. |
|
Subject |
паралельний корпус
корпусна лінгвістика корпусна розмітка паралельні тексти перекладні відповідники параллельный корпус корпусная лингвистика аннотация корпуса параллельные тексты переводные соответствия parallel corpus corpus linguistics annotation of the corpus parallel texts translation equivalents 81’33(477) |
|
Description |
Незважаючи на активний розвиток корпусної лінгвістики в Україні, досі існує велика прогалина в царині розробки паралельних корпусів. Метою роботи є формулювання основних засад творення та використання паралельного корпусу текстів ПарКУМ. Завдання, що вирішуються в ході дослідження: визначення напрямів перекладу та принципів добору текстів; вибір основних параметрів розмітки; визначення концепції роботи з матеріалом; розробка структури користувацького інтерфейсу. Подається інформація про всі типи розмітки, передбачені в корпусі: метатекстову, структурну та лінгвістичну. Окрім опису структури проекту, подано роз’яснення щодо принципів роботи з корпусом. Несмотря на активное развитие корпусной лингвистики в Украине, до сих пор существует большой пробел в области разработки параллельных корпусов. На сегодня почти не существует в открытом доступе подобных проектов, содержащих украиноязычные тексты. Цель статьи – изложение основных принципов создания и использования корпуса параллельных текстов ПарКУМ. Задания, решаемые в ходе исследования: определение принципов подбора текстов; выбор основных параметров разметки; формирование концепции работы с материалом; разработка структуры пользовательского интерфейса. Предоставляется информация обо всех типах разметки, предусмотренных в корпусе: метатекстовой, структурной и лингвистической, обеспечивающей возможность поиска информации не только по конкретным лексемам, но и по грамматическим признакам. Despite the fact that Ukrainian corpus linguistics has some visible achievements, there is one field which is still almost unexplored – parallel corpora. In this paper we present a project of parallel corpus containing Ukrainian texts. The goal of our research is to formulate the basic principles of parallel corpus development. The tasks being solved are: to define the directions of translation and demands to the textual material; to choose necessary parameters of annotation; to build the architecture of corpus system and define user roles; to develop user interface. The article gives the information about all types of tagging specified for the corpus texts: metadata, structural and linguistic annotation. The corpus works in two modes: administrative (available after the registration at the http://mova.info) and search. The project works in test mode. The Ukrainian-English and English-Ukrainian parallel texts are being collected now and some examples of them are already available for search. On the next stages the corpus fill be filled with other parallel texts – polish, Bulgarian, Turkish, German etc. |
|
Date |
2018-02-08T08:39:49Z
2018-02-08T08:39:49Z 2017 |
|
Type |
Article
|
|
Identifier |
Паралельний корпус текстів ПарКУМ / Н. П. Дарчук, М. О. Лангенбах, В. М. Сорокін, Я. В. Ходаківська // Науковий часопис Національного педагогічного університету імені М. П. Драгоманова. Серія 9 : Сучасні тенденції розвитку мов : зб. наук. праць. - Київ : Вид-во НПУ імені М. П. Драгоманова, 2017. - Вип. 15. - С. 28-35.
http://enpuir.npu.edu.ua/handle/123456789/17846 |
|
Language |
uk
|
|
Publisher |
Видавництво НПУ імені М. П. Драгоманова
|
|