Модель та метод пошуку ключових кадрів для реферування відеоданих
Електронного архіву Харківського національного університету радіоелектроніки (Open Access Repository of KHNURE)
Переглянути архів ІнформаціяПоле | Співвідношення | |
Title |
Модель та метод пошуку ключових кадрів для реферування відеоданих
|
|
Creator |
Міхнова, О. Д.
|
|
Subject |
реферування відео
ключовий кадр просторово-часова сегментація діаграма Вороного опорна точка video summarization key frame spatio-temporal segmentation Voronoi diagram salient point |
|
Description |
Дисертаційна робота присвячена розвитку актуального напрямку обробки відеоданих – пошуку ключових кадрів у різних за жанром відеопослідовностях із 17 залученням методів просторово-часової сегментації. З точки зору сегментації відео у часі досліджено переваги та недоліки існуючих методів визначення границь сцен. З точки зору просторової сегментації розбиття поля зору кожного кадру реалізовано за допомогою діаграм Вороного з урахуванням кольору, текстури та форми областей. Вдосконалено метод визначення місцезнаходження опорних точок, за якими будуються діаграми Вороного. Проаналізовано можливості та особливості побудови діаграм Вороного різних порядків для представлення змісту відео. Розроблено спеціалізовані метрики, які дозволили порівняти діаграми Вороного та визначити значні зміни змісту в усьому відео. На основні запропонованої математичної моделі представлення та аналізу змісту відео побудовано метод пошуку ключових кадрів, який дозволяє не тільки видобувати кадри зі значимим змістом, але й усувати близькі за змістом кадри. Проведені експериментальні дослідження підтвердили конкурентоспроможність нової моделі та методу, які було успішно впроваджено на промисловому підприємстві.Integration of video endoscopes and cameras into industrial, medical, security and other tracking systems has caused great interest to intellectual video processing. As a rule, monitoring of any object assumes huge amount of time and human resources needed not only for decision making, that influences on the state of objects under control, but also for long lasting tracking and identification of interesting or non-ordinary conditions. Video summarization is an excellent tool for redundancy elimination in video, which is achieved by key frame extraction. These static images with significant content provide a brief overview on what was going on in video for hours. Key frames can also facilitate indexing, archiving, searching and cataloging video information. Despite of variety of existing key frame extraction methods and content presentation models, the main problem they face is the gap between information retrieved from video at a low level and semantic interpretation at a high level required for efficient summarization. Another challenge consists in different lighting conditions and camera characteristics, with which a video is shot. That is why video summarization attracts more and more research and development efforts. To overcome the aforementioned problems a novel model and method have been developed. The main mathematics which lies on its basis is Voronoi diagrams applied for spatial segmentation of frames. The diagram corresponds to decomposition of a plane (frames, in our case) into Voronoi tessellations or regions. Each tessellation of the first order Voronoi diagram is connected with its own salient point and built under the following rule: the distance from any point located at the same tessellation to its salient point is less or equal to its distance to any other salient point. Voronoi diagrams of higher order (or generalized Voronoi diagrams) are built according to the following rule: the distance between the farthest point of one Voronoi tessellation to its corresponding generator points is closer or equals to the distance to any nearest generator point of another tessellation. Arbitrary Voronoi tessellation of order k may contain from 0 to k generator points. A simple Voronoi diagram of the first order is a particular case of higher order Voronoi diagrams.
|
|
Date |
2016-10-05T09:11:45Z
2016-10-05T09:11:45Z 2014 |
|
Type |
Other
|
|
Identifier |
Міхнова, О. Д. Модель та метод пошуку ключових кадрів для реферування відеоданих : автореф. дис. ... канд. техн. наук : 05.13.23 "Системи та засоби штучного інтелекту" / О. Д. Міхнова ; М-во освіти і науки України, Харків. нац. ун-т радіоелектроніки. – Харків, 2014. – 19 с.
http://openarchive.nure.ua/handle/document/3152 |
|
Language |
uk
|
|
Publisher |
Харьк. нац. ун-т радиоэлектроники
|
|