Video fragment processing by Ky Fan norm

Mashtalir, Sergii Volodymyrovych; Машталір, Сергій Володимирович; Lendel, Dmytro P.; Лендьел, Дмитро Павлович

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.opu.ua/jspui/handle/123456789/14311

Название:	Video fragment processing by Ky Fan norm
Другие названия:	Фрагментна обробка відео за нормою Кі Фана
Авторы:	Mashtalir, Sergii Volodymyrovych Машталір, Сергій Володимирович Lendel, Dmytro P. Лендьел, Дмитро Павлович
Ключевые слова:	Video stream fragmentation Ky Fan norm Singular value decomposition фрагментація відеопотоку Кі Фан норма декомпозиція сингулярного значення
Дата публикации:	3-Апр-2024
Издательство:	Odessа Polytechnic National University
Краткий осмотр (реферат):	In this study, we focused on the formalization of video frame descriptions in the context of solving video segmentation problem. Since native video data can have various sizes, dividing each frame into blocks allows present image frame as a square matrix for a formal description. The frame block is a matrix of arbitrary dimensions. The ability to skip the step of matrix transformation to a square dimension or vectorization using some descriptor allows to reduce computational costs, freeing up computational resources required for this transformation. In our study, we used Ky Fan norm value as image frame block descriptor. The Ky Fan norm is built on top of matrix singular values. A singular decomposition does not impose restrictions on either the dimension or the character of the elements of the original matrix. We conducted a comparative analysis of the effectiveness of the obtained descriptor for different video data sizes and with different aspect ratios, showing that the change in the descriptor for each block is independent of the video size and aspect ratios. Changes in the descriptors for each block from frame to frame are identical for video data of varying sizes. This means that as a result of such fragment transform, a square matrix of a fixed size is created, regardless of the output video size. This makes it possible to unify further processing of the video, which can be useful for the task of information search in large video databases under the conditions of providing a query "ad exemplum". In this case, we can analyze the existing database in offline mode and match each video with a fixed square matrix of descriptors, which will significantly reduce the time and amount of resources when matching with the query. Also, this approach can be effectively used to analyze video data for the motion detection and scene change tracking. У даному дослідженні ми зосередили нашу увагу на способі формалізації опису блоків відеокадрів в контексті рішення задачі відео фрагментації. Оскільки відеодані можуть бути різного розміру, розбиття на блоки кожного кадру дає можливість формально описати кадр як квадратну матрицю. Блок кадру є матриця довільної розмірності. Можливість пропустити крок приведення такої матриці до квадратної, або векторизація за допомогою деякого дескриптора дозволяє знизити обчислювальні витрати, визволяючи обчислювальні ресурси необхідних для цього перетворення. В цьому дослідженні ми використовуємо норму Кі Фана в якості дескриптора блоку кадру. Норма Кі Фана побудована на основі сингулярних чисел матриці. Сингулярний розклад не має обмежень ні до розмірності, ні до характеру елементів вихідної матриці. Ми провели порівняльний аналіз ефективності отриманого дескриптора для відео даних різного розміру і з різним відношенням сторін який показав, що зміна дескриптора кожного блоку не залежить ні від розміру відео, ні від відношення сторін. Зміни дескрипторів кожного блоку від кадру до кадру є ідентичними для відеоданих різного розміру. Це означає, що в результаті такого фрагментного перетворення отримується квадратна матриця фіксованого розміру незалежно від розміру вихідного відео. Це дозволяє уніфікувати подальшу обробку відео, що може бути корисним для задачі інформаційного пошуку в великих базах відео даних за умов надання запиту «за зразком». В цьому випадку ми в режимі оффлайн можемо проаналізувати існуючу базу і співставити кожному відео фіксовану квадратну матрицю дескрипторів, що дозволить значно зменшити час та кількість ресурсів при співставленні із запитом. Також даний підхід може бути ефективно використаний для аналізу відео даних з метою детектування руху і відстеження зміни сцени.
URI (Унифицированный идентификатор ресурса):	http://dspace.opu.ua/jspui/handle/123456789/14311
ISSN:	2617-4316 2663-7723
Располагается в коллекциях:	2024, Vol. 7, № 1

Файлы этого ресурса:

Файл	Описание	Размер	Формат
5_Mashtalir_Lendiel.pdf		1.78 MB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.