Accurate crowd counting for intelligent video surveillance systems

Dobryshev, Ruslan Y.; Добришев, Руслан Євгенович; Maksymov, Maksym V.; Максимов, Максим Віталійович

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.opu.ua/jspui/handle/123456789/14688

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.author	Dobryshev, Ruslan Y.	-
dc.contributor.author	Добришев, Руслан Євгенович	-
dc.contributor.author	Maksymov, Maksym V.	-
dc.contributor.author	Максимов, Максим Віталійович	-
dc.date.accessioned	2024-10-13T13:17:30Z	-
dc.date.available	2024-10-13T13:17:30Z	-
dc.date.issued	2024-09-27	-
dc.identifier.issn	2663-0176	-
dc.identifier.issn	2663-7731	-
dc.identifier.uri	http://dspace.opu.ua/jspui/handle/123456789/14688	-
dc.description.abstract	The paper presents a novel deep learning approach for crowd counting in intelligent video surveillance systems, addressing the growing need for accurate monitoring of public spaces in urban environments. The demand for precise crowd estimation arises from challenges related to security, public safety, and efficiency in urban areas, particularly during large public events. Existing crowd counting techniques, including feature-based object detection and regression-based methods, face limitations in high-density environments due to occlusions, lighting variations, and diverse human figures. To overcome these challenges, the authors propose a new deep encoder-decoder architecture based on VGG16, which incorporates hierarchical feature extraction with spatial and channel attention mechanisms. This architecture enhances the model’s ability to manage variations in crowd density, leveraging adaptive pooling and dilated convolutions to extract meaningful features from dense crowds. The model’s decoder is further refined to handle sparse and crowded scenes through separate density maps, improving its adaptability and accuracy. Evaluations of the proposed model on benchmark datasets, including Shanghai Tech and UCF CC 50, demonstrate superior performance over state-of-the-art methods, with significant improvements in mean absolute error and mean squared error metrics. The paper emphasizes the importance of addressing environmental variability and scale differences in crowded environments and shows that the proposed model is effective in both sparse and dense crowd conditions. This research contributes to the advancement of intelligent video surveillance systems by providing a more accurate and efficient method for crowd counting, with potential applications in public safety, transportation management, and urban planning.	en
dc.description.abstract	У статті представлено новий підхід на основі глибокого навчання для підрахунку натовпу в інтелектуальних системах відеоспостереження, що вирішує зростаючу потребу в точному моніторингу громадських місць у міських середовищах. Попит на точну оцінку кількості людей виникає через проблеми, пов’язані з безпекою, громадським порядком і ефективністю в міських зонах, особливо під час великих публічних заходів. Існуючі методи підрахунку натовпу, включаючи виявлення об’єктів на основі ознак і методи регресії, мають обмеження в умовах високої щільності через перекриття об’єктів, варіації освітлення та різноманітність людських фігур. Щоб подолати ці виклики, автори пропонують нову архітектуру енкодера-декодера на основі VGG16, яка включає ієрархічне вилучення ознак із використанням просторової та канальної уваги. Ця архітектура покращує здатність моделі керувати варіаціями щільності натовпу, використовуючи адаптивне підсумовування та дилатовані згортки для вилучення значущих ознак із щільних натовпів. Декодер моделі додатково вдосконалюється для обробки розріджених і густих сцен через окремі карти щільності, що підвищує її адаптивність і точність. Оцінка запропонованої моделі на еталонних наборах даних, включаючи Shanghai Tech і UCF CC 50, демонструє кращі результати порівняно з сучасними методами, з помітними покращеннями за метриками середньої абсолютної помилки та середньоквадратичної помилки. У статті підкреслюється важливість врахування змін у середовищі та різниці в масштабах у густонаселених середовищах, і показано, що запропонована модель ефективна як в умовах розрідженого, так і щільного натовпу. Це дослідження сприяє розвитку інтелектуальних систем відеоспостереження, пропонуючи більш точний і ефективний метод підрахунку натовпу з можливими застосуваннями у сфері громадської безпеки, управління транспортом і міського планування.	en
dc.language.iso	en	en
dc.publisher	Odessа Polytechnic National University	en
dc.subject	Crowd counting	en
dc.subject	intelligent video surveillance	en
dc.subject	deep learning	en
dc.subject	encoder-decoder architecture	en
dc.subject	density map estimation	en
dc.subject	hierarchical feature extraction	en
dc.subject	convolutional neural networks	en
dc.subject	public safety monitoring	en
dc.subject	підрахунок натовпу	en
dc.subject	інтелектуальні системи відеоспостереження	en
dc.subject	глибоке навчання	en
dc.subject	архітектура енкодера-декодера	en
dc.subject	оцінка карти щільності	en
dc.subject	ієрархічне вилучення ознак	en
dc.subject	згорткові нейронні мережі	en
dc.subject	моніторинг громадської безпеки	en
dc.title	Accurate crowd counting for intelligent video surveillance systems	en
dc.title.alternative	Точний підрахунок натовпу для інтелектуальних систем відеоспостереження	en
dc.type	Article	en
opu.citation.journal	Herald of Advanced Information Technology	en
opu.citation.volume	1	en
opu.citation.firstpage	253	en
opu.citation.lastpage	261	en
opu.citation.issue	7	en
Располагается в коллекциях:	2024, Vol. 7, № 3

Файлы этого ресурса:

Файл	Описание	Размер	Формат
3_Добришев_Максимов .pdf		683.98 kB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.