Algorithms and software for verification of scientific and technical text documents

dc.contributor.author Hlukhov, Valerii S.
dc.contributor.author Глухов, Валерій Сергійович
dc.contributor.author Sydorko, Dmytro S.
dc.contributor.author Сидорко, Дмитро Степанович
dc.date.accessioned 2023-10-02T22:39:14Z
dc.date.available 2023-10-02T22:39:14Z
dc.date.issued 2023-09-18
dc.identifier.issn 2617-4316
dc.identifier.issn 2663-7723
dc.identifier.uri http://dspace.opu.ua/jspui/handle/123456789/14087
dc.description.abstract The work provides a solution to the problem of verifying the design (formatting) of scientific and technical documents for compliance with the requirements of regulatory documents (the problem of document verification). The basis of the check is the analysis of the styles of the Word text editor, which are used to design the paragraphs of the document under study. For each element of the document (headings, annotations, main text, figures, signatures under figures, list of references and others) a reference style of their design was developed. Together, these styles form the set of allowed styles. There can be many sets of allowed styles, each edition has its own set of styles. Only the administrator has access to each of the sets, which can create new styles, new sets, and edit both individual styles and individual sets. Due to the peculiarities of style parsing, the document is treated as a combination of headers and footers and the body of the document. Algorithms for its verification were developed for this structure of the document: an algorithm for analyzing headers and footers, an algorithm for analyzing paragraphs of the main text, and an algorithm for updating style settings by the administrator. .Net, WPF, DocumentFormat.OpenXml technologies were used to implement the algorithms by software. Using DocumentFormat.OpenXml allows you to analyze styles in .doc/.docx format documents; the developed program accepts .doc or .docx format files as input and analyzes them for compliance with specified styles. The result of the analysis is returned in .txt or .doc/.docx format, indicating the detected deviations from the standards. The .txt format file is a list of found deviations, and in the .doc/.docx format files, the deviations are recorded in the form of comments to the original text. Using the program simplifies the process of checking documents, it allows you to identify all deviations from standards and reduce the time and resources spent on checking. .Net and WPF technologies were used to develop the user interface. The developed program was checked in the process of checking the explanatory notes of real bachelor's and master's qualification theses. The style analysis time was determined; the time does not exceed 3 seconds. The developed program can be useful for automating the process of checking documents, ensuring quality and compliance with the design standards of scientific and technical documentation, scientific and technical publications, and, first of all, in the educational process for checking the design of bachelor's and master's qualification works, as well as various reports. en
dc.description.abstract У роботі надано вирішення задачі перевіряння оформлення (форматування) наукових та технічних документів на дотримання вимог нормативних документів (задачі нормоконтролю документів). В основу перевірки покладено аналіз стилів текстового редактора Word, які використовуються для оформлення абзаців досліджуваного документа. Для кожного елемента документа (заголовків, анотацій, основного тексту, рисунків, підписів під рисунками, списком літератури ті інших) було розроблено еталонний стиль їхнього оформлення. Разом ці стилі утворюють набір дозволених стилів. Наборів дозволених стилів може бути багато, для кожного видання – свій набір стилів. Доступ до кожного з наборів має тільки адміністратор, який може створювати нові стилі, нові набори та редагувати як окремі стилі, так і окремі набори. З огляду на особливості аналізу стилів документ розглядається як об’єднання колонтитулів та основного тексту документу. Для такої структури документу було розроблено алгоритми його нормоконтролю: алгоритм аналізу колонтитулів, алгоритм аналізу абзаців основного тексту, а також алгоритм оновлення налаштувань стилів адміністратором. Для реалізації алгоритмів програмним способом було використано технології .Net, WPF, DocumentFormat.OpenXml. Використання DocumentFormat.OpenXml дозволяє аналізувати стилі в документах формату .doc/.docx, розроблена програма приймає на вхід файли формату .doc чи .docx і аналізує їх на відповідність заданим стилям. Результат аналізу повертається у форматі .txt чи .doc/.docx, із зазначенням виявлених відхилень від еталонів. Файл формату .txt представляє собою перелік знайдених відхилень, а у файлах форматів .doc/.docx відхилення фіксуються у вигляді коментарів до початкового тексту. Використання програми спрощує процес перевірки документів, дозволяє визначити всі відхилення від еталонів та знизити витрати часу та ресурсів на виконання нормоконтролю. Для розробки інтерфейсу користувача було використано технології .Net та WPF. Розроблену програму було перевірено в процесі нормоконтролю пояснювальних записок реальних бакалаврських та магістерських кваліфікаційних робіт. Було визначено час аналізу стилів, час не перевищує 3 с. Розроблена програма може бути корисною для автоматизація процесу нормоконтролю документів, забезпечення якості та дотримання стандартів оформлення наукової та технічної документації, наукових та технічних видань, і, в першу чергу, у навчальному процесі для нормоконтролю бакалаврських та магістерських кваліфікаційних робіт, а також різноманітних студентських звітів. en
dc.language.iso en en
dc.publisher Odessа Polytechnic National University en
dc.subject MS Word style en
dc.subject text analysis en
dc.subject document analysis en
dc.subject verification of documents en
dc.subject .doc en
dc.subject .docx en
dc.subject стиль MS Word en
dc.subject аналіз тексту en
dc.subject аналіз документу en
dc.subject нормоконтроль документів en
dc.subject doc en
dc.subject docx en
dc.title Algorithms and software for verification of scientific and technical text documents en
dc.title.alternative Алгоритми та програмне забезпечення для нормоконтролю наукових та технічних текстових документів en
dc.type Article en
opu.citation.journal Applied Aspects of Information Technology en
opu.citation.volume 3 en
opu.citation.firstpage 304 en
opu.citation.lastpage 317 en
opu.citation.issue 6 en

