Automation of searching for terms in the explanatory dictionary

dc.contributor.author Kungurtsev, Oleksii
dc.contributor.author Кунгурцев, Олексій Борисович
dc.contributor.author Кунгурцев, Алексей Борисович
dc.contributor.author Novikova, Nataliia
dc.contributor.author Новікова, Наталія Олексіївна
dc.contributor.author Kozhushan, Mariia
dc.contributor.author Кожушан, Марія Геннадіївна
dc.contributor.author Кожушан, Мария Геннадиевна
dc.date.accessioned 2021-05-02T17:20:50Z
dc.date.available 2021-05-02T17:20:50Z
dc.date.issued 2020
dc.identifier.citation Kungurtsev, O., Novikova, N., Kozhushan, M. (2020). Automation of searching for terms in the explanatory dictionary. Odes`kyi Polytechnichnyi Universytet, Pratsi, 3 (62), 91–100. en
dc.identifier.citation Kungurtsev, O. Automation of searching for terms in the explanatory dictionary / O. Kungurtsev, N. Novikova, M. Kozhushan // Пр. Одес. політехн. ун-ту. – Одеса, 2020. – Вип. 3 (62). – P. 91–100. en
dc.identifier.issn 2076-2429
dc.identifier.issn 2223-3814
dc.identifier.uri https://pratsi.opu.ua/app/webroot/articles/1612863161.pdf
dc.identifier.uri 10.15276/opu.3.62.2020.11
dc.identifier.uri http://dspace.opu.ua/jspui/handle/123456789/11592
dc.description.abstract In this paper, an approach for automating the search for interpretations of terms for a specific domain in explanatory dictionary and on the Internet is proposed. A mathematical model of the explanatory dictionary is developed. It bases on the structure of the dictionary entry. The methodology for setting up an analyzer of a dictionary entry in a dictionary that has not been used before is developed. A methodology for automated search for one-word and multiword terms in electronic dictionaries has been developed. It bases on scanning dictionary entries in search for term using Regular Expressions. The automation of searching on the Internet resource using a browser automation tool Selenium is proposed. Automated analysis of search results in according to subject area have been developed in two methods. If there is a stylistic label in the structure of a dictionary entry, which indicates the area of the polys mantic term using, the results are corrected by filtering out definitions that do not correspond to this subject area. If there is no stylistic label, the search results are filtering out in the way of screening out definitions for occurrence of search terms. The creation of Dictionary bank for storing set-up to search electronic dictionaries is proposed. The program product, which allows search organizing in added and built-in electronic dictionaries and on the Internet resource, was developed. Using the program requires involvement of an expert to correct and verify the results. Working with the program requires the involvement of an expert to correct and verify the results. The effectiveness of the approach is confirmed experimentally. Groups of English, Russian and Ukrainian terms from different subject areas were used in the experiments. Formulas to determine the time spent on searching are proposed to assess the effectiveness of the implementation of the developed methods. The results showed a reduce of the time spent on search in the automated mode in about 5 times compared to the manual one. It is shown that adding an explanatory dictionary of a specialized subject area gives the most certain definition of terms in search process en
dc.description.abstract В роботі запропонований спосіб автоматизації пошуку тлумачень термінів в залежності від розглянутої предметної області в раніше підключених словниках і в Інтернеті. Розроблено математичну модель тлумачного словника на основі аналізу структури словникових статей. Розроблено методику налаштування аналізатора словникової статті для певного словника, який раніше не використовувався. Розроблено методику автоматизованого пошуку однослівних і багатослівних термінів в електронних словниках шляхом сканування словникових статей на наявність пошукових термінів за допомогою регуляторних виразів. Реалізовано пошук в Інтернет-ресурсі завдяки інструменту для автоматизації дій веббраузера Selenium. Розроблено дві методики автоматизованого аналізу результатів пошуку відповідно до предметної області. При наявності в структурі словникової статті помітки стилістичної зони, яка вказує на область вживання терміну, результати коректуються шляхом відсіювання невідповідних їй тлумачень багатозначних термінів. При відсутності цієї позначки результати пошуку коригуються шляхом аналізу числа входжень пошукових термінів в тлумачення. Запропоновано створення банку словників для накопичення налаштованих для пошуку електронних словників. Розроблено програмний продукт, який дозволяє організувати пошук в підключених і вбудованих електронних тлумачних словниках і в Інтернет-ресурсі. Робота з програмою вимагає залучення експерта для коригування та верифікації результатів. Ефективність способу підтверджена експериментально. В експериментах були використані терміни російського, українського, англійської мов з різних предметних областей. Запропоновано формули розрахунку витраченого на пошук часу для оцінки ефективності реалізованих методик. Результати продемонстрували скорочення часу на пошук в автоматизованому режимі в порівнянні з ручним приблизно в 5 разів. Показано, що при підключенні тлумачного словника спеціалізованої предметної області, результати пошуку найбільш влучно розкривають поняття термінів. en
dc.language.iso en_US en
dc.publisher Одеса: [б. в.] en
dc.subject interpretation of the term en
dc.subject dictionary of the subject area en
dc.subject electronic dictionary en
dc.subject system of labels en
dc.subject mathematical model of the explanatory dictionary en
dc.subject тлумачення терміну en
dc.subject словник предметної області en
dc.subject електронний словник en
dc.subject система поміток en
dc.subject математична модель тлумачного словника en
dc.title Automation of searching for terms in the explanatory dictionary en
dc.title.alternative Автоматизація пошуку термінів в тлумачному словнику en
dc.type Article en
opu.kafedra Кафедра системного програмного забезпечення uk
opu.citation.journal Proceedings of Odessa Polytechnic University = Праці Одеського політехнічного університету en
opu.citation.firstpage 91 en
opu.citation.lastpage 100 en
opu.citation.issue 3(62)
opu.staff.id kungurtsev@opu.ua en

