Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.opu.ua/jspui/handle/123456789/11592
Название: Automation of searching for terms in the explanatory dictionary
Другие названия: Автоматизація пошуку термінів в тлумачному словнику
Авторы: Kungurtsev, Oleksii
Кунгурцев, Олексій Борисович
Кунгурцев, Алексей Борисович
Novikova, Nataliia
Новікова, Наталія Олексіївна
Kozhushan, Mariia
Кожушан, Марія Геннадіївна
Кожушан, Мария Геннадиевна
Ключевые слова: interpretation of the term
dictionary of the subject area
electronic dictionary
system of labels
mathematical model of the explanatory dictionary
тлумачення терміну
словник предметної області
електронний словник
система поміток
математична модель тлумачного словника
Дата публикации: 2020
Издательство: Одеса: [б. в.]
Библиографическое описание: Kungurtsev, O., Novikova, N., Kozhushan, M. (2020). Automation of searching for terms in the explanatory dictionary. Odes`kyi Polytechnichnyi Universytet, Pratsi, 3 (62), 91–100.
Kungurtsev, O. Automation of searching for terms in the explanatory dictionary / O. Kungurtsev, N. Novikova, M. Kozhushan // Пр. Одес. політехн. ун-ту. – Одеса, 2020. – Вип. 3 (62). – P. 91–100.
Краткий осмотр (реферат): In this paper, an approach for automating the search for interpretations of terms for a specific domain in explanatory dictionary and on the Internet is proposed. A mathematical model of the explanatory dictionary is developed. It bases on the structure of the dictionary entry. The methodology for setting up an analyzer of a dictionary entry in a dictionary that has not been used before is developed. A methodology for automated search for one-word and multiword terms in electronic dictionaries has been developed. It bases on scanning dictionary entries in search for term using Regular Expressions. The automation of searching on the Internet resource using a browser automation tool Selenium is proposed. Automated analysis of search results in according to subject area have been developed in two methods. If there is a stylistic label in the structure of a dictionary entry, which indicates the area of the polys mantic term using, the results are corrected by filtering out definitions that do not correspond to this subject area. If there is no stylistic label, the search results are filtering out in the way of screening out definitions for occurrence of search terms. The creation of Dictionary bank for storing set-up to search electronic dictionaries is proposed. The program product, which allows search organizing in added and built-in electronic dictionaries and on the Internet resource, was developed. Using the program requires involvement of an expert to correct and verify the results. Working with the program requires the involvement of an expert to correct and verify the results. The effectiveness of the approach is confirmed experimentally. Groups of English, Russian and Ukrainian terms from different subject areas were used in the experiments. Formulas to determine the time spent on searching are proposed to assess the effectiveness of the implementation of the developed methods. The results showed a reduce of the time spent on search in the automated mode in about 5 times compared to the manual one. It is shown that adding an explanatory dictionary of a specialized subject area gives the most certain definition of terms in search process
В роботі запропонований спосіб автоматизації пошуку тлумачень термінів в залежності від розглянутої предметної області в раніше підключених словниках і в Інтернеті. Розроблено математичну модель тлумачного словника на основі аналізу структури словникових статей. Розроблено методику налаштування аналізатора словникової статті для певного словника, який раніше не використовувався. Розроблено методику автоматизованого пошуку однослівних і багатослівних термінів в електронних словниках шляхом сканування словникових статей на наявність пошукових термінів за допомогою регуляторних виразів. Реалізовано пошук в Інтернет-ресурсі завдяки інструменту для автоматизації дій веббраузера Selenium. Розроблено дві методики автоматизованого аналізу результатів пошуку відповідно до предметної області. При наявності в структурі словникової статті помітки стилістичної зони, яка вказує на область вживання терміну, результати коректуються шляхом відсіювання невідповідних їй тлумачень багатозначних термінів. При відсутності цієї позначки результати пошуку коригуються шляхом аналізу числа входжень пошукових термінів в тлумачення. Запропоновано створення банку словників для накопичення налаштованих для пошуку електронних словників. Розроблено програмний продукт, який дозволяє організувати пошук в підключених і вбудованих електронних тлумачних словниках і в Інтернет-ресурсі. Робота з програмою вимагає залучення експерта для коригування та верифікації результатів. Ефективність способу підтверджена експериментально. В експериментах були використані терміни російського, українського, англійської мов з різних предметних областей. Запропоновано формули розрахунку витраченого на пошук часу для оцінки ефективності реалізованих методик. Результати продемонстрували скорочення часу на пошук в автоматизованому режимі в порівнянні з ручним приблизно в 5 разів. Показано, що при підключенні тлумачного словника спеціалізованої предметної області, результати пошуку найбільш влучно розкривають поняття термінів.
URI (Унифицированный идентификатор ресурса): https://pratsi.opu.ua/app/webroot/articles/1612863161.pdf
10.15276/opu.3.62.2020.11
http://dspace.opu.ua/jspui/handle/123456789/11592
ISSN: 2076-2429
2223-3814
Располагается в коллекциях:Статті каф. ІПЗ
Праці Одеського політехнічного університету, №3(62), 2020

Файлы этого ресурса:
Файл Описание РазмерФормат 
1612863161.pdf358.38 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.