The algorithms for software system of scientific publications analysis

Berlizov, Yevhen; Берлізов, Євген; Hapiak, Viktor; Хапяк, Віктор; Liubchenko, Vira; Любченко, Віра Вікторівна

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.opu.ua/jspui/handle/123456789/1138

Название:	The algorithms for software system of scientific publications analysis
Другие названия:	Алгоритмічне забезпечення програмної системи аналізу наукових публікацій
Авторы:	Berlizov, Yevhen Берлізов, Євген Hapiak, Viktor Хапяк, Віктор Liubchenko, Vira Любченко, Віра Вікторівна
Ключевые слова:	Analysis of Scientific Publications Information Extraction Terminals Entities Merging Entities Filtering Clustering Algorithms Graphs Markov Clustering Algorithm анализ научных публикаций извлечение информации терминалы объединение сущностей фильтрация сущностей алгоритмы кластеризации графы алгоритм марковской кластеризации аналіз наукових публікацій здобування інформації термінали об'єднання сутностей фільтрація сутностей алгоритми кластеризації графи алгоритм марковської кластеризації
Дата публикации:	Май-2016
Издательство:	Odessa National Polytechnic University
Библиографическое описание:	Berlizov, Ye., Hapiak, V., Liubchenko, V. (2016). The algorithms for software system of scientific publications analysis. Electrotechnic and Computer Systems, N 23 (99), p. 53–57. Berlizov, Ye. The algorithms for software system of scientific publications analysis / Ye. Berlizov, V. Hapiak, V. Liubchenko // Electrotechnic and Computer Systems. – 2016. – N 23 (99). – P. 53–57.
Краткий осмотр (реферат):	The purpose of the work is to define algorithms for the software system of scientific publications analysis, designed to identify research areas and groups of researchers with similar interests within the same university or faculty. There are many algorithms for solving information extracting problems, but they have some disadvantages regarding the solved problem. Therefore, we developed a proprietary algorithm that consists of four steps: lexical analysis, terminals normalization, entities combining and filtering. The results of information extracting are used to solve identification problems of authors groups and keywords groups considered as a clustering problem. The analyzed data are presented in the form of graphs of two types: a weighted graph of authors’ interactions and semantic graph of papers. This allows using for the analysis the clustering algorithms based on graph theory and algorithm of stochastic analysis MCL. An analysis of a test articles sample showed that clustering algorithms based on graph theory and algorithm of MCL identified the same clusters, but the algorithm that based on minimum spanning tree was better regarding computational complexity. Рассмотрены алгоритмы, применяемые для автоматизированного извлечения и анализа информации о научных публикациях. Для извлечения информации предложен алгоритм, состоящий из четырех шагов – лексический анализ, нормализация терминалов, объединение и фильтрация сущностей. Анализ информации предложено выполнять с помощью алгоритма, основанного на минимальном покрывающем дереве Розглянуто алгоритми, що застосовуються для автоматизованого здобування та аналізу інформації про наукові публікації. Для здобування інформації запропонований алгоритм, що складається з чотирьох кроків – лексичний аналіз, нормалізація терміналів, об'єднання і фільтрація сутностей. Аналіз інформації запропоновано виконувати за допомогою алгоритму базованому на мінімальному кістяковому дереві.
URI (Унифицированный идентификатор ресурса):	http://etks.opu.ua/?fetch=articles&with=info&id=835 http://dspace.opu.ua/xmlui/handle/123456789/1138
ISSN:	2221-3805 2221-3937
Располагается в коллекциях:	Статті каф. ІПЗ Електротехнічні та комп'ютерні системи №23(99), 2016

Файлы этого ресурса:

Файл	Описание	Размер	Формат
53-57.pdf		276.52 kB	Adobe PDF	Просмотреть/Открыть

Показать полное описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.