Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.opu.ua/jspui/handle/123456789/2612
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorКоляда, А . С .-
dc.contributor.authorЯковенко, В . А .-
dc.contributor.authorГогунский, В . Д .-
dc.contributor.authorKolyada, A . S .-
dc.contributor.authorYakovenko, В . A .-
dc.contributor.authorGogunsky, V . D .-
dc.contributor.authorКоляда, А . С .-
dc.contributor.authorЯковенко, В . О .-
dc.contributor.authorГогунський, В . Д .-
dc.date.accessioned2017-05-16T17:21:46Z-
dc.date.available2017-05-16T17:21:46Z-
dc.date.issued2014-
dc.identifier.citationКоляда, А. С. Применение латентного размещения Дирихле для анализа публикаций из наукометрических баз данных / А. С. Коляда, В. А. Яковенко, В. Д. Гогунский // Пр. Одес. політехн. ун-ту. - Одеса, 2014. - Вип. 1 (43). - С. 186-191.ru
dc.identifier.issn2076-2429-
dc.identifier.issn2223-3814-
dc.identifier.urihttp://pratsi.opu.ua/app/webroot/articles/1414145257.pdf-
dc.identifier.urihttp://dspace.opu.ua/jspui/handle/123456789/2612-
dc.description.abstractЦелью работы является определение наиболее подходящей тема- тической модели для классификации научных публикаций по авторам-однофамильцам. Проанализированы вероят- ностные тематические модели и предложено использование модели латентного размещения Дирихле — лидирую- щей среди вероятностных тематических моделей благодаря многочисленным обобщениям и приложениям к анализу коллекций текстовых документов. Для сравнения выбрана модель латентно семантического анализа, недостатки которой решаются при помощи рассматриваемой модели. Модель применена в проекте по извлечению публикаций из наукометрических баз данных. В этом проекте применение тематического моделирования позволяет решить про- блему разделения публикаций авторов-однофамильцев, где в качестве коллекции документов выбраны названия публикаций. Результаты показали что модель латентного размещения Дирихле уступает латентно-семантическому анализу, когда используется малый обьем содержимого документов. Поэтому для коллекций документов малого обьема предпочтительным является использование латентно-семантического анализа, а для больших обьемов — латентного размещения Дирихле.en
dc.description.abstractThe aim of the work is to determine the most appropriate model for a thematic classification of scientific publications by author with the same sirname. The probabilistic models are analyzed and it is proposed to use the model of latent Dirichlet allocation — the leading one among probabilistic models thanks to numerous generalizations and applications to the analysis of collections of text documents. For comparison the latent semantic analysis model is chosen. The model is used in the project for the extraction of publications from scientometric databases. In this project the usage of topic modeling solves the problem of separation of publications of authors with the same sirname, where titles of publications are selected as collection of documents. The results show that the model of latent Dirichlet allocation yield to the latent semantic analysis with usage of small volume of the contents of documents. Therefore, for small collections of documents of volume it is preferable to use latent semantic analysis, and for large volumes — latent Dirichlet allocation.en
dc.description.abstractМетою роботи є визначення найбільш відповідної тематичної моделі для класифікації наукових публікацій за автором-однофамільцем. Проаналізовано ймовірнісні тематичні моделі та за- пропоновано використання моделі латентного розміщення Діріхле — лідируючої серед імовірнісних тематичнихмоделей завдяки численним узагальненням і додаткам до аналізу колекцій текстових документів. Для порівняння обрано модель латентно-семантичного аналізу, недоліки якої вирішуються за допомогою розглянутої моделі. Мо- дель використана у проекті по вилученню публікацій з наукометричних баз даних. У цьому проекті застосування тематичного моделювання дозволяє вирішити проблему поділу публікацій авторів-однофамільців, де колекцією до- кументів обрано назви публікацій. Результати показують, що модель латентного розміщення Діріхле поступається латентно-семантичному аналізу, коли використовується малий обсяг вмісту документів. Тому для колекцій докумен- тів малого обсягу переважним є використання латентно-семантичного аналізу, а для великих обсягів — латентного розміщення Діріхлеen
dc.language.isoruen
dc.publisherOdessa Politechnic Universityen
dc.subjectмодельen
dc.subjectлатентныйen
dc.subjectсемантическийen
dc.subjectДирихлеen
dc.subjectтематическийen
dc.subjectпубликацияen
dc.subjectmodelen
dc.subjectlatenten
dc.subjectsemanticen
dc.subjectDirichleten
dc.subjecttopicen
dc.subjectpublicationen
dc.subjectмодельen
dc.subjectлатентнийen
dc.subjectсемантичнийen
dc.subjectДіріхлеen
dc.subjectтематичнийen
dc.subjectпублікаціяen
dc.titleПрименение латентного размещения Дирихле для анализа публикаций из наукометрических баз данных.en
dc.title.alternativeApplying latent Dirichlet allocation for analysis of publications in scientometric databases.en
dc.title.alternativeЗастосування латентного розміщення Діріхле для аналізу публікацій з наукометричних баз даних.en
dc.typeArticleen
opu.citation.journalPratsien
opu.citation.firstpage186en
opu.citation.lastpage191en
opu.citation.issue1(43)en
Располагается в коллекциях:Праці Одеського політехнічного університету, №1(43), 2014

Файлы этого ресурса:
Файл Описание РазмерФормат 
14.pdf405.09 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.