В роботі розвязується задача побудови моделей машинного навчання. Метою роботи
є підвищення точності моделей машинного навчання для випадку розподілу даних
навчальної вибірки відмінного від нормального. Поставлена мета досягається
шляхом застосування статечних перетворень до ознак навчальної вибірки для
стабілізації дисперсії випадкових величин. Найбільш суттєві результати: досліджено
ефективність методу статистичної класифікації на основі баєсова підходу для
побудови моделей у вигляді поліномів другого порядку, що дозволяє підвищити
точнысть моделювання у випадку розподілу даних навчальної вибірки відмінного від
нормального, проведені експериментальні дослідження і сформульовані рекомендації
щодо ефективності застосування статечних перетворень даних навчальної вибірки
при різних розподілах даних навчальної вибірки для наступних законів розподілу
випадкових величин: рівномірний, біноміальний, експоненціальне. Значимість
отриманих результатів: застосування сформульованих рекомендацій дозволяє
забезпечити підвищення точності моделей машинного навчання в умовах розподілу
даних навчальної вибірки відмінного від нормального. Запропоновані рекомендації
апробовані на даних тестового завдання. Завдання демонструє підвищення точності
моделей машинного навчання для більшості розглянутих законів розподілу
випадкових величин.
In the work the task of creating machine learning models is solved. The aim of the work is
to increase the accuracy of machine learning models for the case of a distribution of data of
the educational selection other than normal. This goal is achieved by using statistical
rearrangements to the features of the educational selection for stabilization of dispersion of
incidental values. The most significant results: The efficacy of the method of statistical
classification on the basis of the basis of the basic approach for creating models in the form
of polynomials of another order, which allows increasing the accuracy of modeling in the
case of distribution of data of the educational sample different from the normal one, was
investigated, Experimental studies and recommendations on the efficiency of using
statistical transformations of the educational selection data at different distributions of the
educational selection data for the following laws of distribution of incidental values were
made: Equinomial, Binomial, Exponential. Significance of the results: the application of the
formulated recommendations allows us to improve the accuracy of machine learning
models under conditions of a distribution of educational selection data different from the
normal. The provided recommendations were tested on the test assignment data. The task
demonstrates an increase in the accuracy of machine learning models for most of the
considered laws of distribution of incidental quantities.