eONPUIR

Розпізнавання іменованих сутностей та їхня роль при аналізі неструктурованих даних

Показать сокращенную информацию

dc.contributor.author Стасьо, Олег Романович
dc.contributor.author Staso, Oleh R.
dc.contributor.author Бурак, Назарій Євгенович
dc.contributor.author Burak, Nazarii Ye.
dc.date.accessioned 2024-10-10T10:16:25Z
dc.date.available 2024-10-10T10:16:25Z
dc.date.issued 2024-09-26
dc.identifier.issn 2522-1523
dc.identifier.uri http://dspace.opu.ua/jspui/handle/123456789/14662
dc.description.abstract У сучасному цифровому світі, де величезні обсяги неструктурованих даних генеруються щодня, здатність ефективно обробляти цю інформацію є ключовою для багатьох галузей. Неструктуровані дані, які включають текстові файли, електронні листи, відео, аудіо, зображення та інші форми медіа, становлять основну частину цифрових даних і вимагають спеціалізованих інструментів для їх аналізу. Обробка природної мови та розпізнавання іменованих сутностей є двома ключовими технологіями, які дозволяють перетворювати неструктуровані дані в структуровану інформацію, що може бути використана для різноманітних застосувань. Обробка природної мови дозволяє машинам розуміти, інтерпретувати, маніпулювати та генерувати людську мову, відкриваючи можливості для глибокого аналізу текстових даних. Це включає виявлення ключових слів, фраз, тем, а також емоційних нюансів у текстах. Зозпізнавання іменованих сутностей, як важлива складова обробка природної мови, спеціалізується на ідентифікації та класифікації іменованих сутностей у тексті на певні категорії, такі як імена осіб, організацій, локацій, дати, час та інші. Це дозволяє автоматизувати процеси сортування, категоризації та аналізу інформації. Проте, робота з обробка природної мови та стикається з низкою викликів. Великий обсяг і різноманітність даних ускладнюють їх збір, зберігання та аналіз. Відсутність стандартизації може призвести до проблем з сумісністю та інтеграцією різних джерел даних. Крім того, існують виклики, пов'язані з розпізнаванням іменованих сутностей, зокрема, розрізненням між однаковими іменами, які належать до різних осіб, та розумінням контексту, в якому використовуються імена. Незважаючи на ці виклики, перспективи Обробка природної мови та зозпізнавання іменованих сутностей виглядають оптимістично, з огляду на постійні інновації в галузі штучного інтелекту та машинного навчання, які обіцяють покращення точності та ефективності цих технологій у майбутньому. en
dc.description.abstract In today's digital world, where vast amounts of unstructured data are generated every day, the ability to efficiently process this information is key for many industries. Unstructured data, which includes text files, emails, video, audio, images, and other forms of media, is the bulk of digital data and requires specialized tools to analyze it. Natural Language Processing (NLP) and Named Entity Recognition (NER) are two key technologies that enable the transformation of unstructured data into structured information that can be used for a variety of applications. Natural Language Processing enables machines to understand, interpret, manipulate and generate human language, opening up possibilities for deep analysis of textual data. This includes identifying key words, phrases, themes, and emotional nuances in texts. NER, as an important component of Natural Language Processing, specializes in identifying and classifying named entities in the text into certain categories, such as names of persons, organizations, locations, dates, times, and others. This allows you to automate the processes of sorting, categorizing and analyzing information. However, working with Natural Language Processing and Named Entity Recognition faces a number of challenges. The large volume and variety of data make it difficult to collect, store and analyze it. Lack of standardization can lead to problems with interoperability and integration of different data sources. In addition, there are challenges related to the recognition of named entities, in particular, distinguishing between the same names belonging to different persons and understanding the context in which the names are used. Despite these challenges, the outlook for Natural Language Processing and Named Entity Recognition looks bright, with continued innovations in artificial intelligence and machine learning promising to improve the accuracy and efficiency of these technologies in the future. en
dc.language.iso uk en
dc.publisher Odessа Polytechnic National University en
dc.subject наука про дані en
dc.subject неструктуровані дані en
dc.subject аналіз даних en
dc.subject добування інформації en
dc.subject Data mining en
dc.subject обробка природної мови en
dc.subject розпізнавання іменованих сутностей en
dc.subject розпізнавання іменованих сутностей en
dc.subject Data science en
dc.subject unstructured data en
dc.subject data analysis en
dc.subject data mining en
dc.subject Natural Language Processing en
dc.subject Named Entity Recognition en
dc.title Розпізнавання іменованих сутностей та їхня роль при аналізі неструктурованих даних en
dc.title.alternative Named entity recognition and its role in unstructured data analysis en
dc.type Article en
opu.citation.journal Інформатика. Культура. Техніка = Informatics. Culture. Technology en
opu.citation.volume 1 en
opu.citation.firstpage 227 en
opu.citation.lastpage 232 en
opu.citation.conference Х МІЖНАРОДНА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ «Інформатика. Культура. Техніка» = X International conference "INFORMATICS. CULTURE. TECHNIQUE" en
opu.citation.issue 1 en


Файлы, содержащиеся в элементе

Этот элемент содержится в следующих коллекциях

Показать сокращенную информацию