The paper considers the process of creating of electronic documents in data warehouse on the web-portal of open data.The result of this study is the method of text comparison for two structured electronic documents, which presented in tabular form to determine the possibility of their association in the data warehouse. The Scientific novelty of work is improvement of method for comparing the texts with integrated proximity of structured texts and their elements in rows and columns in a table, which allows to automate the process of establishing a semantic link between the data sets to create a data warehouse.
Розглядається процес створення сховища даних електронних документів Веб-порталу відкритих даних, для скорочення трудомісткості якого запропоновано розвиток методу порівняння текстів шляхом визначення інтегральної близькості структурованих текстів та їх елементів у вигляді рядків і стовпців, що дозволяє автоматизувати процес встановлення зв'язку між наборами при створенні сховища. Програмне забезпечення методу апробовано на документах з сайту головного управління статистики в Одеській області та громадського веб-порталу відкритих даних Одеській області.