Автоматизація процесу підготовки слабо структурованих багатовимірних даних соціологічних опитувань в системі Data Mining
DOI:
https://doi.org/10.15276/hait.01.2018.1Ключові слова:
інформаційна технологія, інтелектуальний аналіз даних, системи Data Mining, попередня обробкаАнотація
Для отримання знань про респондентів соціальних досліджень при розробці інформаційної технології інтелектуального аналізу автоматизовано етап підготовки слабо структурованих багатовимірних даних соціологічних опитувань. Для автоматизації підготовки даних розроблено інформаційну технологію яка базується на наступних методиках: машинного представлення , очищення та фільтрації даних; трансформації очищених даних в простір первинних ознак з урахуванням формалізованої мети дослідження; нелінійного зниження розмірності багатовимірного простору первинних ознак для побудови двовимірного простору вторинних ознак та їх подальшої візуалізації. Апробація інформаційної технології підготовки багатовимірних слабо структурованих даних спільно з системою DataMining на даних соціологічних опитувань дозволила підвищити достовірність прийняття рішень по стилю життя респондентів у порівнянні з соціологом кваліфікаційного рівня магістр та із власним визначенням респондентів. Як показали дослідження розробленої інформаційної технології підготовки даних соціологічних опитувань, найбільш впливовими на результат аналізу є процедури, що пов'язані з побудовою просторів первинних і вторинних ознак для подальшого проведення кластерізації та класифікації Представлені в зручному для експертів візуальному вигляді, отримані знання про досліджувану цільової аудиторію дозволяють легко враховувати їх при прийнятті обґрунтованих рішень фахівцями в предметної області.