Метрична класифікація рівня розвитку інформаційних технологій на підставі статистичних даних
Вантажиться...
Дата
2017
Автори
Науковий керівник
Укладач
Редактор
Назва журналу
ISSN
E-ISSN
Назва тому
Видавець
Одеський національний університет імені І. І. Мечникова
Анотація
Тема дипломної роботи «Метрична класифікація рівня розвитку інформаційних технологій на підставі статистичних даних».
Актуальність дипломної роботи полягає в необхідності аналізу метричних методів класифікації, та розробки програмного забезпечення, яке здійснює класифікацію країн, поділяючи їх на існуючі класи: високий, середній, низький.
Об'єкт дослідження – метричні алгоритми класифікації та їх застосування для класифікації рівня розвитку інформаційних технологій країн світу.
Мета роботи – створення інструментарію автоматичної класифікації статистичних даних.
Для досягнення поставленої мети вирішена задача попереднього аналізу вибірки. Далі проведена експертна класифікація вибірки і аналіз ступеня важливості параметрів. Також проведена нормалізація вибірки. Наступним етапом виступає реалізація модифікованого алгоритму KNN. Далі реалізована система вагових коефіцієнтів для вхідних параметрів і вже класифікованих об'єктів. Для зручності роботи з системою створений графічний інтерфейс взаємодії з користувачем. Для оцінки якості роботи алгоритму створена система оцінки класифікації на основі результатів класифікації контрольної вибірки і навчальної вибірки.
В результаті проведеної роботи було отримано збільшення якості класифікації контрольної вибірки з 89% до 96%.
Задача нахождения наиболее близкого объекта из некоторого класса к определенному заданному объекту другого класса является актуальной для многих прикладных областей. Сходство и различие между классифицируемыми объектами устанавливается в зависимости от метрического расстояния между ними. Актуальность дипломной работы заключается в необходимости анализа метрических методов классификации, и разработки программного обеспечения, которое осуществляет классификацию стран, разделяя их на существующие классы: высокий, средний, низкий. Цель работы – создание инструментария автоматической классификации статистических данных. Для достижения поставленной цели решена задача предварительного анализа выборки. Далее проведена экспертная классификация выборки и анализ степени важности параметров. Также проведена нормализация выборки. Следующим этапом выступает реализация модифицированного алгоритма KNN. Далее реализована система весовых коэффициентов для входных параметров и уже классифицированных объектов. Для удобства работы с системой создан графический интерфейс взаимодействия с пользователем. Для оценки качества работы алгоритма создана системы оценки классификации на основе результатов классификации контрольной выборки и обучающей выборки. В результате проведеной работы было получено увеличение качества классификации контрольной выборки с 89% до 96%.
Theme of the diploma work is "Metric classification of the level of development of information technology on the basis of statistical data." The relevance of diploma work is the need to analyze metric classification methods, and develop a software, which classifies countries dividing them by existing classes: high, medium, low. The object of research is the metric classification algorithms and their application for the classification of the information technologies development level of the countries of the world. The purpose of the work is to create a toolkit for automatic classification of statistical data. To achieve this goal, the task of preliminary analysis of the sample is solved. Next, an expert classification of the sample and an analysis of the importance of the parameters were carried out. Also, the sample was normalized. The next step is the implementation of the modified KNN algorithm. Next, a weighting system is implemented for input parameters and already classified objects. For the convenience of the system, a graphical user interface is created. To assess the quality of the algorithm, classification evaluation systems are created based on the results of the classification of the control sample and the training sample. As a result of the work, an increase in the quality of the control sample classification was obtained from 89% to 96%.
Задача нахождения наиболее близкого объекта из некоторого класса к определенному заданному объекту другого класса является актуальной для многих прикладных областей. Сходство и различие между классифицируемыми объектами устанавливается в зависимости от метрического расстояния между ними. Актуальность дипломной работы заключается в необходимости анализа метрических методов классификации, и разработки программного обеспечения, которое осуществляет классификацию стран, разделяя их на существующие классы: высокий, средний, низкий. Цель работы – создание инструментария автоматической классификации статистических данных. Для достижения поставленной цели решена задача предварительного анализа выборки. Далее проведена экспертная классификация выборки и анализ степени важности параметров. Также проведена нормализация выборки. Следующим этапом выступает реализация модифицированного алгоритма KNN. Далее реализована система весовых коэффициентов для входных параметров и уже классифицированных объектов. Для удобства работы с системой создан графический интерфейс взаимодействия с пользователем. Для оценки качества работы алгоритма создана системы оценки классификации на основе результатов классификации контрольной выборки и обучающей выборки. В результате проведеной работы было получено увеличение качества классификации контрольной выборки с 89% до 96%.
Theme of the diploma work is "Metric classification of the level of development of information technology on the basis of statistical data." The relevance of diploma work is the need to analyze metric classification methods, and develop a software, which classifies countries dividing them by existing classes: high, medium, low. The object of research is the metric classification algorithms and their application for the classification of the information technologies development level of the countries of the world. The purpose of the work is to create a toolkit for automatic classification of statistical data. To achieve this goal, the task of preliminary analysis of the sample is solved. Next, an expert classification of the sample and an analysis of the importance of the parameters were carried out. Also, the sample was normalized. The next step is the implementation of the modified KNN algorithm. Next, a weighting system is implemented for input parameters and already classified objects. For the convenience of the system, a graphical user interface is created. To assess the quality of the algorithm, classification evaluation systems are created based on the results of the classification of the control sample and the training sample. As a result of the work, an increase in the quality of the control sample classification was obtained from 89% to 96%.
Опис
Ключові слова
задачі класифікації, алгоритми метричної класифікації, алгоритм KNN
Бібліографічний опис
Кривонос, В. О. Метрична класифікація рівня розвитку інформаційних технологій на підставі статистичних даних = Метрическая классификация уровня развития информационных технологий на основе статистических данных = Metric classification of information technoligies development level on the basis of statistical data : дипломна робота бакалавра / В. О. Кривонос ; наук. кер. І. М. Шпінарева ; ОНУ ім. І.І. Мечникова, ІМЕМ, Каф. математичного забезпечення комп'ютерних систем . – Одеса, 2017 . – 47 с.