Дисертації ФМФІТ (Комп'ютерні науки)
Постійне посилання зібрання
Переглянути
Нові надходження
Документ Математичні моделі для обробки інформації з метрик Web застосунків, що розробляються з використанням PHP-фреймворків(2026) Приходько, Андрій Сергійович; Prykhodko, Andrii S.Приходько А.С. Математичні моделі для обробки інформації з метрик Web застосунків, що розробляються з використанням PHP-фреймворків. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії (PhD) за спеціальністю 122 "Комп’ютерні науки" (галузь 12 – Інформаційні технології). – Одеський національний університет імені І. І. Мечникова, Міністерство освіти і науки України, Одеса, 2026. Дисертаційна робота присвячена вирішенню важливого науково практичного завдання підвищення достовірності результатів обробки інформації з програмних метрик Web застосунків, що розробляються з використанням PHP фреймворків, за рахунок побудови певних математичних моделей для обробки відповідної інформації та створенню на їх основі інструментарію інформаційної технології (ІТ) обробки інформації з програмних метрик Web застосунків, що розробляються з використанням PHP-фреймворків. Актуальність цієї роботи пов'язана з наступним. Зараз вебзастосунки відіграють вирішальну роль у багатьох аспектах нашого повсякденного життя, включаючи соціальні мережі, електронну комерцію, медицину, освіту, фінанси та інші сфери. При чому багато вебзастосунків розробляється із застосуванням PHP-фреймворків. Відомо, що створення якісного програмного забезпечення (ПЗ) залишається одним з головних завдань індустрії його розробки. Інша задача – це визначення складності об’єктно-орієнтованого проектування (ООП) ПЗ, яка також є важливою для IT-компаній, оскільки тісно пов’язана з подальшими витратами, які виникають в процесі життєвого циклу розробки ПЗ. Ще одна задача, яка пов’язана з прогнозуванням витрат, тривалості та трудомісткості розробки, – це задача раннього оцінювання кількості рядків коду ПЗ. Зазначене також стосується і вебзастосунків, розроблених із застосуванням PHP фреймворків. Рішення зазначених задач, у тому числі, потребує обробки інформації з відповідних програмних метрик та побудови певних математичних моделей. Як показують роботи багатьох дослідників, розподіл програмних метрик відхиляється від нормального, що вимагає застосування таких методів та моделей, які би враховували зазначене відхилення. Крім того, спостерігається кореляція між певними програмними метриками, яку також треба враховувати. На сьогодні відомі методи і моделі, які дозволяють вести обробку інформації з програмних метрик та вирішувати зазначені вище задачі для ПЗ, що створено різними мовами, у тому числі і PHP. Але, як показують дослідження, математичні моделі для обробки інформації з програмних метрик та рішення вказаних вище задач залежать не тільки від мови програмування, а і від технології та інструментів, які при цьому використовуються. Саме тому виникає потреба у створенні математичних моделей для обробки інформації з метрик Web застосунків, що розробляються з використанням PHP-фреймворків, та рішення за їх допомогою зазначених вище задач саме для вказаних Web застосунків. Зараз побудову зазначених моделей здійснюють за наборами даних з відповідних метрик, розподіл яких, як правило, не є гаусівським. Це призводить як до проблеми попередньої обробки інформації, яка стосується перевірки даних на наявність викидів, так і до проблеми побудови самих математичних моделей. Відомі методи визначення викидів, у тому числі і багатовимірних, базуються на припущенні нормальності розподілу даних, яке як правило не підтверджується для даних з метрик ПЗ. А це впливає на достовірність обробки інформації, у тому числі з метрик Web застосунків, що розробляються з використанням PHP фреймворків. Зазначене призводить до необхідності удосконалення відповідних математичних моделей, які би дозволили врахувати відхилення від нормальності у наборах даних з метрик Web застосунків, що розробляються з використанням PHP-фреймворків, при їх обробці. Метою дисертаційної роботи є підвищення достовірності результатів обробки інформації з програмних метрик Web застосунків, що розробляються з використанням PHP-фреймворків, шляхом створення математичних моделей, які враховують кореляцію між програмними метриками та відхилення їх багатовимірного розподілу від нормального. Робочою науковою гіпотезою дисертаційного дослідження є твердження, що підвищення достовірності результатів обробки інформації з програмних метрик Web застосунків, що розробляються з використанням PHP фреймворків, досягається за рахунок застосування математичних моделей, які враховують кореляцію між програмними метриками та відхилення їх багатовимірного розподілу від нормального. Для побудови вказаних математичних моделей пропонується використовувати відомі методи на основі багатовимірних нормалізуючих перетворень, які дозволяють враховувати кореляцію між програмними метриками та відхилення їх багатовимірного розподілу від нормального. Припускається, що застосування зазначених математичних моделей дозволить покращити якість результатів рішення вказаних раніше задач подібно трансферному навчанню – методу машинного навчання, в якому знання (нова інформація), отримані в результаті виконання одного завдання або набору даних, використовуються для покращення якості моделі в іншому пов'язаному завданні або іншому наборі даних. Для досягнення поставленої мети потрібно вирішити такі завдання: - проаналізувати існуючі математичні моделі для обробки інформації з програмних метрик та відомі за їх допомогою рішення задач з визначення складності ООП, якості розробки та кількості рядків коду ПЗ; - зібрати набори даних з програмних метрик Web застосунків, що розробляються з використанням PHP-фреймворків; - побудувати три математичні моделі для обробки інформації з шести програмних метрик Чидамбера і Кемерера (Chidamber and Kemerer, CK) Web застосунків, що розробляються з використанням PHP-фреймворків, та здійснити на їх основі рішення задачі з визначення складності ООП на кожному з трьох етапів за Бучем (Booch); - удосконалити математичну модель для обробки інформації з трьох програмних метрик (RFC, CBO та WMC) Web застосунків, що розробляються з використанням PHP-фреймворків, у вигляді тривимірного еліпсоїду прогнозування для зазначених нормалізованих метрик та рівнянь для визначення границь довірчих інтервалів та інтервалів прогнозування трьох нелінійних регресій програмних метрик RFC, CBO і WMC, а також здійснити на її основі рішення задачі з визначення якості вказаних застосунків; - удосконалити математичні моделі для обробки інформації з чотирьох програмних метрик та трьохфакторні нелінійні регресійні моделі для оцінювання кількості рядків коду Web застосунків, що розробляються з використанням різних PHP-фреймворків, за метриками діаграми класів на основі чотиривимірного нормалізуючого перетворення; - удосконалити рівняння для визначення границь довірчого інтервалу та інтервалу прогнозування нелінійної регресії кількості рядків коду Web застосунків, що розробляються з використанням PHP-фреймворків, на основі чотиривимірного нормалізуючого перетворення за метриками діаграми класів; - на підставі розроблених математичних моделей створити інструментарій інформаційної технології (ІТ) для рішення задач з визначення складності ООП, якості розробки та кількості рядків коду Web застосунків, що розробляються з використанням PHP-фреймворків. Наукова новизна одержаних результатів полягає у наступному. 1) Вперше побудовано дві математичні моделі для обробки інформації з двох груп програмних метрик (відповідно WMC, DIT і NOC та WMC, RFC і LCOM) Web застосунків, що розробляються з використанням PHP-фреймворків, у вигляді тривимірних еліпсоїдів прогнозування і рівнянь регресії для зазначених нормалізованих метрик на основі тривимірного нормалізуючого перетворення Бокса – Кокса. Ці дві математичні моделі дозволяють підвищити достовірність результатів обробки інформації з двох груп метрик WMC, DIT і NOC та WMC, RFC і LCOM за рахунок врахування як кореляції між ними, так і відхилення тривимірних розподілів цих метрик від нормального, та здійснити на їх основі рішення задачі з визначення складності ООП на його першому та другому етапах (через ідентифікацію та семантику класів) за Бучем. 2) Удосконалено математичну модель для обробки інформації з програмних метрик RFC і CBO Web застосунків, що розробляються з використанням PHP-фреймворків, у вигляді еліпсу прогнозування і рівнянь регресії для зазначених нормалізованих метрик на основі двовимірного нормалізуючого перетворення Бокса – Кокса. Ця математична модель дозволяє підвищити достовірність результатів обробки інформації з метрик RFC і CBO за рахунок врахування як кореляції між ними, так і відхилення двовимірного розподілу цих метрик від нормального, та здійснити на їх основі рішення задачі з визначення складності ООП на його третьому етапі (через зв’язки між класами) за Бучем. 3) Удосконалено математичну модель для обробки інформації з трьох програмних метрик RFC, CBO і WMC Web застосунків, що розробляються з використанням PHP-фреймворків, у вигляді тривимірного еліпсоїду прогнозування для зазначених нормалізованих метрик і рівнянь для визначення границь довірчих інтервалів та інтервалів прогнозування трьох нелінійних регресій програмних метрик RFC, CBO і WMC на основі тривимірного нормалізуючого перетворення Бокса – Кокса. Ця математична модель дозволяє підвищити достовірність результатів обробки інформації з метрик RFC, CBO і WMC за рахунок врахування як кореляції між ними, так і відхилення тривимірного розподілу цих метрик від нормального, та здійснити на їх основі рішення задачі з визначення якості Web застосунків, що розробляються з використанням PHP-фреймворків. 4) Удосконалено три математичні моделі для обробки інформації з чотирьох програмних метрик (кількості рядків коду, кількості класів, середньої кількості методів на клас і метрики DIT) у вигляді чотиривимірних еліпсоїдів прогнозування для зазначених нормалізованих метрик та трифакторних нелінійних регресійних моделей для оцінювання кількості рядків коду Web застосунків, що розробляються з використанням PHP-фреймворків, на основі чотиривимірного нормалізуючого перетворення Бокса – Кокса. Ці математичні моделі дозволяють підвищити достовірність результатів обробки інформації із зазначених метрик за рахунок врахування як кореляції між ними, так і відхилення чотиривимірного розподілу цих метрик від нормального, та здійснити на їх основі рішення задачі раннього оцінювання кількості рядків коду Web застосунків, що розробляються з використанням таких відомих PHP-фреймворків як CakePHP, Codeigniter і Yii, за трьома метриками діаграми класів. Отримані трифакторні нелінійні регресійні моделі в порівнянні з іншими регресійними моделями мають більший відсоток прогнозованих значень PRED, менше значення середньої величини відносної похибки MMRE та менші ширини довірчого інтервалу та інтервалу прогнозування нелінійної регресії. 5) Удосконалено рівняння для визначення границь довірчого інтервалу та інтервалу прогнозування трифакторних нелінійних регресій кількості рядків коду Web застосунків, що розробляються з використанням різних PHP-фреймворків, в залежності від кількості класів, середньої кількості методів на клас і метрики DIT на основі чотиривимірного нормалізуючого перетворення Бокса – Кокса. Рівняння для визначення нижньої та верхньої границь довірчого інтервалу та інтервалу прогнозування дозволяють здійснювати оцінювання точності умовного вибіркового середнього та меж моделювання умовної випадкової величини кількості рядків коду Web застосунків, що розробляються з використанням таких відомих PHP-фреймворків як CakePHP, Codeigniter і Yii. Практичне значення одержаних результатів полягає у наступному. На підставі розроблених математичних моделей створено інструментарій інформаційної технології (ІТ) для рішення задач з визначення складності ООП, якості розробки та кількості рядків коду Web застосунків, що розробляються з використанням PHP-фреймворків. Для цього використовувалася мова програмування Python. Було створено відповідне ПЗ для рішення задач з визначення складності ООП, якості розробки та кількості рядків коду Web застосунків, що розробляються з використанням PHP-фреймворків, які розраховані на використання зазначеного ПЗ. У вступі дисертації розкрита сутність науково-практичного завдання та його значущість, обґрунтовано необхідність проведення дослідження, подана загальна характеристика дисертації в такій послідовності: актуальність теми; зв’язок роботи з науковими програмами, планами, темами; мета і завдання дослідження; наукова новизна та практичне значення одержаних результатів; особистий внесок здобувача; апробація результатів дисертації та публікації. У першому розділі дисертації виконано аналіз задач, рішення яких, у тому числі, потребує обробки інформації з відповідних програмних метрик, і побудови певних математичних моделей; здійснено аналіз існуючих методів і моделей для обробки інформації з метрик Web застосунків, що розробляються з використанням PHP-фреймворків, обґрунтування необхідності проведення досліджень за обраною темою. У другому розділі дисертації розглянуто існуючі взаємо-зворотні багатовимірні нормалізуючі перетворення та методи оцінювання їх параметрів, здійснено вибір багатовимірних нормалізуючих перетворень для нормалізації двовимірних, тривимірних та чотиривимірних наборів даних з метрик Web застосунків, що розробляються з використанням PHP-фреймворків. У третьому розділі дисертації побудовано дві математичні моделі для обробки інформації з двох груп програмних метрик (відповідно WMC, DIT і NOC та WMC, RFC і LCOM) Web застосунків, що розробляються з використанням PHP-фреймворків, у вигляді тривимірних еліпсоїдів прогнозування і рівнянь регресії для зазначених нормалізованих метрик на основі тривимірного нормалізуючого перетворення Бокса – Кокса; удосконалено модель для обробки інформації з програмних метрик RFC і CBO Web застосунків, що розробляються з використанням PHP-фреймворків, у вигляді еліпсу прогнозування і рівнянь регресії для зазначених нормалізованих метрик на основі двовимірного нормалізуючого перетворення Бокса – Кокса; удосконалено математичну модель для обробки інформації з трьох програмних метрик RFC, CBO і WMC Web застосунків, що розробляються з використанням PHP-фреймворків, у вигляді тривимірного еліпсоїду прогнозування для зазначених нормалізованих метрик і рівнянь для визначення границь довірчих інтервалів та інтервалів прогнозування трьох нелінійних регресій програмних метрик RFC, CBO і WMC на основі тривимірного нормалізуючого перетворення Бокса – Кокса; удосконалено математичні моделі та рівняння для визначення границь довірчого інтервалу та інтервалу прогнозування трифакторних нелінійних регресії кількості рядків коду Web застосунків, що розробляються з використанням різних PHP-фреймворків, в залежності від кількості класів, середньої кількості методів на клас і метрики DIT на основі чотиривимірного нормалізуючого перетворення; здійснено порівняння результатів за різними моделями, у тому числі моделями машинного навчання. У четвертому розділі дисертації на підставі розроблених математичних моделей створено інструментарій ІТ для рішення задач з визначення складності ООП, якості розробки та кількості рядків коду Web застосунків, що розробляються з використанням PHP-фреймворків. Для цього використовувалася мова програмування Python. Було розроблено відповідне ПЗ для рішення задач з визначення складності ООП, якості розробки та кількості рядків коду Web застосунків, що розробляються з використанням PHP-фреймворків.Документ Методи та інформаційна технологія предметно-орієнтованого аналізу природномовних текстів(2025) Бочарова, Майя Юріївна; Bocharova, Maiia Yu.Бочарова М. Ю. Методи та інформаційна технологія предметно-орієнтованого аналізу природномовних текстів. — Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктор філософії (PhD) за спеціальністю 122 “Комп'ютерні науки”. — Одеський національний університет імені І. І. Мечникова, Одеса, 2025. У дисертаційній роботі представлені результати проведених здобувачем досліджень, які виконують актуальне наукове завдання створення моделей та методів предметно-орієнтованого аналізу природномовних текстів, яке має істотне значення для розвитку інформаційних технологій. У вступі дисертації обґрунтовано актуальність дослідження за темою предметно-орієнтованого аналізу природномовних текстів, сформульовані мета, задачі та методи дослідження, наведено наукову новизну та практичне значення отриманих результатів, зазначено особистий внесок здобувача. У першому розділі роботи досліджено актуальний стан проблеми автоматизованого аналізу документів в сфері управління персоналом із застосуванням штучного інтелекту. Показано, що обробка резюме для витягнення ключової інформації, зіставлення вакансій та резюме є необхідним елементом підвищення ефективності рекрутингу і перспективним напрямком для подальшого удосконалення і розвитку. Показано, що застосування моделей, які використовують компʼютерний зір, не є доцільним для обробки візуально насичених документів у сфері управління людськими ресурсами. На основі аналізу літературних джерел обґрунтована доцільність використання контексту під час моделювання подань фраз. Висвітлена проблема обробки документів, обсяг яких перевищує ліміт моделей, які використовуються для їх обробки. Показано, що відсутність даних щодо впливу обсягу тренувальних зразків при автоматичній їх генерації (з використанням великих мовних моделей) на якість сумаризації документів у домені управління персоналом потребує дослідження в цьому напрямку. Потребують дослідження підходи некерованого попереднього тренування з використанням структури документів, а також функції втрат, які використовуються для попереднього тренування (зважена функція втрат). Відзначена важливість англійської мови для поширення набутих знань щодо використання штучного інтелекту у рекрутингу. Встановлено необхідність удосконалення крос-лінгвістичної дистиляції векторних подань для підвищення ефективності рекрутингу із застосуванням штучного інтелекту. Встановлено доцільність дослідження впливу дистиляції на показники швидкості та якості етапів технології обробки природномовних текстів щодо аналізу резюме та зіставлення з вимогами вакансій. У другому розділі розроблено методи та моделі для предметно-орієнтованої обробки природномовних текстів. В тому числі представлено новий метод безпосередньої інтеграції параметрів про стильові ознаки, де додаткові дискретні ознаки векторизуються і передаються в архітектуру “Трансформер” разом із позиційними і токеновими поданнями. Запропоновано новий метод тренування подань назв посад, що базується на використання фраз навичок, які зазначені в описі роботи. Цей метод базується на введенні спеціального токена для виділення та представлення кожної навички у поєднанні з контрастним тренуванням з метою зіставлення усередненого подання навичок та назви посади з одного опису роботи. Запропоновано новий метод некерованого навчання моделі з використанням структури документів. На відміну від традиційного методу, в якій позитивні пари для подальшого контрастного навчання вибирають з документу випадковим чином, запропонований метод базуються на використанні структури документу. Запропоновано новий метод автоматичного створення датасету вакансія-резюме, який полягає у використанні структури документа і визначеного опису останньої ролі та перетворення цього запису на опис вакансій з використанням великої мовної моделі. Запропоновано метод скорочення тексту з урахуванням структури документу та ключових фраз. Цей метод полягає у скороченні кожної секції пропорційно до її відсоткового внеску у загальну довжину резюме на основі виділення ключових фраз. Розроблено метод некерованого попереднього тренування для сумаризації документів у сфері управління персоналом. Цей метод полягає у використанні секції “анотація” з резюме для некерованого тренування моделі сумаризації, а також у застосуванні зваженої функції втрат, яка підвищує вагомість для токенів, які формують ключові фрази. У третьому розділі представлена інформаційна технологія предметно-орієнтованого аналізу природномовних текстів, яка може бути застосована за двома напрямками: вироблення рекомендацій резюме в умовах відсутності рекрутера, та інтенсифікації процесу відбору та ранжування резюме рекрутером, що дає можливість рекрутерам швидко та зручно ознайомлюватися з рекомендованими кандидатами та відфільтровувати їх. Представлена технологія є послідовністю застосування наступних етапів: “Сегментація”, “Парсинг”, “Сумаризація”, “Векторизація”. В результаті застосування цих етапів документ перетворюється на сукупність атрибутів, анотації та векторного подання, які зберігаються у векторній базі даних. Показано, що для оцінювання етапів технології “AI ResJobFit” необхідно обчислювати наступні показники: F1, Recall@N, , MRR, 𝑁𝐵𝑄 nDCG, RougeN. У четвертому розділі проводиться обґрунтування ефективності та систематизація розроблених методів для обробки природномовних текстів в сфері управління людськими ресурсами. Встановлено, що застосування безпосередньої інтеграції параметрів про стильові ознаки (без використання компʼютерного зору) дозволяє досягти покращення якості класифікації токенів в завданні сегментації резюме та вакансій, а також витягнення ключової інформації з них. Показано, що новий метод навчання з контекстно-орієнтованим вирівнюванням подань фраз призводить до значного покращення якості подань фраз. Емпірично визначено, що підхід “всі негативні пари” при тренуванні в умовах асиметричного датасету при використанні функції множинних негативних втрат при ранжуванні застосовувати недоцільно, бо він призводить до зниження метрик. Показано, що використання функції втрат на основі косинусної подібності призводить до значних покращень (на 14,2% за абсолютним показником NMI) у порівнянні з використанням функції втрат середньоквадратичної похибки при дистиляції векторних подань текстів з добре натренованої моделі-вчителя. Представлено новий і перший у своєму роді еталон для тестування українських текстових подань, який охоплює 5 різних доменів. Показана доцільність застосування процесу дистиляції задля пришвидшення моделей та встановлено обсяг даних, необхідний для дистиляції. У п’ятому розділі проведена оцінка ефективності запропонованої технології обробки природномовних текстів у сфері управління персоналом. Зокрема, проведено оцінювання інформаційної технології інтенсифікації процесу відбору та ранжування резюме рекрутером. Проведено оцінювання технології аналізу резюме та зіставлення з вимогами вакансій в умовах відсутності рекрутера. Досліджено вплив окремих етапів на швидкість та якість інформаційної технології обробки природномовних текстів. У висновках підсумовано виконані завдання дисертації, розкрито теоретичну та практичну цінність отриманих результатів, а також представлено інформацію щодо їх апробації та впровадження. Наукова новизна отриманих результатів полягає у розробці та вдосконаленні методів обробки резюме та вакансій, зокрема: – удосконалено модель подання токенів для візуального насичених документів, яка відрізняється від існуючих безпосередньою інтеграцією параметрів про стильові ознаки, що дозволяє підвищити якість подань токенів таких документів без використання методів комп’ютерного зору; – вперше запропоновано метод подання фраз у контексті, що базується на використанні спеціальних маркерів для виділення фраз, які моделюються, що дозволяє значно пришвидшити процес подання фраз за рахунок використання лише однієї моделі та покращити якість в порівнянні з базовими методами; – вперше запропоновано метод структурування документа для некерованого навчання подань текстів у сфері управління персоналом, що дозволяє адаптувати модель до домену та як наслідок підвищити якість сумаризації документів; – удосконалено метод зменшення обсягу тексту, що оброблятиметься моделлю, який відрізняється від існуючих урахуванням структури документа та ключових фраз, для подальшої сумаризації, що дозволяє підвищити якість сумаризації довгих документів; – вперше запропоновано модель векторизації документів у сфері управління людськими ресурсами на основі векторних подань секцій та механізму самоуваги разом із абсолютним позиційним кодуванням, що дозволяє покращити якість подань документів, довжина яких перевершує ліміт токенів, притаманний моделі. Практичне значення отриманих результатів: – адаптовано та вдосконалено технологію багатомовної дистиляції текстових подань Реймерса-Гуревич для текстів українською мовою, зокрема, запропоновано використання функції втрат на основі косинусної подібності, а також встановлена сильна негативна кореляція між “90-м перцентилем розподілу косинусних коефіцієнтів подібності” моделі-вчителя та “середнім показником NMI”, досягнутим в процесі дистиляції векторних подань моделлю-студентом, що дозволяє надати рекомендації щодо тренування моделей при крос-лінгвістичній дистиляції знань. Створений еталонний набір даних для оцінювання якості векторних подань текстів українською мовою та викладений в публічний доступ на Гітхабі. – Розроблено технологію для рекомендацій резюме в умовах відсутності рекрутера, яка була апробована в компанії Daxtra Technologies (Додаток Б – “Акт Впровадження технології використання штучних нейронних мереж для зіставлення вакансій та резюме”). Технологія базується на архітектурах типу “Трансформер” та поєднує етапи сегментації, парсингу та векторизації документів. – Розроблено технологію використання штучних нейронних мереж для інтенсифікації процесу відбору та ранжування резюме рекрутером, яка була апробована в компанії Daxtra Technologies (Додаток Б – “Акт Впровадження технології використання штучних нейронних мереж для зіставлення вакансій та резюме”). В технологічну схему введено етап “сумаризація” для підвищення ефективності зіставлення вакансій та резюме. – Розроблено алгоритм обробки природної мови, заснований на глибокому навчанні, для ефективної обробки візуально насичених документів, який був впроваджений в компанії Daxtra Technologies. – Некерований метод навчання для векторних подань назв посад був впроваджений в компанії Daxtra Technologies, створений еталонний набір даних та викладений в публічний доступ на Гітхабі. – Контекстно-освічений метод подання важливих фраз із застосуванням нової архітектури щодо представлення навичок кандидатів в домені управління персоналом був впроваджений в компанії Daxtra Technologies, та апробований в компанії Data Science UA (Додаток В – “Акт апробації архітектури моделі векторного представлення фраз у контексті для їх групування та нормалізації”). Створений еталонний набір даних та викладений в публічний доступ на Гітхабі. – Некерований метод навчання щодо тренування подань текстів у сфері управління персоналом був впроваджений в компанії Daxtra Technologies, створений еталонний набір даних та викладений в публічний доступ на Гітхабі. Результати роботи впроваджені в науково-дослідній роботі “Методи, моделі, інформаційні технології розподілених систем підтримки прийняття організаційних рішень” (ДР 0121U111663). В навчальному процесі кафедри (дисципліна “Методи обробки текстів природної мови” Математичного забезпечення компʼютерних систем використовується представлена у дисертаційній роботі архітектура контекстно-залежного подання фраз та алгоритм скорочення тексту з урахуванням структури документа та ключових фраз для сумаризації.