Research on Feature Extraction Technology of Medical Record Data Based on Big Data and NLP Natural Language Recognition

dc.contributor.authorWang Chunmeien
dc.contributor.authorВан Чуньмейuk
dc.date.accessioned2025-03-31T15:39:40Z
dc.date.available2025-03-31T15:39:40Z
dc.date.issued2024
dc.description.abstractThe topic of "Research on Feature Extraction Technology of Medical Record Data Based on Big Data and NLP Natural Language Recognition " is considered in the thesis. This article investigates a medical record data feature extraction technique based on big data and NLP natural language recognition. We propose a scheme to use Scispacy's English medical model to extract keywords from the original text medical records for the first time through NLP natural language recognition technology, and then use HPO standard words and OMIM disease words to extract keywords from the medical records for the second round through NLP natural language recognition technology. This article provides a detailed introduction to the processes of data preprocessing, model design, training, and validation, and discusses the results and future research directions. This experiment selected some long text electronic medical records and HPO medical records from the company's historical orders, and validated and compared the keywords selected from the long text with the HPO medical records. The experimental results showed that the algorithm can have good accuracy in data feature extraction and can assist medical tasks in feature extraction and classification of large text medical records.en
dc.description.abstractУ магістерській роботі розглядається тема «Дослідження технології вилучення ознак із даних медичних записів на основі великих даних та розпізнавання природної мови NLP». У роботі досліджується метод вилучення ознак із даних медичних записів на основі великих даних та розпізнавання природної мови NLP. Пропонується схема використання англійської медичної моделі Scispacy для отримання ключових слів з вихідних текстових медичних записів за допомогою технології розпізнавання природної мови NLP, а потім використання стандартних слів HPO та слів захворювань OMIM для вилучення ключових слів з медичних записів для другого раунду за допомогою технології розпізнавання природної мови NLP. У цій роботі дається докладне введення в процеси попередньої обробки даних, проектування моделі, навчання та перевірки, а також обговорюються результати та майбутні напрямки досліджень. Для проведення тестування було вибрано деякі довгі текстові електронні медичні записи та медичні записи HPO з історичних замовлень компанії, а також перевірено та порівняно ключові слова, вибрані з довгого тексту, з медичними записами HPO. Експериментальні результати показали, що алгоритм може мати хорошу точність при добуванні ознак даних і може допомогти в медичних завданнях вилучення ознак і класифікації великих текстових медичних записів.uk
dc.identifier.citationWang Chunmei Research on Feature Extraction Technology of Medical Record Data Based on Big Data and NLP Natural Language Recognition = Дослідження технології виділення функцій із даних медичних записів на основі великих даних і розпізнавання природної мови NLP: кваліфікаційна робота магістра / Wang Chunmei. – Одеса, 2024. – 69 с.en
dc.identifier.urihttps://dspace.onu.edu.ua/handle/123456789/40909
dc.language.isouk
dc.publisherОдеський національний університет імені І. І. Мечниковаuk
dc.subject126 інформаційні системи та технологіїuk
dc.subjectмагістрuk
dc.subjectFeature Extraction Technologyen
dc.subjectMedical Record Data Baseden
dc.subjectBig Dataen
dc.subjectNLP Natural Language Recognitionen
dc.titleResearch on Feature Extraction Technology of Medical Record Data Based on Big Data and NLP Natural Language Recognitionen
dc.title.alternativeДослідження технології виділення функцій із даних медичних записів на основі великих даних і розпізнавання природної мови NLPuk
dc.typeDiplomasen
Файли
Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Wang_Chunmei-Thesis.pdf
Розмір:
923.29 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed upon to submission
Опис: