Research on Feature Extraction Technology of Medical Record Data Based on Big Data and NLP Natural Language Recognition

Вантажиться...
Ескіз
Дата
2024
Науковий керівник
Укладач
Редактор
Назва журналу
ISSN
E-ISSN
Назва тому
Видавець
Одеський національний університет імені І. І. Мечникова
Анотація
The topic of "Research on Feature Extraction Technology of Medical Record Data Based on Big Data and NLP Natural Language Recognition " is considered in the thesis. This article investigates a medical record data feature extraction technique based on big data and NLP natural language recognition. We propose a scheme to use Scispacy's English medical model to extract keywords from the original text medical records for the first time through NLP natural language recognition technology, and then use HPO standard words and OMIM disease words to extract keywords from the medical records for the second round through NLP natural language recognition technology. This article provides a detailed introduction to the processes of data preprocessing, model design, training, and validation, and discusses the results and future research directions. This experiment selected some long text electronic medical records and HPO medical records from the company's historical orders, and validated and compared the keywords selected from the long text with the HPO medical records. The experimental results showed that the algorithm can have good accuracy in data feature extraction and can assist medical tasks in feature extraction and classification of large text medical records.
У магістерській роботі розглядається тема «Дослідження технології вилучення ознак із даних медичних записів на основі великих даних та розпізнавання природної мови NLP». У роботі досліджується метод вилучення ознак із даних медичних записів на основі великих даних та розпізнавання природної мови NLP. Пропонується схема використання англійської медичної моделі Scispacy для отримання ключових слів з вихідних текстових медичних записів за допомогою технології розпізнавання природної мови NLP, а потім використання стандартних слів HPO та слів захворювань OMIM для вилучення ключових слів з медичних записів для другого раунду за допомогою технології розпізнавання природної мови NLP. У цій роботі дається докладне введення в процеси попередньої обробки даних, проектування моделі, навчання та перевірки, а також обговорюються результати та майбутні напрямки досліджень. Для проведення тестування було вибрано деякі довгі текстові електронні медичні записи та медичні записи HPO з історичних замовлень компанії, а також перевірено та порівняно ключові слова, вибрані з довгого тексту, з медичними записами HPO. Експериментальні результати показали, що алгоритм може мати хорошу точність при добуванні ознак даних і може допомогти в медичних завданнях вилучення ознак і класифікації великих текстових медичних записів.
Опис
Ключові слова
126 інформаційні системи та технології, магістр, Feature Extraction Technology, Medical Record Data Based, Big Data, NLP Natural Language Recognition
Бібліографічний опис
Wang Chunmei Research on Feature Extraction Technology of Medical Record Data Based on Big Data and NLP Natural Language Recognition = Дослідження технології виділення функцій із даних медичних записів на основі великих даних і розпізнавання природної мови NLP: кваліфікаційна робота магістра / Wang Chunmei. – Одеса, 2024. – 69 с.
DOI
ORCID:
УДК