Інформаційна технологія класифікації текстів для виявлення ознак ПТСР на основі технологій глибинного навчання та NLP
DOI:
https://doi.org/10.30837/bi.2026.1(104).06Ключові слова:
ПОСТТРАВМАТИЧНИЙ СТРЕСОВИЙ РОЗЛАД, ГЛИБИННЕ НАВЧАННЯ, ОБРОБКА ПРИРОДНОЇ МОВИ, МАШИННИЙ ПЕРЕКЛАД, КЛАСИФІКАЦІЯ ТЕКСТІВ, ТРАНСФОРМЕРНІ АРХІТЕКТУРИ, МУЛЬТИМОВНІ МОДЕЛІАнотація
Стаття присвячена дослідженню ефективності сучасних архітектур обробки природної мови у завданні автоматизованого виявлення ознак посттравматичного стресового розладу (ПТСР) за текстовими даними. В основі роботи лежить порівняльний аналіз моделі distilbert-base-uncased для оригінальних англомовних текстів та xlm-roberta-base для даних, адаптованих українською мовою за допомогою машинного перекладу через API Google Translate. Для проведення експериментів сформовано репрезентативний набір даних обсягом 4822 записи, що включає тексти з верифікованими ознаками ПТСР, контрольні тексти інших психологічних діагнозів та нейтральний контент, що дозволило оцінити здатність моделей до диференціальної діагностики. Експериментальні результати продемонстрували високу ефективність класифікації: англомовна модель досягла точності 0.90 при F1-score 0.88–0.91, тоді як україномовна версія показала результат 0.85 Accuracy, зберігши при цьому високий рівень повноти (Recall) значенням 0.88 для цільового класу. Доведено, що незважаючи на незначну втрату точності, зумовлену морфологічною складністю української мови та похибками автоматичного перекладу, використання мультимовних трансформерів є життєздатним підходом для створення систем попереднього скринінгу психічного стану в українському цифровому середовищі.
Посилання
Sawalha J., Yousefnezhad M., Shah Z. et al. Detecting Presence of PTSD Using Sentiment Analysis From Text Data // Frontiers in Psychiatry. - 2022. - Vol. 12. - Art. 811392. - DOI: https://doi.org/10.3389/fpsyt.2021.811392 (дата звернення: 05.01.2026).
Blekic W., D’Hondt F., Shalev A. Y., Schultebraucks K. A systematic review of machine learning findings in PTSD and their relationships with theoretical models // Nature Mental Health. - 2025. - Vol. 3. - P. 139-158. - DOI: https://doi.org/10.1038/s44220-024-00351-4 (дата звернення: 07.01.2026).
Yuan Y., Liu Z., Miao W., Tian X. Automatic screening for posttraumatic stress disorder in early adolescents following the Ya’an earthquake using text mining techniques // Frontiers in Psychiatry. - 2024. - Vol. 15. - Art. 1439720. - DOI: https://doi.org/10.3389/fpsyt.2024.1439720 (дата звернення: 10.01.2026).
Srinivasan M., Bhatia A. Using NLP to Detect Mental Health Disorders Through Patient Narratives // ResearchGate. - 2024. - Режим доступу: https://www.researchgate.net/publication/380123456 (дата звернення: 11.01.2026).
Шевчук А. В., Яновець А. І., Стернічук В. Б. Нейромережеві моделі у перекладі німецькомовних і англомовних текстів // Академічні студії. Серія «Гуманітарні науки». - 2025. - № 3. - С. 12-18. - DOI: https://doi.org/10.52726/as.humanities/2025.3.12 (дата звернення: 13.01.2026).
Ольховська А., Андрущенко Ю. Експериментальне дослідження впливу машинного перекладу на якість перекладу // Вісник Харківського національного університету імені В. Н. Каразіна. Серія «Іноземна філологія». - 2024. - № 99. - С. 76-84. - Режим доступу: https://periodicals.karazin.ua/foreignphilology/article/view/23867 (дата звернення: 18.01.2026).
Wu Y., Chen J., Mao K., Zhang Y. Automatic Post-Traumatic Stress Disorder Diagnosis via Clinical Transcripts: A Novel Text Augmentation with Large Language Models // IEEE BIBM. - 2023. - P. 1957-1962. - DOI: https://doi.org/10.1109/BIBM59613.2023.10385704 (дата звернення: 16.01.2026).
Chen F., Ben-Zeev D., Sparks G. et al. Detecting PTSD in Clinical Interviews: A Comparative Analysis of NLP Methods and Large Language Models // arXiv preprint. - 2025. - arXiv:2504.01216. - Режим доступу: https://arxiv.org/abs/2504.01216 (дата звернення: 18.01.2026).
Sharma C., Vaid A., Sharma K. Natural Language Processing in SAP: Enhancing User Interactions and Data Analysis through NLP // IJCSET. - 2024. - Vol. 2. - P. 58-76 - ISSN: 3048-5355 (дата звернення: 19.01.2026).
Журко Д., Білоус І. Використання моделей вкладання слів в обробці природної мови // Технічні науки та технології. - 2025. - № 1 (39). - С. 151-160. - DOI: https://doi.org/10.25140/2411-5363-2025-1(39)-151-160 (дата звернення: 20.01.2026).
Gardazi N. M., Daud A., Malik M. K. et al. BERT applications in natural language processing: a review // Artificial Intelligence Review. - 2025. - Vol. 58, No. 166. - DOI: https://doi.org/10.1007/s10462-025-11162-5 (дата звернення: 21.01.2026).
Черняк І. О. Дослідження можливостей моделі DistilBERT для подальшого використання в системі автоматизації електронного документообігу // Вчені записки ТНУ імені В. І. Вернадського. Серія: Технічні науки. - 2024. - Т. 35 (74), № 5. - УДК 004.01. - DOI: https://doi.org/10.32782/2663-5941/2024.5.1/47 (дата звернення: 28.01.2026).
He Q., Veldkamp B. P., Glas C. A. W., de Vries J. Automated Professional Diagnosis of Posttraumatic Stress Disorder Using Text Mining Techniques // Journal of Psychopathology and Behavioral Assessment. - 2012. - Vol. 34. - 40-47 P. - DOI: https://doi.org/10.1007/s10862-011-9259-3 (дата звернення: 24.01.2026).
He Q., de Vries J., Veldkamp B. P. et al. Text Mining for Posttraumatic Stress Disorder Risk Detection // In: Healthcare Data Analytics. - 2015. - P. 349-362. - DOI: https://doi.org/10.1201/b18597-17 (дата звернення: 25.01.2026).
Miranda J., Kim Y., Shing H.-C. et al. Real-time extraction of RDoC criteria from clinical notes of PTSD patients using NLP // Scientific Reports. - 2024. - Vol. 14. - Art. 12543. - DOI: https://doi.org/10.1038/s41598-024-63124-y (дата звернення: 26.01.2026).
Lorenzoni G., Silva D., Santos R. et al. Depression and PTSD detection: an assessment of machine learning and NLP techniques // Journal of Medical Systems. - 2025. - Vol. 49. - Art. 102. - DOI: https://doi.org/10.1007/s10916-024-02102-w (дата звернення: 28.01.2026).