Мультимодальна технологія пошуку та кластеризації слабоструктурованих текстово-графічних документів.

Автор(и)

DOI:

https://doi.org/10.30837/bi.2024.2(101).01

Ключові слова:

ТЕКСТОВО-ГРАФІЧНІ ДОКУМЕНТИ, МУЛЬТИМОДАЛЬНА СИСТЕМА, КЛАСТЕРИЗАЦІЯ, АЛГОРИТМ SOINN, ПОРІВНЯННЯ ТЕКСТОВО-ГРАФІЧНИХ ФРАГМЕНТІВ, АНОТАЦІЯ ЗОБРАЖЕНЬ

Анотація

Досліджено проблему пошуку та кластеризації слабоструктурованих текстово-графічних документів (ТГД) з використанням нейромережевих технологій. Запропоновано підхід до побудови мультимодальної системи пошуку та аналізу ТГД, що передбачає використання гібридного крітерія порівняння текстових та графічних фрагментів в аналізованих документах. Розглянуто процедуру поєднання процесів пошуку текстово-графічних фрагментів електронних документів за характеристиками зображення та текстовими підписами (ключовими словами). Запропоновано метод кластеризації та індексації ТГД за результатами аналізу іх текстової частини, заснований на застосуванні алгоритму SOINN, лінгвістичних дескрипторів та модульної системи обробки файлових масивів.  Метод дозволяє формувати динамічну структуру кластерів ТГД зі створенням єдиних індексів. Наведено результати тестування і рекомендації щодо використання нейромережевих моделей для практичної реалізації запропонованого підходу до пошуку та кластеризації ТГД.

Біографія автора

С.Г. Удовенко, ХНЕУ ім. С. Кузнеця, м. Харків, Україна

ХНЕУ ім. С. Кузнеця, м. Харків, Україна

Посилання

A Guide on Word Embeddings in NLP. URL: https://www.turing.com/kb/guide-on-word-embeddings-in-nlp (last accessed: 15.05.2024).

Kumar J., Ye P., Doermann D. Structural Similarity for Document Image Classification and Retrieval. Pattern Recognition Letters, 2014, vol 43, pp. 119-126. DOI: 10.1016/j.patrec.2013.10.030

Удовенко С.Г. Метод порівняння текстово-графічних фрагментів в електронних документах за гібриднимкритерієм / С.Г. Удовенко, Л.Е. Чала, Є.С. Кушвід // Біоніка интелекту. – 2019. – Вып. 1 (92). – С. 71-76.

Text Normalization for Natural Language Processing (NLP) [Електронний ресурс]. – 2021. – Режим доступу:

https://towardsdatascience.com/text-normalization-for-natural-language-processing-nlp-70a314bfa646

Удовенко С. Мультимодальна система порівняння текстово-графічних фрагментів в електронних документах / С. Удовенко, Л. Чала, Є. Кушвід // Матеріали Міжнародної наукової конференції «Інтелектуальні системи прийняття рішень і проблеми обчислювального інтелекту (ISDMCI’2019)». – Залізний Порт, 2019 – С. 184-186.

Veena R, Ramesh D., Automatic text summarization – A systematic literature review, World Journal of Advanced Engineering Technology and Sciences, 2023, 08(02), pp. 126–129. DOI: https://doi.org/10.30574/wjaets.2023.8.2.0080

B. Kumar, B. Sathya, P. Anima. Automatic Keyword Extraction for Text Summarization in Multi-document Articles (2017). European Journal of Advances in Engineering and Technology, Vol. 4 (6), Р. 410 – 427.

Wiwatcharakoses C., Berrar D. (2021) A self-organizing incremental neural network for continual supervised learning. Expert Systems with Applications. Volume 185, 115662. https://doi.org/10.1016/j.eswa.2021.115662

Wiwatcharakoses C. , Berrar D. (2020) SOINN+, a Self-Organizing Incremental Neural Network for Unsupervised Learning from Noisy Data Streams. Expert Systems with Applications. Volume 143, 113069. https://doi.org/10.1016/j.eswa.2019.113069.

Nguyen N,·Coustaty М., Ogier J. (2020). An adaptive document recognition system for latrines. International Journal on Document Analysis and Recognition (IJDAR) (2020) 23:115–128 https://doi.org/10.1007/s10032-019-00346-9

Лізунов, П. П. Автоматичний аналіз подібностей схем та діаграм в електронних текстових документах / П. П. Лізунов, А. О. Білощицький, Л. Е. Чала, С.В. Білощицька, О. Ю. Кучанський, С. Г. Удовенко // Управління розвитком складних систем. – 2017. – № 28. – C. 147 – 1568. Кузнецов О.В.

Liu Z., Lin Y., Cao Y., Hu H., Wei Y., Zhang Z., Lin S., Guo B. Swin. Transformer: Hierarchical Vision Transformer using Shifted Windows. 2021 IEEE/CVF International Conference on Computer Vision (ICCV). 2021. P. 9992-10002. DOI: doi.org/10.1109/ICCV48922.2021.00986

Chen C., Fan Q., Panda R. CrossViT: Cross-Attention Multi-Scale Vision Transformer for Image Classification. ICCV. 2021. P.1-10. DOI: doi.org/10.1109/ICCV48922.2021.00041

Misra R. News Category Dataset (2018). URL: https://www.kaggle.com/rmisra/news-category-dataset (last accessed: 15.05.2024).

##submission.downloads##

Опубліковано

2024-12-30