Використання машинного навчання для оптимізації доступу до даних в гібридному сховищі зображень
DOI:
https://doi.org/10.30837/bi.2023.1(99).02Ключові слова:
ГІБРИДНЕ СХОВИЩЕ ЗОБРАЖЕНЬ, ДОСТУП ДО ДАНИХ, МАШИННЕ НАВЧАННЯ, НЕЙРОННА МЕРЕЖА, ELASTICSEARCH, MONGO DB, PYTHONАнотація
Робота присвячена дослідженню можливостей інтеграції машинного навчання для оптимізації доступу до даних в гібридному сховищі зображень. Основна задача полягає у пошуку схожих зображень серед великої кількості візуальних даних, що зберігаються у гібридному сховищі. Було розроблено систему, яка використовує методи глибинного навчання для вилучення ознак зображень, зокрема модель ResNet50, яка забезпечує високу точність вилучення ознак завдяки своїй глибинній архітектурі. Для ефективного пошуку схожих зображень застосовувалися MongoDB для зберігання зображень та метаданих, а також ElasticSearch для швидкої індексації та пошуку за векторами ознак. Проведено експериментальні дослідження з використанням датасету зображень різних тварин для оцінки продуктивності запропонованого підходу. Результати дослідження показали, що обраний підхід забезпечує високу швидкість та точність пошуку схожих зображень, підтверджуючи доцільність використання гібридних сховищ з використанням методів машинного навчання для ефективного управління великими обсягами візуальних даних. Використання попередньо навчених моделей значно знижує витрати на обчислювальні ресурси та час, необхідний для навчання, забезпечуючи при цьому високу точність і ефективність результатів
Посилання
James, Blessing & Asagba, P. (2017). Hybrid Database System for Big Data Storage and Management. International Journal of Computer Science, Engineering and Applications. 7. 15-27. 10.5121/ijcsea.2017.7402.
Kyrychenko, I., Tereshchenko, G. Proniuk, G., Geseleva, N. “Predicate Clustering Method and its Application in the System of Artificial Intelligence”, 2023 7th International Conference on Computational Linguistics and Intelligent Systems (COLINS-2023), 2023. – CEUR-WS, 2023, ISSN 16130073. - Volume 3396, РР. 395 - 406.
Kyrychenko, I., Nazarov, O., Huliiev, N., Avdieiev, O. “Selection of Artificial Neural Networks for Disease Prediction”, 2023 7th International Conference on Computational Linguistics and Intelligent Systems (COLINS-2023), 2023. – CEUR-WS, 2023, ISSN 16130073. - Volume 3387, РР. 236-248.
Berahmand, Kamal & Daneshfar, Fatemeh & Salehi, Elaheh & Li, Yuefeng & Xu, Yue. (2024). Autoencoders and their applications in machine learning: a survey. Artificial Intelligence Review. 57. 10.1007/s10462-023-10662-6.
Tabian, I., Fu, H., & Khodaei, Z.S. (2019). A Convolutional Neural Network for Impact Detection and Characterization of Complex Composite Structures. Sensors, 19(22), 4933. DOI: 10.3390/s19224933.
Asokan, Anju & Jude, Anitha & Patrut, Bogdan & Danciulescu, Dana & D, Jude. (2020). Deep Feature Extraction and Feature Fusion for Bi-temporal Satellite Image Classification. Computers, Materials & Continua. 66. 373-388. 10.32604/cmc.2020.012364.
He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 770-778. doi:10.1109/CVPR.2016.90.
Meghana, Avuthu Sai. "Age and Gender prediction using Convolution, ResNet50 and Inception ResNetV2." International Journal of Advanced Trends in Computer Science and Engineering 9, no. 2 (April 25, 2020): 1328–34. http://dx.doi.org/10.30534/ijatcse/2020/65922020.
Understanding Cosine Similarity and Cosine Distance in Depth. URL: https://pub.aimind.so/understanding-cosine-similarity-and-cosine-distance-in-depth-cc91eac3ef2 (дата звернення: 29.04.2024).
Matallah, Houcine & Belalem, Ghalem & Bouamrane, K.. (2020). Evaluation of NoSQL Databases: MongoDB, Cassandra, HBase, Redis, Couchbase, OrientDB. International Journal of Software Science and Computational Intelligence. 12. 71-91. 10.4018/IJSSCI.2020100105.
Znakhur, Serhii & Znakhur, Liudmyla. (2022). Similar goods search based on FAISS. Bulletin of Kharkov National Automobile and Highway University. 40. 10.30977/BUL.2219-5548.2022.96.0.40.
Wong, Wai-Tak. (2019). Advanced Elasticsearch 7.0: A practical guide to designing, indexing, and querying advanced distributed search engines.
Russakovsky, O., Deng, J., Su, H., Krause, J., Satheesh, S., Ma, S., Huang, Z., Karpathy, A., Khosla, A., Bernstein, M., Berg, A. C., & Fei-Fei, L. (2015). ImageNet Large Scale Visual Recognition Challenge. International Journal of Computer Vision, 115(3), 211-252. doi:10.1007/s11263-015-0816-y.
Keras Applications: ResNet. URL: https://keras.io/api/applications/resnet/ (дата звернення: 20.04.2024).
Nelli, Fabio. (2018). The NumPy Library: With Pandas, NumPy, and Matplotlib. 10.1007/978-1-4842-3913-1_3.
Animal Image Dataset (90 Different Animals) on Kaggle. URL: https://www.kaggle.com/datasets/iamsouravbanerjee/animal-image-dataset-90-different-animals (дата звернення: 04.05.2024).