Эффективный алгоритм обучения моделей для классификации болезней растений

Дополнительно

Прислана: 11.12.2024; Принята: 04.02.2025; Опубликовано 12.02.2025;
Просмотры: 891; Загружено: 366

Как цитировать

А. В. Ужинский. "Efficient pipeline for plant disease classification" Natural Sci. Rev. 2 100201 (2025)
https://doi.org/10.54546/NaturalSciRev.100201
А. В. Ужинский1,a
  • 1Объединенный институт ядерных исследований, г. Дубна, Россия
  • aauzhinskiy@jinr.ru
DOI: 10.54546/NaturalSciRev.100201
Ключевые слова: классификация болезней растений , глубокое обучение, similarity learning, Large Margin Cosine Loss, Triplet Loss, ConvNext, MobileNet
Категории: Математические и компьютерные науки , Информационные технологии , Прикладные исследования
PDF (Английский)
HTML (Английский)

Аннотация

Точная диагностика заболеваний и выбор корректной стратегии лечения позволяют не только сохранить, но и увеличить урожай. Современные методы глубокого обучения зарекомендовали себя как эффективное решение данной проблемы. Однако ограниченные объемы доступных данных и схожесть симптомов различных заболеваний снижают эффективность традиционных подходов, таких как перенос обучения. В данном исследовании использовался уникальный набор данных проекта DoctorP, включающий 46 классов заболеваний и 2615 изображений. DoctorP — это многофункциональная платформа для диагностики болезней растений, ориентированная как на сельскохозяйственные, так и на декоративные культуры. Платформа предоставляет различные интерфейсы, включая мобильные приложения для iOS и Android, Telegram-бота и API для интеграции с внешними сервисами. Пользователи системы отправляют фотографии больных растений, получая прогноз по заболеванию и рекомендации по лечению. DoctorP поддерживает широкий спектр моделей для классификации болезней растений. Ранее для создания моделей применялись MobileNet_v2 и функция минимизации потерь Triplet Loss. Однако значительное увеличение количества классов заболеваний потребовало проведения новых экспериментов с архитектурами и методами обучения. В текущем исследовании предлагается более эффективное решение, основанное на архитектуре ConvNeXt и функции минимизации потерь Large Margin Cosine Loss, для классификации 46 классов заболеваний растений в условиях ограниченного объема данных. Количество изображений в каждом классе варьируется от 30 до 130. Предложенная архитектура позволяет достигать точности в 88,35% и F1-score 0,9, что значительно превосходит как классические решения на базе переноса обучения, так и предыдущий подход на основе Triplet Loss. Улучшенный алгоритм обучения моделей уже внедрен в платформу DoctorP, значительно повышая точность и надежность диагностики заболеваний растений.

Библиографические ссылки

[1] R. Ramanjot, U. Mittal, A. Wadhawan, J. Singla, N. Z. Jhanjhi, R. M. Ghoniem, S. K. Ray, A. Ab-delmaboud, Plant disease detection and classification: A systematic literature review, Sensors 23(2023) 4769. doi:https://doi.org/10.3390/s23104769.
[2] S. Muhammad, S. Babar, E. Shaker, A. Akhtar, U. Asad, A. Fayadh, G. Tsanko, H. Tariq, A. Far-man, An advanced deep learning models-based plant disease detection: A review of recent research,Frontiers in Plant Science 14 (2023). doi:https://doi.org/10.3389/fpls.2023.1158933.
[3] J. V. A. Porto, A. C. Dorsa, V. A. M. Weber, K. R. A. Porto, H. Pistori, Usage of few-shotlearning and meta-learning in agriculture: A literature review, Smart Agricultural Technology 5(2023) 100307. doi:https://doi.org/10.1016/j.atech.2023.100307.
[4] M. Dyrmann, H. Karstoft, H. S. Midtiby, Plant species classification using deep convolutionalneural networks, Biosystems Engineering 151 (2016) 72–80. doi:https://doi.org/10.1016/j.biosystemseng.2016.08.002.
[5] A. K. Abasi, S. N. Makhadmeh, O. A. Alomari, M. Tubishat, H. J. Mohammed, Enhancing riceleaf disease classification: A customized convolutional neural network approach, Sustainability 15(2023) 15039. doi:https://doi.org/10.3390/su152015039.
[6] K. P. Ferentinos, Deep learning models for plant disease detection and diagnosis, Computers andElectronics in Agriculture 145 (2018) 311–318. doi:https://doi.org/10.1016/j.compag.2018.01.009.
[7] A. Picon, M. Seitz, A. Alvarez-Gila, P. Mohnke, A. Ortiz-Barredo, J. Echazarra, Crop conditionalconvolutional neural networks for massive multi-crop plant disease classification over cell phoneacquired images taken on real field conditions, Computers and Electronics in Agriculture 167(2019) 105093. doi:https://doi.org/10.1016/j.compag.2019.105093.
[8] F. Adnan, M. J. Awan, A. Mahmoud, H. Nobanee, A. Yasin, A. M. Zain, EfficientNetB3-adaptiveaugmented deep learning (AADL) for multi-class plant disease classification, IEEE Access 11(2023) 85426–85440. doi:https://doi.org/10.1109/ACCESS.2023.3303131.
[9] D. P. Hughes, M. Salathe, An open access repository of images on plant health to enable thedevelopment of mobile disease diagnostics, arXiv (2015). arXiv:1511.08060, doi:https://arxiv.org/abs/1511.08060.
[10] Y. Lu, X. Tao, N. Zeng, J. Du, R. Shang, Enhanced CNN classification capability for small ricedisease datasets using progressive WGAN-GP: Algorithms and applications, Remote Sensing 15(2023) 1789. doi:https://doi.org/10.3390/rs15071789.
[11] Y. Wang, Y. Yin, Y. Li, T. Qu, Z. Guo, M. Peng, S. Jia, Q. Wang, W. Zhang, F. Li, Classificationof plant leaf disease recognition based on self-supervised learning, Agronomy 14 (2024) 500. doi:https://doi.org/10.3390/agronomy14030500.
[12] J. Deng, W. Dong, R. Socher, L. J. Li, K. Li, L. Fei-Fei, ImageNet: A large-scale hierarchical imagedatabase, in: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,Miami, FL, USA, 2009, pp. 248–255. doi:https://doi.org/10.1109/CVPR.2009.5206848.
[13] G. Koch, R. Zemel, R. Salakhutdinov, Siamese neural networks for one-shot image recognition,in: Proceedings of the ICML Deep Learning Workshop, Lille, France, 2015, pp. 1–8.
[14] D. Arg ̈ueso, A. Picon, U. Irusta, A. Medela, M. G. San-Emeterio, A. Bereciartua, A. Alvarez-Gila, Few-shot learning approach for plant disease classification using images taken in the field,Computers and Electronics in Agriculture 175 (2020) 105542. doi:https://doi.org/10.1016/j.compag.2020.105542.
[15] S. Chopra, R. Hadsell, Y. LeCun, Learning a similarity metric discriminatively, with applicationto face verification, in: Proceedings of the IEEE Conference on Computer Vision and PatternRecognition, San Diego, CA, USA, 2005, pp. 539–546. doi:https://doi.org/10.1109/CVPR.2005.202.
[16] F. Schroff, D. Kalenichenko, J. Philbin, FaceNet: A unified embedding for face recognition andclustering, in: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,Boston, MA, USA, 2015, pp. 815–823. doi:https://doi.org/10.1109/CVPR.2015.7298682.
[17] I. Egusquiza, A. Picon, U. Irusta, A. Bereciartua-Perez, T. Eggers, C. Klukas, E. Aramendi,R. Navarra-Mestre, Analysis of few-shot techniques for fungal plant disease classification andevaluation of clustering capabilities over real datasets, Frontiers in Plant Science 13 (2022) 813237.doi:https://doi.org/10.3389/fpls.2022.813237.
[18] A. Uzhinskiy, G. Ososkov, P. Goncharov, A. Nechaevskiy, A. Smetanin, One-shot learning withtriplet loss for vegetation classification tasks, Computer Optics 45 (2021) 608–614.
[19] M. Sandler, A. Howard, Z. Zhu, A. Zhmoginov, L.-C. Chen, MobileNetV2: Inverted residuals andlinear bottlenecks, arXiv (2018). doi:https://arxiv.org/abs/1801.04381.
[20] W. Liu, Y. Wen, Z. Yu, M. Li, S. Raj, L. Song, SphereFace: Deep hypersphere embedding forface recognition, arXiv (2017). doi:https://arxiv.org/abs/1704.08063.
[21] J. Deng, J. Guo, J. Yang, N. Xue, I. Kotsia, S. Zafeiriou, ArcFace: Additive angular margin loss A. UzhinskiyNatural Sci. Rev.2100201 (2025)for deep face recognition, arXiv (2018). doi:https://arxiv.org/abs/1801.07698.
[22] Q. Dai, Y. Guo, Z. Li, S. Song, S. Lyu, D. Sun, Y. Wang, Z. Chen, Citrus disease image generationand classification based on improved FastGAN and EfficientNet-B5, Agronomy 13 (2023) 988. doi:https://doi.org/10.3390/agronomy13040988.
[23] M. Tan, Q. V. Le, EfficientNet: Rethinking model scaling for convolutional neural networks, arXiv(2019). doi:https://arxiv.org/abs/1905.11946.
[24] H. Wang, Y. Wang, Z. Zhou, X. Ji, D. Gong, J. Zhou, Z. Li, W. Liu, CosFace: Large MarginCosine Loss for deep face recognition, arXiv (2018). doi:https://arxiv.org/abs/1801.09414.
[25] Z. Liu, H. Mao, C.-Y. Wu, C. Feichtenhofer, T. Darrell, S. Xie, A ConvNet for the 2020s, arXiv(2022). doi:https://arxiv.org/abs/2201.03545.
[26] G. Ososkov, A. Nechaevskiy, A. Uzhinskiy, P. Goncharov, Architecture and basic principles ofthe multifunctional platform for plant disease detection, in: CEUR Workshop Proceedings, GRID2018 — Selected Papers of the 8th International Conference “Distributed Computing and Grid-Technologies in Science and Education”, 2018, pp. 200–206.
[27] M. Zuev, Y. Butenko, M. ́Cosi ́c, A. Nechaevskiy, D. Podgainy, I. Rahmonov, A. Stadnik, O. Strel-tsova, ML/DL/HPC ecosystem of the HybriLIT heterogeneous platform (MLIT JINR): New op-portunities for applied research, in: Proceedings of the 6th International Workshop on DeepLearning in Computational Physics (DLCP2022), 2022.
[28] L. J. P. Maaten, G. E. Hinton, Visualizing high-dimensional data using t-SNE, Journal of MachineLearning Research 9 (2008) 2579–2605.