深度學習模型已經成為現代基于計算機視覺的農業任務的標準。現在,通過深度學習實現自動化的常見標準任務包括水果檢測、作物和雜草分割以及植物疾病分類和預測。深度學習模型通常情況下最初并非應用于場景復雜的農業,因此數據集的模型權重會針對農業任務進行微調。缺乏針對農業的微調可能會增加培訓時間和資源使用,并降低模型性能,從而導致數據效率的總體下降。
2023年8月,Plant Phenomics在線發表了加州大學戴維斯分校等單位題為Standardizing and Centralizing Datasets for Efficient Training of Agricultural Deep Learning Models 的研究論文。
為了克服這一限制,我們將數據集限制為三個任務:圖像分類,語義分割和目標檢測。此外,我們專注于只有單個3通道RGB圖像輸入的數據集,以便于使用標準深度學習模型為各種數據集創建基準,而無需進行任何架構修改,從而可以更輕松地訪問更廣泛的未來應用。然后,我們使用深度學習任務中常用的方法進行了許多實驗,但這些方法在農業領域的特定應用中尚未被探索。我們的實驗指導我們開發了許多改進數據的方法訓練農業深度學習模型時的效率,無需對現有管道進行大規模修改。
圖1 從本研究中使用的語義分割數據集的樣本圖像,分別為甜菜草、蘿卜草和蘋果花三種植物的圖像。包含帶有注釋分割掩碼的原始圖像。每個圖像來源的數據集在它上面進行了注釋。這些圖像以其原始的高寬比顯示。
圖2 一個來自加州葡萄檢測的例子圖像與本研究中使用的每一個增強應用于它。原始圖像沒有調整大小,而增強圖像大小調整了(為了實際的訓練)
本研究所構建的標準管道使深度學習模型能夠在本研究所采集和整理的數據集上獲得與現有基準相當的性能,在某些情況下甚至超過它們。這些數據集以及達到這些基準的預訓練模型可以通過開源框架AgML獲得,從而可以進一步研究開發更高效的數據和模型管道。下圖(圖3)總結了農業預訓練權重的實驗結果,每個結果代表7個單類模型,完整代表一個7類模型。對于所有的7類模型,預訓練的農業模型顯著優于COCO和NONE基線。
圖3比較來自全球水果檢測數據集的7個不同個體水果的mAP@0.5值,以及完整的數據集
本研究結果表明,即使是很小的訓練修改,如使用農業預訓練模型權值,或在數據處理管道中采用特定的空間增強,也可以顯著提高模型性能,縮短收斂時間,節省訓練資源。此外,本研究發現即使是在低質量注釋上訓練的模型也能產生與高質量注釋相當的性能水平,這表明具有低質量注釋的數據集仍然可以用于訓練,擴大當前可用數據集的池。本研究所提出的方法廣泛適用于整個農業深度學習,并呈現出顯著提高數據效率的巨大潛力。
本文的主要作者為Amogh Joshi博士和Dario Guevara博士,所屬單位加州大學戴維斯分校和下一代食品系統人工智能研究所。該項目部分得到了美國農業部人工智能下一代食品系統研究所(AIFS)的支持,美國農業部的獎項編號為2020-67021-32855。該項目主要由加州大學戴維斯分校葡萄栽培與釀酒學系和加州大學生物與農業工程學協完成,實驗數據為AgML收集的公共數據。
論文鏈接:
https://doi.org/10.34133/plantphenomics.0084
——推薦閱讀——
Enhancing green fraction estimation in rice and wheat crops: a self-supervised deep learning semantic segmentation approach
https://doi.org/10.34133/plantphenomics.0064
Plant Phenomics | 虛擬圖像“以假亂真”,無需人工標注,自監督創建小麥表型算法
Analyzing Nitrogen Effects on Rice Panicle Development by Panicle Detection and Time-Series Tracking
https://doi.org/10.34133/plantphenomics.0048
Plant Phenomics | 南京農業大學基于目標檢測與追蹤算法在提取水稻抽穗開花期表型上的應用
加入作者交流群
掃碼添加小編微信,拉您進入《植物表型組學》作者交流群,群內不定期開展作者分享會、專刊發布會等高質量活動。
添加小編微信,備注姓名+單位+PP,加入作者交流群
About Plant Phenomics
《植物表型組學》(Plant Phenomics)是由南京農業大學和美國科學促進會(AAAS)合作創辦的英文學術期刊,于2019年1月正式上線發行。采用開放獲取形式,刊載植物表型組學交叉學科熱點領域具有突破性科研進展的原創性研究論文、綜述、數據集和觀點。具體范圍涵蓋高通量表型分析的最新技術,基于圖像分析和機器學習的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農業實踐中的表型組學新應用,與植物表型相結合的分子生物學、植物生理學、統計學、作物模型和其他組學研究,表型組學相關的植物生物學等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等數據庫收錄。科睿唯安JCR2022影響因子為6.5,位于農藝學、植物科學、遙感一區。中科院農藝學、植物科學一區,遙感二區,生物大類一區(TOP期刊)。2020年入選中國科技期刊卓越行動計劃高起點新刊項目。
說明:本文由《植物表型組學》編輯部負責組稿。
中文內容僅供參考,一切內容以英文原版為準。
撰稿:吳庚宸(南京農業大學)
排版:張婕(上海交通大學)
審核:孔敏、王平