首個種業(yè)大語言模型“豐登”問世
填補我國AI育種領(lǐng)域技術(shù)空白,助力從業(yè)者提升效率
本報訊 (記者 郜陽)昨天,上海人工智能實驗室聯(lián)合崖州灣國家實驗室和中國農(nóng)業(yè)大學(xué),發(fā)布首個種業(yè)大語言模型“豐登”。“豐登”的誕生,填補了我國在AI育種領(lǐng)域的技術(shù)空白,降低了育種領(lǐng)域的學(xué)習(xí)門檻,助力提升從業(yè)者的研究、實踐效率,同時也為AI助力生物育種提供了全新的探索路徑。
作為農(nóng)業(yè)的關(guān)鍵核心技術(shù)之一,科學(xué)高效的生物育種對于糧食安全及經(jīng)濟效益意義重大。然而,由于作物及畜類品種的多樣性,長期以來,育種信息缺乏統(tǒng)一平臺,數(shù)據(jù)知識呈現(xiàn)“孤島式”分布,為育種知識的普及帶來了壁壘。同時,由于生物育種涉及生物學(xué)、遺傳學(xué)、氣象學(xué)、土壤學(xué)等多學(xué)科交叉,專業(yè)人員在從事育種工作時不得不跨越眾多領(lǐng)域的文獻、數(shù)據(jù),甚至需要編寫代碼進行數(shù)據(jù)訪問,工作效率受到極大限制。
上海人工智能實驗室聯(lián)合團隊創(chuàng)新性地提出了大模型賦能生物育種的思路,在此前研發(fā)的大語言模型“書生·浦語2.0”的基礎(chǔ)上,科研人員通過注入科技文獻、產(chǎn)業(yè)實踐報告等海量專業(yè)數(shù)據(jù),訓(xùn)練出具備強大理解和分析能力的種業(yè)大模型。現(xiàn)在,“豐登”能通過自主學(xué)習(xí),發(fā)掘生物、遺傳、氣象及土壤間的復(fù)雜關(guān)聯(lián),形成新的知識結(jié)構(gòu),已經(jīng)具有品種選育、農(nóng)藝性狀、栽培技術(shù)和推廣區(qū)域等四大核心領(lǐng)域的解釋和回答能力。
“豐登”不僅能成為農(nóng)民生產(chǎn)流程中的智能助手,還可為專業(yè)院校提供教學(xué)輔助工具,助力培養(yǎng)農(nóng)業(yè)人才,更可為育種企業(yè)和科研院所提供智能化育種建議。未來,“豐登”還會在大語言模型的基礎(chǔ)上引入圖像分析、多組學(xué)分析和決策育種能力,針對育種工作場景,進一步提升使用效率。
記者了解到,聯(lián)合團隊還推出首個種業(yè)大語言模型評測基準(zhǔn),通過匯集育種專家整理的專業(yè)育種問題與最新評測技術(shù),提供客觀性能量化參考。目前,隆平高科、正大集團、中國科學(xué)院、中國農(nóng)業(yè)科學(xué)院、上海市農(nóng)業(yè)科學(xué)院、廣東省農(nóng)業(yè)科學(xué)院、華中農(nóng)業(yè)大學(xué)、華南農(nóng)業(yè)大學(xué)、復(fù)旦大學(xué)等機構(gòu)已加入“豐登”測試,大模型助力科學(xué)育種正在真實應(yīng)用場景下得到驗證并優(yōu)化。(新民晚報)