人民網(wǎng)北京9月19日電 (記者趙竹青)記者從中國科學(xué)院獲悉,9月19日,中國科學(xué)院地理科學(xué)與資源研究所聯(lián)合中國科學(xué)院青藏高原研究所、中國科學(xué)院自動化研究所等單位研發(fā)的多模態(tài)地理科學(xué)大模型“坤元”(Sigma Geography)正式發(fā)布。
據(jù)介紹,該大模型是專注于地理科學(xué)的專業(yè)語言大模型,具備處理地理科學(xué)相關(guān)問題的專業(yè)能力,研發(fā)團隊完成了地理學(xué)全譜系高質(zhì)量語料庫構(gòu)建、地理科學(xué)語言大模型構(gòu)建、地理科學(xué)研究智導(dǎo)平臺研發(fā)等工作,讓“坤元”具備“懂地理”“精配圖”“知人心”“智生圖”等特點,實現(xiàn)了地理專業(yè)問題解答、地理學(xué)文獻智能分析、地理數(shù)據(jù)資源查詢、地理數(shù)據(jù)挖掘分析、專題地圖繪制等功能。
研發(fā)團隊建立了涵蓋4大類、16小類的地理全學(xué)科語料庫,提供320億詞元供大模型自監(jiān)督學(xué)習(xí),并制作了4萬余條高質(zhì)量地理學(xué)指令進行模型微調(diào)。相比通用語言大模型,“坤元”更熟悉地理學(xué)的語言模式、專業(yè)術(shù)語和領(lǐng)域知識,在地理學(xué)基準(zhǔn)測試集上的準(zhǔn)確性提升了31.3%。
“坤元”旨在拓寬普通大眾的地理視野,解放地理從業(yè)者的雙手,推動地理智能發(fā)展、賦能地理科學(xué)研究、加速重大地理科學(xué)發(fā)現(xiàn)。未來,研發(fā)團隊將推進地圖大模型及地理推理機研發(fā),有望讓地理科學(xué)語言大模型讀懂地圖;將打造地理科研協(xié)作大平臺,以期讓每個科學(xué)家和科研團隊都可以擁有專屬的地理大模型,能夠與數(shù)百萬科學(xué)家通過共享數(shù)據(jù)、模型、研究思路等方式協(xié)同工作。