近日,我國首部針對生成式人工智能產業(yè)的規(guī)范性政策—《生成式人工智能服務管理暫行辦法》(以下簡稱辦法)正式施行,引發(fā)行業(yè)人士和相關政策研究者的高度關注。
國家互聯(lián)網信息辦公室有關負責人表示,出臺《辦法》,旨在促進生成式人工智能健康發(fā)展和規(guī)范應用,維護國家安全和社會公共利益,保護公民、法人和其他組織的合法權益。
《辦法》的出臺,一方面體現(xiàn)了國家對生成式人工智能產業(yè)發(fā)展的鼓勵和支持,既為產業(yè)創(chuàng)新提供了政策導向和法律保障,另一方面又為產業(yè)監(jiān)管提供了科學合理且平衡適度的框架。
過去幾年,商業(yè)化一直是困擾整個人工智能行業(yè)的難題,大模型的出現(xiàn)為AI商業(yè)化提供了新契機。作為極具開拓性且高速發(fā)展的新業(yè)態(tài),大模型的賽道之分,成為了業(yè)內爭論不休的話題?,F(xiàn)有大模型大致可分為兩類:通用大模型,像ChatGPT,面向人群以及場景適用范圍十分廣泛,但由于需要巨大的計算資源和數(shù)據量,已經成為國內外大廠的重點項目;垂直大模型,在特定的領域或行業(yè)中經過訓練和優(yōu)化,針對特定場景提供更精準和高效的解決方案,更好地滿足用戶在某個領域或者場景下的需求和期待,如:醫(yī)療、金融等。
此次《辦法》強調了:應采取有效措施,提升生成式人工智能服務的透明度,提高生成內容的準確性和可靠性。從“準確性‘’“可靠性”這兩點要求來說,通用大模型由于爬取網上可能存在錯誤、偏見的信息,會導致精準度不夠,生成有誤或有偏見的響應,其不足逐漸顯露,無法切實滿足各行各業(yè)的需求。相比較而言,垂直大模型更能發(fā)揮其價值,它需要學習大量行業(yè)的專精語料和經驗知識,具有更強的領域專業(yè)性和任務針對性,能夠更好地解決特定領域的問題和提供更加精準的服務,也更容易找到其商業(yè)模式。
以醫(yī)療健康領域為例,醫(yī)療場景對問題的容錯率低,這就對大模型提出了更高的要求,即AI需要基于醫(yī)療專業(yè)語料給出更專業(yè)、更精準的醫(yī)療建議;其次,目前醫(yī)療數(shù)據中有超過90%的數(shù)據來自于醫(yī)學影像,這也意味著一個切實有效的、能做復雜決策的醫(yī)療人工智能大模型,需要融合醫(yī)學影像、文本,甚至語音或是視頻等多模態(tài)信息以賦能各種醫(yī)療場景。最后,考慮到現(xiàn)階段醫(yī)院實際的部署環(huán)境和數(shù)據安全性要求,“大模型”不能無限“大”,需要讓數(shù)據飛輪和模型訓練能夠很好結合,發(fā)揮效果更好、成本更低。
此外,《辦法》中還提到,采取有效措施提高訓練數(shù)據質量,增強訓練數(shù)據的真實性、準確性、客觀性、多樣性”,這體現(xiàn) “讓產業(yè)向高質量方向發(fā)展”的政策導向。
智慧眼砭石大模型在此方面做了重點考量,一方面,采用知識圖譜與大模型相結合的技術路線,通過在訓練過程中加入知識圖譜對訓練過程進行知識增強,結合RLHF技術,在500億參數(shù)條件下比單純使用大模型技術,醫(yī)學問題回答準確度提升近10%。另一方面,隱私計算條件下的大模型聯(lián)邦訓練,保證了數(shù)據的多樣化和高質量,充分釋放數(shù)據要素價值,真正做到數(shù)據的“可用不可見”、“數(shù)據不出域”。此外,砭石醫(yī)療大模型能夠支持醫(yī)療領域多模態(tài)的輸入,包括醫(yī)療領域文本、圖像、視頻和音頻形式,可以有機整合不同的信息,相比單模態(tài)信息更加全面,讓AI充分施展拳腳,方便醫(yī)藥機構使用。
當前,在《辦法》的催化下,各家通用大模型、垂類大模型廠商正加緊進行自身戰(zhàn)略布局、提升產品的安全合規(guī)性,共同構建安全可信的、自主可控的大模型生態(tài),智慧眼亦將堅持科技向善,為醫(yī)療健康產業(yè)的可持續(xù)發(fā)展做出價值貢獻。