其次,嚴格制定數據安全保障機制,避免敏感數據洩露。當下,大模型的數據安全面臨挑戰,尤其政務大模型因涉及敏感數據,其運行直接影響公共利益和國家安全,需要採取更嚴格的監管要求,特別是訓練數據,需要有更系統化、更細化的規範來指導,否則極有可能引發重大危機。
專家建議,圍繞數據來源合規、內容安全合規、敏感數據識別過濾、訓練數據標注安全、數據分類分級與安全保護、數據訪問控制等方面,制定體系化的防護方案。例如,針對公開的大模型,就不能使用內部、敏感數據來進行訓練,從源頭避免重要數據洩露風險。
最後,通過內容風控、應用防護等多重保障,確保大模型運行安全。大模型的運行安全涉及內容生成和應用層面的多重保障,需要確保生成的內容符合相關規定,且系統運行穩定可靠。以大模型應用安全風險中的“提示注入”風險為例,它是指攻擊者通過巧妙構造輸入提示詞,試圖突破大語言模型的安全防護機制,引導模型產生不符合預期甚至有害的輸出,比如一個聊天機器人原本是為客戶提供服務的,但在惡意提示詞的誘導下,可能無意間洩露出訓練數據中的敏感信息。
因此,在內容層面,國產大模型需要做好生成內容風控,包括輸入內容過濾、輸出內容審核,確保大模型在輸入內容前經過嚴格的審查,過濾惡意輸入內容,防止不良輸出;在應用層面,需要做好Web安全防護、API安全防護、應用訪問控制、個人信息保護等,通過嚴密的安全技術保障和運行監測,確保大模型運行時的安全性、可靠性和穩定性。 |