行業(yè)動態(tài)

中文互聯(lián)網語料資源平臺發(fā)布

來源:聚銘網絡    發(fā)布時間:2025-01-13    瀏覽次數:
 

1月9日,在中國網絡空間安全協(xié)會人工智能安全治理專委會工作年會上,中文互聯(lián)網語料資源平臺正式面向社會發(fā)布。

在中央網信辦指導下,中國網絡空間安全協(xié)會會同國家互聯(lián)網應急中心,協(xié)同人工智能產、學、研、用單位,共同建設中文互聯(lián)網語料資源平臺,面向社會提供中文互聯(lián)網基礎語料展示下載服務。平臺支持行業(yè)領域、內容模態(tài)、體量規(guī)模等多種標簽分類,便于用戶下載與使用。

目前平臺共入駐27個語料數據集,數據總量約2.7T,主要分三類:一是中國網絡空間安全協(xié)會會同國家互聯(lián)網應急中心等建設的中文互聯(lián)網基礎語料;二是人民網、北京智源研究院、上海人工智能實驗室等單位共享的互聯(lián)網語料;三是中國網絡空間研究院、中國國家版本館、中國大百科全書出版社、中國社會科學院圖書館等單位貢獻的優(yōu)質中文基礎語料樣本。登錄中國網絡空間安全協(xié)會官網,即可在首頁注冊使用平臺。

下一步,平臺將依托中國網絡空間安全協(xié)會人工智能安全治理專委會建立的語料共建共享機制,持續(xù)吸納優(yōu)質中文互聯(lián)網語料進駐,探索開展數據來源合規(guī)評估、質量評價、安全檢測等服務,構建健康可持續(xù)的中文互聯(lián)網語料開發(fā)利用生態(tài),促進和支撐大模型產業(yè)發(fā)展。

 
 

上一篇:一封來自中國信息通信研究院的感謝信!

下一篇:金融專家揭秘:如何有效反擊深度偽造欺詐