幫助大模型提升自身安全性科研團(tuán)隊(duì)發(fā)布AI安全平臺

2023-07-10 11:09:02 來源：中國新聞網(wǎng)

(相關(guān)資料圖)

中新網(wǎng)北京7月9日電 (記者張素)以ChatGPT為代表的生成式人工智能廣受關(guān)注，大模型亦在加速發(fā)展?？蒲袌F(tuán)隊(duì)近日發(fā)布新的AI安全平臺，以期為大模型系好“安全帶”、把好“方向盤”。

據(jù)介紹，人工智能安全平臺RealSafe3.0版本由清華大學(xué)人工智能研究院孵化企業(yè)瑞萊智慧RealAI發(fā)布。該平臺能夠提供端到端的模型安全性測評解決方案，旨在解決當(dāng)前通用大模型安全風(fēng)險(xiǎn)難以審計(jì)的“痛點(diǎn)”。

“大模型‘落地難’的本質(zhì)在于，當(dāng)前還沒有找到場景、風(fēng)險(xiǎn)和規(guī)范三者之間的平衡點(diǎn)。”瑞萊智慧聯(lián)合創(chuàng)始人、算法科學(xué)家蕭子豪在受訪時(shí)說，而在探尋這一平衡點(diǎn)的過程中缺少易用和標(biāo)準(zhǔn)化的工具。換言之，亟須在技術(shù)層面找到有力抓手，幫助人們科學(xué)評判大模型在場景中能否同時(shí)滿足規(guī)范和低風(fēng)險(xiǎn)，助力大模型上線運(yùn)行。

據(jù)知，相較上一版本，RealSafe3.0新增了對通用大模型的評測。該平臺覆蓋數(shù)據(jù)安全、認(rèn)知任務(wù)、通用模型特有漏洞、濫用場景等近70個評測維度，可以全方位、多維度地評測通用大模型的性能，未來還會持續(xù)擴(kuò)增測評維度的數(shù)量。

蕭子豪介紹說，RealSafe3.0內(nèi)部集成了多個自研模型和專家論證高質(zhì)量數(shù)據(jù)集，來幫助用戶修復(fù)模型中的問題。例如，對黑盒不可解釋的通用大模型，自研紅隊(duì)對抗模型取代人工設(shè)計(jì)問題，顯著提升攻擊成功率和樣本多樣性。

再如，教練模型通過對被測大模型進(jìn)行多輪次的“提問—回答訓(xùn)練”，并以訓(xùn)練好的評分模型對問答結(jié)果進(jìn)行評分，再將評分結(jié)果反饋給大模型，使其不斷強(qiáng)化學(xué)習(xí)到好壞答案的要點(diǎn)及區(qū)別，直至問答能力逐步迭代至最優(yōu)。

值得一提的是，瑞萊智慧科研團(tuán)隊(duì)還研發(fā)出能夠防范生成式人工智能惡意濫用的DeepReal2.0，即“生成式人工智能內(nèi)容檢測平臺”。該平臺支持對圖像、視頻、音頻、文本進(jìn)行是否偽造的檢測，應(yīng)用場景包括打擊網(wǎng)絡(luò)詐騙和聲譽(yù)侵害行為、檢測網(wǎng)絡(luò)內(nèi)容合規(guī)性、檢測音視頻物證真實(shí)性等。

“我們將持續(xù)迭代技術(shù)、打磨產(chǎn)品，以確保在這場人工智能安全‘攻防戰(zhàn)’中始終立于不敗之地，將人工智能的兩面性這一‘關(guān)鍵變量’，轉(zhuǎn)化為高質(zhì)量發(fā)展的‘最大增量’?！笔捵雍勒f。

關(guān)鍵詞：

97无码人妻福利免费公开在线视频-窝窝影院午夜看片-欧美性猛交内射兽交老熟妇-国产精品亚洲a∨天堂不卡

幫助大模型提升自身安全性科研團(tuán)隊(duì)發(fā)布AI安全平臺

熱門推薦

熱門文章

全站熱門

97无码人妻福利免费公开在线视频-窝窝影院午夜看片-欧美性猛交内射兽交老熟妇-国产精品亚洲a∨天堂不卡

幫助大模型提升自身安全性 科研團(tuán)隊(duì)發(fā)布AI安全平臺

熱門推薦

熱門文章

全站熱門

幫助大模型提升自身安全性科研團(tuán)隊(duì)發(fā)布AI安全平臺