内蒙古草原遇上东南亚风情!“亚太音乐节”将在太仆寺旗举办
北京日报客户端|记者白波“2023内蒙古·亚太音乐节”将于7月15日至16日
(资料图)
以ChatGPT为代表的生成式人工智能广受关注,大模型亦在加速发展。科研团队近日发布新的AI安全平台,以期为大模型系好“安全带”、把好“方向盘”。
据介绍,人工智能安全平台RealSafe3.0版本由清华大学人工智能研究院孵化企业瑞莱智慧RealAI发布。该平台能够提供端到端的模型安全性测评解决方案,旨在解决当前通用大模型安全风险难以审计的“痛点”。
“大模型‘落地难’的本质在于,当前还没有找到场景、风险和规范三者之间的平衡点。”瑞莱智慧联合创始人、算法科学家萧子豪在受访时说,而在探寻这一平衡点的过程中缺少易用和标准化的工具。换言之,亟须在技术层面找到有力抓手,帮助人们科学评判大模型在场景中能否同时满足规范和低风险,助力大模型上线运行。
据知,相较上一版本,RealSafe3.0新增了对通用大模型的评测。该平台覆盖数据安全、认知任务、通用模型特有漏洞、滥用场景等近70个评测维度,可以全方位、多维度地评测通用大模型的性能,未来还会持续扩增测评维度的数量。
萧子豪介绍说,RealSafe3.0内部集成了多个自研模型和专家论证高质量数据集,来帮助用户修复模型中的问题。例如,对黑盒不可解释的通用大模型,自研红队对抗模型取代人工设计问题,显著提升攻击成功率和样本多样性。
再如,教练模型通过对被测大模型进行多轮次的“提问—回答训练”,并以训练好的评分模型对问答结果进行评分,再将评分结果反馈给大模型,使其不断强化学习到好坏答案的要点及区别,直至问答能力逐步迭代至最优。
值得一提的是,瑞莱智慧科研团队还研发出能够防范生成式人工智能恶意滥用的DeepReal2.0,即“生成式人工智能内容检测平台”。该平台支持对图像、视频、音频、文本进行是否伪造的检测,应用场景包括打击网络诈骗和声誉侵害行为、检测网络内容合规性、检测音视频物证真实性等。
“我们将持续迭代技术、打磨产品,以确保在这场人工智能安全‘攻防战’中始终立于不败之地,将人工智能的两面性这一‘关键变量’,转化为高质量发展的‘最大增量’。”萧子豪说。(完)
关键词:
北京日报客户端|记者白波“2023内蒙古·亚太音乐节”将于7月15日至16日
在《暗黑破坏神4》的残酷世界中生存可能很困难,尤其是当您玩野蛮人这
直播吧7月9日讯姆巴佩近日在喀麦隆参加活动,与前NBA球员诺阿一起打球
1、《火影忍者》年的忍者大战是开始也是结束。2、忍耐力世界大战是日本
李刚仁:我从小就知道巴黎这家俱乐部,这是世界上最好的球队之一。我也
当地时间8日,黎巴嫩军方发表声明称,一艘以色列炮艇当天上午侵犯黎南
今起昆明新开209路、Z159路公交线可分别接驳地铁1号、3号、4号、5号线
导读1、自称“歌神”,出没于李毅吧。2、歌声骇人听闻,照片惊世骇俗。
7月7日小暑节气郑州市气象台发布今年首个高温红色预警郑州市减灾委办公
杨紫 时间刚刚来到2023年的下半年,杨紫就又拿下了五大刊其中之一《嘉
1、陆绎,出身平湖陆氏,明朝嘉靖年间著名官员锦衣卫统领陆炳第三子。
迪马济奥:米兰可能很快结束赖德尔斯的谈判,普利希奇将在下周到达根据
蓑衣独钓寒江来感受古画里的冬日风雅---文人笔下的冬日风雅。乌篷船上
当天,起跑仪式在四川师范大学(成龙校区)进行,在来自各行各业的大运
着力扩大内需,恢复和扩大消费是今年经济工作的首要任务。我国是历史悠
为了扩大有效投资,促进民间投资,昨天(7日),国家发展改革委联合七
1、最高境界是:化神(道境)神剑诛邪,宝印番天;万魔幡呼啸聚引,斩
手感不佳!13号秀迪克12中3&三分9中2拿下10分4板3断,迪克,公牛,多伦多猛龙队
07月07日,陕天然气获深股通增持50 13万股,最新持股量为871 26万股,
高尔夫(参数|询价)7变速箱油6万公里更换,变速箱油的更换方式有重力换
7月7日,招商沪深300增强策略ETF最新单位净值为0 8093元,累计净值为0
绿玉树(EuphorbiatirucalliL )别称:光棍树、绿珊瑚、青珊瑚、铁树、
澜起科技在互动平台表示,受宏观环境影响,今年上半年服务器及计算机行
抖音私信多少会频繁,抖音每天私信陌生人一般可以发送30条,但超过10条
原标题:加拿大森林火灾过火面积已达9万平方公里加拿大跨部门林火中心