常用工具 医生入驻 免费问医生

用魔法打败魔法,南开大学最新成果让AI“识破”AI—新闻—科学网

2025-08-28 18:30:08 来源:病急乱投医网   

上海消保委测评10家网约车平台 超半数订单被多收费

作者:孙玲玲 来源:中国新闻网 发布时间:2025/8/14 13:10:20 选择字号:小 中 大
用魔法打败魔法,识破南开大学最新成果让AI“识破”AI

 

中新网天津8月14日电(记者 孙玲玲)记者13日从南开大学获悉,用魔近日,法打法南南开大学计算机学院媒体计算实验室取得最新研究成果,败魔不仅从评估的开大科学角度揭示了现有AI检测方法的性能不足,并创新性地提出了“直接差异学习”(Direct Discrepancy Learning,学最新成新闻DDL)优化策略,果让教会AI用“火眼金睛”辨别人机不同,识破实现AI检测性能的用魔巨大突破。相关成果论文已被计算机多媒体领域国际顶级会议ACM MM2025(ACM International Conference on Multimedia)接收。法打法南

图为南开大学研究团队提出的败魔DetectAnyLLM检测框架以及MIRAGE基准数据集亮点全析。(南开大学 供图)

  ?开大科学

近日,OpenAI发布新一代人工智能模型GPT-5,学最新成新闻再次引发全球关注。果让随着DeepSeek、识破ChatGPT、通义千问、豆包等AIGC大模型逐渐从“新奇玩具”变成学习、工作中不可或缺的“生产力工具”,其伴生问题也日益凸显:AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息,造成“AI幻觉”;依赖AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的热点问题。

据了解,目前AI生成内容检测主要有两种路线,一种是“基于训练的检测方法”,使用特定数据训练一个专用的分类模型;另一种是“零样本检测方法”,直接使用一个预训练的语言模型并设计某种分类标准进行分类。

图为AI生成内容检测示意图。(南开大学 供图)

  ?

多项研究表明,现有检测方法在应对复杂的现实场景时常显不足。此前也曾有权威媒体报道,《荷塘月色》《流浪地球》等经典作品被某常用论文AI率检测系统检出高AI率。

为何现有的AI检测工具会“误判”?论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道:“如果把AI文本检测比作一场考试,检测器的训练数据等同于日常练习题,现有检测方法是机械刷题、死记硬背答题的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”

“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但在大模型迭代飞速的今天几乎不可能。”付嘉晨说,让检测器真正学会举一反三,即提升检测器的泛化性能,是提升AI文本检测性能的关键。

为此,研究团队提出了DDL方法另辟蹊径,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识,可以精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,使用13种主流的商用大模型(如豆包、DeepSeek、Kimi等)以及4种先进的开源大模型(如Qwen等),从AI生成、润色、重写三个角度构造了接近十万条人类-AI文本对。

“MIRAGE是目前唯一聚焦于对商用大语言模型检测的基准数据集。直观地说,之前的基准数据集是由少而且能力简单的大模型命题出卷,而MIRAGE是17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的DetectGPT相比,性能相对提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的Binoculars方法相比,性能相对提升68.03%。

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测,以AI之力,让每一篇成果更出彩。”研究团队负责人、南开大学计算机学院教授李重仪说。

(原标题:“用魔法打败魔法” 南开大学最新研究成果让AI“识破”AI)

 特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。

希望以上内容对您有帮助。

阅读全文
相关推荐
休闲视频推荐精选问答
养生文章推荐
视频版丨《家居周十条》第115期

19日至23日 厦门思明区部分路段将交通管制

视频版丨《家居周十条》第115期
1-7月家具制造业利润额降至218.7亿元、红星美凯龙斥5亿元减免商户租金、蒙娜丽莎上半年亏损4.88亿元…8月22日-28日,家居行业十条热点新闻,搜狐焦点家居遴选精编。
中国消费者协会提示:购买跨境电商零售进口食品注意相关限制

“金鸡”红毯仪式23日举行 将有超600明星厦门海边走秀

中国消费者协会提示:购买跨境电商零售进口食品注意相关限制
中国消费者报北京讯记者任震宇)“618”购物节即将到来。购物节期间,经常有消费者选择购买跨境电商零售进口商品。6月14日,中国消费者协会发布消费提示,提醒广大消费者关注以下四点。了解品类清单。“跨境电
百强全屋定制:以德国品质打造百变个性

《战争机器:事变日》《腐烂国度3》都会登陆索尼PS5平台

百强全屋定制:以德国品质打造百变个性
这是一个追求个性化的时代,传统家具设计已经满足不了新一代人群蠢蠢欲动的创造欲,为满足消费者对家居个性的需求,“百强定制”应运而生。
New Balance 9060 释出官图 将会掀起怎样的一波热浪

花5000元“认养”一头黑猪就“返利”?警惕新型网络传销

New Balance 9060 释出官图 将会掀起怎样的一波热浪
作为已经入夏的一个季节,六月藏有太多的惊喜,六一儿童,芒种节气,与它们的碰面,每一次都能带来不一样的悸动。近日,鞋履圈又有了新的动作,毕竟下半年的拉锯赛就要打开,各大潮流海内外品牌更是在暗中不断蓄力,
玻璃楼梯的结构组成分类  玻璃楼梯扶手的安装方法,行业资讯

食品腐竹加工废水处理

玻璃楼梯的结构组成分类  玻璃楼梯扶手的安装方法,行业资讯
相信大家每天都会接触到各种玻璃制品,例如玻璃杯、玻璃门、玻璃窗等。虽然我们经常与它们接触,却对这些玻璃的种类与性质并没有太多了解。而由于对玻璃材料不够了解,往往会导致发生各种问题。我们将向大家
质检总局抽查60批次浸渍胶膜纸饰面人造板产品不合格8批次\白蜡木受市场青睐-

广东公布2020年反不正当竞争十大典型案例

质检总局抽查60批次浸渍胶膜纸饰面人造板产品不合格8批次\白蜡木受市场青睐-
8月16日,国家质检总局通报2017年第2批浸渍胶膜纸饰面人造板产品质量国家监督抽查结果,共抽查了北京、天津、河北、辽宁、上海、江苏、浙江、福建、山东、湖北、广东、重庆、四川、贵州、云南等15个省、直
《战地6》多人模式明天凌晨2点揭晓 部分预告片泄露

聯準會鮑爾:不用等到通膨降到2%才降息 9月降息機率跳升|天下雜誌

《战地6》多人模式明天凌晨2点揭晓 部分预告片泄露
目前,《战地6》已成为万众瞩目的焦点,游戏的预Alpha版本泄露片段已经让我们窥见了些许玩法。然而,明天才是重头戏,最终成品的实际表现将展现在我们面前。《战地6》多人模式游戏玩法揭晓活动将于太平洋时间
梁静茹演唱会“柱子票”案一审宣判 主办方提供服务有明显瑕疵构成违约

瑞达期货:玻璃下探回升,期价收跌,期货知识

梁静茹演唱会“柱子票”案一审宣判 主办方提供服务有明显瑕疵构成违约
中国消费者报上海讯记者刘浩)2023梁静茹世界巡回演唱会在上海举行,多名观众花千元购买门票,现场视野却被舞台四周的立柱遮挡,观看演出时面对偶像“只闻其声而不见其人”,体验感大打折扣。9名观众分别向演唱
太忻建设集团领导与山西省太原市水务局党组书记、局长会谈

Vidda C3 Ultra搭载MediaTek MT9681旗舰投影芯片

太忻建设集团领导与山西省太原市水务局党组书记、局长会谈
8月16日,太平洋建设大区总裁、太忻建设董事局主席张艳丽与太原市水务局党组书记、局长赵生魁会谈,双方就太原市水系规划及相关合作事宜进行交流。 张艳丽介绍了太平洋建设的发展历程、最新战略布
法索内:对于法庭的判决非常满意

警惕“零团费”等陷阱 广东省广州市消委会发布“五一”安全出游消费提示

法索内:对于法庭的判决非常满意
2月27日米兰消息 - 在接受国米频道电话采访时,国际米兰总经理马尔科·法索内就意大利足协仲裁法庭接受国际米兰申诉,解禁圣西罗北看台一事发表了评论。“显然我们对仲裁法庭的这一决定感到非常高