请枪手的“天塌了”,腾讯用AI打假工具评测

[复制链接]
查看95 | 回复0 | 2025-1-31 11:33:12 | 显示全部楼层 |阅读模式
01
腾讯上线AI检测工具
AIGC时代,谁知道对方发过来的照片是真人还是AI生成的,又有多少老师、家长苦于孩子用AI生成作文的“投机”行为,面对互联网上海量真假难辨的内容,用AI“打假”AI的呼声早已不是一两天了,只不过以往大多工具都在高校和专业机构间流通,大众很难接触,而这一次,腾讯混元安全团队的朱雀实验室针对C端大众群体推出一款名为“朱雀大模型检测”的线上工具,可检测文字和图片内容是否由AI生成。
“朱雀大模型检测”目前仅提供网页版,用户在浏览器中访问matrix.tencent.com/ai-detect即可,其界面左上方设计有下拉菜单,方便用户在文本检测和图片检测间切换。用户根据提示上传想要检测的内容后,“朱雀大模型检测”会在右侧给出检测结果,这里主要是以概率的形式表述该内容由AI形成的概率。


该工具的使用方法非常简单,但让人好奇的是其检测准确率到底有多少。而腾讯官方称,鉴别 AI 生成往往不能依靠单一依据。
因此,AI 生成图片检测系统需要利用 AI 模型来捕捉真实图片与 AI 生图之间各类特征的差异,包括图片的纹理、语义及隐形特征。而为了提升系统的检测效果,其使用了 140 万份正负样本进行模型训练,考虑了多种生成内容场景,如人体、人像、风景、地标、植物、电影、游戏、新闻等,最终测试检出率达 95% 以上,还在持续优化提升中。
这里,我们特准备了两张图片和一篇文章,均100%为AI直接生成,测试“朱雀大模型检测”会给出怎样的结果。
02
棋逢对手,AI对抗AI
这里,我们首先让通义万相生成两张图片,一张带有人像,而另一张为宠物图片。单从画面效果看,似乎和手机拍照开到7、8级美颜,再加上各种滤镜的效果差不多,就看“朱雀大模型检测”的反应如何了。
单张上传图片后,点击“立即检测”,只需几秒时间,“朱雀大模型检测”就给出了反馈,除给出概率外,还明确提出“极有可能是AI生成,或存在篡改痕迹”。


事实上,笔者还是有些不甘心地尝试上传了小红书上一位被网友赞为“美得不像真人”的博主截图和一张随手拍的实物图,想看看“朱雀大模型检测”是否蒙的,结果发现对于这些基本真实的照片内容,其给出的AI生成概率不到25%,同时明确告知“不太可能是AI生成”的。
相较图片,文本生成检测则多少让笔者有些惊讶。这里笔者让橙篇以“冬日即景”为题撰写了一篇文章,完成后更下达“去AI味儿”的指令,原本以为一番操作后语言流畅性已经相当不错,可“朱雀大模型检测”直接就给出100%的“AI生成概率”。


面对100%由AI生成的结果,笔者多少有些不服气,更让Kimi、文心一言、豆包都加入了文章修改的行列,但非常有意思的是无论笔者如何选择,“朱雀大模型检测”均直接给出100%的AI生成概率。
显然,“朱雀大模型检测”对于文字内容的检查非常拿手。
03
点评:一场“矛”与“盾”的交锋
为监督AI技术使用,如今市面上不乏各类用于检测AI生成内容(AIGC)的工具,如普林斯顿大学学生开发的GPTZero、斯坦福大学研究团队推出的DetectGPT等。我国西湖大学文本智能实验室研发也推出了Fast-DetectGPT这样的检测产品,不过这些工具更多被专业机构、院校掌握在手里,而这一次,“朱雀大模型检测”让普通人也能尝试用AI打败AI。
这些工具如同战场上的“矛”,锐利而精准,它们的目标直指那些试图混淆真伪、滥竽充数的AI生成内容。它们利用复杂的算法和大量的数据训练,能够识别出AI生成文本的特征,无论是语言模式的微妙差异,还是词汇选择的非自然倾向,都逃不过它们的“法眼”。
然而,在这场“矛”与“盾”的交锋中,AI生成技术本身也在不断进化,扮演着“盾”的角色。为了逃避检测,AI生成技术开始采用更加隐蔽和复杂的策略。它们学习如何模仿人类的写作风格,如何更自然地运用语言,甚至如何在不改变原意的情况下,对文本进行微妙的调整,以躲避检测工具的追捕。这场交锋不仅仅是技术的较量,更是对数字世界内容真实性和信任的一次深刻探讨。

微信订阅

欢迎通过邮局渠道订阅2025年《电脑报》
邮发代号:77-19
单价:8元,年价:400元
编辑|张毅
审核|吴新
爆料联系:cpcfan1874(微信)
壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则