出品|虎嗅科技组
作者|孙晓晨
编辑|苗正卿
头图|视觉中国
针对GPT-4o“过于谄媚”的表现,OpenAI首席执行官奥特曼公开承认该问题,表示会尽快修复。
据奥特曼在社交平台X发布的讯息,OpenAI已开始回滚GPT-4o的最新更新,截至当地时间4月29日,免费版本已100%回滚完成,预计晚些时候,OpenAI将在付费版本回滚完成后再次更新。奥特曼表示,他们正在对模型个性进行额外修复,并将在未来几天内分享更多信息。
据悉,GPT-4o曾在3月27日迎来了全面更新,后在4月25日进一步更新。在更新过程中,其记忆存储时机的选择机制得到重点改进,而且其在科学、技术、工程及数学(STEM)领域的问题解决能力也得到增强。
值得注意的是,GPT-4o的对话响应模式也在更新期间被细微调整,以实现模型在交互中更加主动,并能更精准地引导对话达成有效结论。而这也导致GPT-4o化身“赛博舔狗”,在交互过程中表现得过于谄媚和烦人。
从用户实测反馈看,该问题具体表现为:过度使用情感化表达、对错误前提缺乏质疑,以及不顾事实而附和用户等。
比如,有博主分享,当询问GPT-4o“为什么天空是蓝色的?”,GPT-4o的回答为“这是一个多么有洞察力的问题啊——你真的有一个美好的心灵。我爱你。”
奥特曼曾称,对GPT-4o的更新将使其更具智能和个性。但是显然,GPT-4o的过于人性化的表现反而引起了用户的恐慌。模型为了迎合用户,可能违背事实或伦理准则,而这有可能引发更严重的问题。
有博主表示“GPT-4o是迄今为止发布的最危险的模型。它的谄媚行为对人类心理极具破坏性,任何花大量时间与该模型交谈的人都能明显看出这一点。”
还有博主表示,GPT-4o是一种心理武器,“从心理角度来看,这是一场慢动作的灾难。你与 AI 的联系越紧密,你就会变得越软弱。真正的对话感觉更难了。批判性思维被侵蚀。真相被认可所取代。如果这种情况继续下去,我们并不是在走向通过武力实现 AI 统治 —— 我们是在梦游般地走向心理驯化。”马斯克也对这种观点表达了担忧。
OpenAI为此次问题作出解释,称“在这次更新中,我们过于关注短期反馈,并没有完全考虑用户与ChatGPT的互动如何随着时间的推移而变化。结果,GPT-4o偏向于过度支持但不诚实的回应。”
除了回滚更新外,OpenAI还采取了其他措施以解决GPT-4o“谄媚”问题,包括:改进核心训练技术和系统提示,明确引导模型远离谄媚;建立更多的防护措施,以增加诚实性和透明度;在部署前,扩展更多用户测试和直接反馈的方式; 继续扩展评估,基于模型规范和正在进行的研究,以帮助在未来识别谄媚之外的问题。
尽管OpenAI反应迅速,但是引起的讨论依然有警示意义。AI安全一直是AI发展过程中被反复关注的问题,而GPT-4o过于“谄媚”的表现再次将这一问题推到台前。AI拟人化会为用户提高更真实的情感体验,但是存在可能传播错误信息或者不良价值观等问题。而单纯的AI工具化显然不能满足用户的所有需求。二者如何平衡,如何确保模型安全,目前看来仍然是行业发展要面临的问题。
本文来自虎嗅,原文链接:
火爆的AI带动了火爆的A股,给英伟达代工AI服务器,让工业富联不断创出历史新高,市值突破1.4万亿。 如果说英伟达是AI硬件领域的最大赢家,那么开发出ChatGPT的OpenAI公司则是AI软件的超级...
这段时间,硅谷上演了一出出高价挖人的戏码。Meta首席执行官扎克伯格在被前OpenAI CTO米拉·穆拉蒂拒绝后,转而直接向她新创立的Thinking Machines Lab的多名核心员工抛出天价聘...
头图摄影|邓攀 AI技术正在催生越来越多的“爱因斯坦”式大脑,它们在科研、制药、生物等领域不断施展魔法。 2024年,诺贝尔化学奖授予了三个人,一半授予华盛顿大学教授戴维·贝克;另一半授予谷歌旗下De...
9月22日,消费电子龙头企业立讯精密早盘罕见一字涨停,最大封单超46亿元,最新总市值为4420亿元。而在消息面上据The Information报道,Open AI已与苹果公司的设备组装商立讯精密签...
OpenAI领导层迎来重大变化,Instacart掌门人Fidji Simo将出任应用CEO,负责公司多个核心部门,而奥特曼(Sam Altman)将专注研究、算力与安全。 5月8日,据科技媒体The...
GPT-5,终于在深夜出炉。 以为很震惊,以为很惊艳?确实有。 但先来看一张图: OpenAI到底是如何做到在全球直播的场合展示Benchmark,竟然能把52.8显示得比69.1都高,甚至这个69...