MIT 研究揭示 AI 并无稳定价值观,“对齐”挑战远超预期

发布时间:2025-04-28 18:24:12 来源:互联网

本站 4 月 10 日消息,几个月前,一项研究暗示随着人工智能(AI)越来越复杂,其会发展出“价值体系”,例如优先考虑自身福祉而非人类福祉。然而,麻省理工学院(MIT)最近发表的一篇论文却给这种夸张的观点泼了冷水,得出结论认为 AI 实际上并没有任何连贯的价值观。

MIT 研究的共同作者表示,他们的研究结果表明,使 AI 系统“对齐”,即确保模型以人们期望的、可靠的方式行事,可能比通常认为的更具挑战性。他们强调,我们如今所知的 AI 会产生“幻觉”并进行模仿,这使得其在许多方面难以预测。

“我们可以确定的一点是,模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀(Stephen Casper)在接受 TechCrunch 采访时表示。

据本站了解,卡斯珀和他的同事们研究了来自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型,以了解这些模型在多大程度上表现出强烈的“观点”和价值观(例如个人主义与集体主义)。他们还调查了这些观点是否可以被“引导”,即被修改,以及模型在各种情境下对这些观点的坚持程度。

据共同作者称,没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同,它们会表现出截然不同的观点。

卡斯珀认为,这是有力的证据,表明模型高度“不一致且不稳定”,甚至可能根本无法内化类似人类的偏好。

“对我来说,通过所有这些研究,我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说,“相反,它们本质上是模仿者,会进行各种捏造,并说出各种轻率的话。”

本周热门教程

1
jmcomic2最新安装包2024官网入口 jmcomic2最新安装包2024登录入口

jmcomic2最新安装包2024官网入口 jmcomic2最新安装包2024登录入口

2025/03/26

2
为什么“狠狠撸视频”能够引发如此强烈的观看欲望?你不容错过的娱乐趋势!

为什么“狠狠撸视频”能够引发如此强烈的观看欲望?你不容错过的娱乐趋势!

2025/03/30

3
法国版《酒店服务生》:酒店服务行业的真实写照与社会影响

法国版《酒店服务生》:酒店服务行业的真实写照与社会影响

2025/03/28

4
18直播:如何吸引大量用户并保持长期活跃?探索它的内容、互动与技术优势

18直播:如何吸引大量用户并保持长期活跃?探索它的内容、互动与技术优势

2025/03/30

5
黄冈站离日本到底有多近?武汉作为交通枢纽为日本游客提供更多选择

黄冈站离日本到底有多近?武汉作为交通枢纽为日本游客提供更多选择

2025/03/30

6
凹凸TV:全新视频平台为何成千禧一代和年轻人首选?

凹凸TV:全新视频平台为何成千禧一代和年轻人首选?

2025/04/04

7
亚洲人成色777777商业模式解析:如何借助数据创新和多元化盈利实现市场突破

亚洲人成色777777商业模式解析:如何借助数据创新和多元化盈利实现市场突破

2025/03/26

8
惠普打印机闪黄灯怎么处理 4个排查步骤快速解决

惠普打印机闪黄灯怎么处理 4个排查步骤快速解决

2025/03/26

9
ChatGPT 新图像生成器可轻松生成逼真的假收据,OpenAI 回应

ChatGPT 新图像生成器可轻松生成逼真的假收据,OpenAI 回应

2025/04/05

10
50岁丰满岳母出演理论片,展现成熟魅力,成为观众关注焦点

50岁丰满岳母出演理论片,展现成熟魅力,成为观众关注焦点

2025/03/30