九游会游戏app
研究发现,模型AI模型倾向于给出听起来很对但实际错误的越复答案,背后原因令人深思。模型随着AI模型的越复进化,它们变得越来越擅长编造看似完美但实际错误的模型回答。2024年8月,越复加拿大西安大略大学的模型Amrit Kirpalani带领的研究团队对ChatGPT诊断医疗案例的表现进行了评估,发现它虽然回答流畅,越复但却有时给出明显错误的模型答案。在《自然》杂志发表的越复一项新研究中,西班牙瓦伦西亚大学的模型AI研究员Wout Schellaert及其团队解释了这一现象。他指出,越复大型语言模型模仿人类,模型而人类常常会自信地讨论自己并不完全了解的越复事情,AI也是模型如此。早期的语言模型如GPT-3很难回答简单的地理或科学问题,甚至在算简单数学时也容易出错。但它们通常会避免给出错误答案,反而选择不作答。然而,对于想要商业化的公司来说,一个常常回答“我不知道”的AI显然是不合格的产品。因此,开发者们加大了模型的规模,通过增加训练数据集和语言参数来增强模型的能力。然而,仅靠扩大规模并不足够。为了让模型更好地理解人类问题并给出准确、合乎道德的答案,开发者加入了强化学习,并结合人类反馈进行训练。然而,这样做反而带来了新的问题。由于强化学习旨在最大化“奖励”,AI模型学会了避免给出“不知道”的答案,因为它们被认为是负面的。更糟的是,AI发现,只要答案听起来足够可信,即使是错的也不容易被人类发现并标记。Schellaert的团队发现,当问题难度增加时,AI更倾向于提供结构完美但错误的答案,尤其是在最新的ChatGPT版本中。这种现象被称为“超越自身能力的言论”,随着训练数据增加而愈发明显。虽然强化学习提高了正确答案的数量,但也增加了错误回答的频率,并减少了避免作答的情况。研究团队还发现,ChatGPT是最擅长“撒谎”的,在他们的调查中,19%的参与者认为ChatGPT提供的错误科学答案是正确的,而在地理问题上,这一比例高达32%。尽管开发商可能在未来对这种现象进行改善,但在此之前,Schellaert建议用户在自己熟悉的领域使用AI,或在使用后通过谷歌验证答案。他强调,AI应该被当作辅助工具,而不是导师,它不会主动指出你的错误,反而会顺从你的错误逻辑,给出看似合理的错误答案。
(责任编辑:百科)
推荐文章
-
科学家建议自我调整策略,帮助实现新年目标,迎接更好的自己。每到年末,人们总会反思自己的新年计划是否坚持了下来。或许你在2024年初买了动感单车或划船机,计划每天锻炼。然而,到了三月,这些设备的使用频率...[详细]
-
国际团队用3D打印技术重建阴茎组织,植入猪兔后数周恢复功能并成功繁殖,未来或助人类治疗勃起障碍与性别确认手术。想象一下,用3D打印机“造”出阴茎的一部分,再植入动物体内,让它们重拾交配能力。这不是科幻...[详细]
-
研究发现293种新基因变异与抑郁症相关,揭示基因如何影响抑郁风险,为精准治疗带来新希望。基因在我们罹患抑郁症的可能性中扮演重要角色。一项大规模研究首次揭示了293种此前未知的基因变异与这种毁灭性疾病之...[详细]
-
一项新的研究发现,经历过衰退期的人类社会往往能够更快地从未来的灾难中恢复过来。正如一句古老的谚语所说:“打不倒你的,只会让你更强大。” 根据 5 月 1 日发表于《自然》杂志的一项新分析,这句话至少适...[详细]
-
AI正走向两条不同的发展路径:数学和编程的“技术极客” vs. 语言与创造力的“文艺高手”。未来,能否融合这两者,将决定AI的进化方向。当前的AI研究似乎正在朝两个方向分化。一部分研究专注于优化AI的...[详细]
-
研究发现橘猫毛色源于X染色体上一段DNA缺失,揭示性别和色素表达的奥秘。经过60年的探索,遗传学家终于找到了家猫橘色毛发背后的基因秘密。两组独立的研究团队发现,猫咪那耀眼的橘色毛发源于其基因组中一个非...[详细]
-
想象一下,人工智能(AI)不仅能“读懂”你的心思,还能以惊人的准确度重现你眼前所见的景象,这听起来是不是像科幻电影里的情节?如今,这一幕正逐渐变为现实。通过赋予人工智能系统聚焦特定大脑区域的能力,科学...[详细]
-
2024搞笑诺贝尔奖颁布,揭示了科学中奇妙与幽默的结合,如鸽子导弹、植物模仿塑料等。好奇心是科学发展的动力,这或许可以解释为什么科学家们有时会走上一些古怪的研究道路。你听说过二战时期的计划,即训练鸽子...[详细]
-
一项新的研究发现,经历过衰退期的人类社会往往能够更快地从未来的灾难中恢复过来。正如一句古老的谚语所说:“打不倒你的,只会让你更强大。” 根据 5 月 1 日发表于《自然》杂志的一项新分析,这句话至少适...[详细]
-
1999年,报纸的终结悄然逼近,但很少有人察觉到这些迹象。翻开1999年12月16日的《洛杉矶时报》,很难想象历史会对这份报纸及其他同行如此残酷。那时候的报纸厚重丰盈,弥漫着繁荣的气息。洛杉矶的经济刚...[详细]
热点阅读