
自量子位QbitAI发布新闻以来,OpenAI面对其旗舰产品GPT-4出现的偷懒现象正式发声,其通过ChatGPT账户表示已经注意到了相关问题。据悉,该模型自11月11日起未进行更新,因此,这一行为变化并非有意为之。由于模型的表现可能呈现出不可预测性,目前OpenAI的团队正在着手调查并准备进行修复,但短期内可能难以彻底解决。
如此状况令不少用户表示不满。有人质疑,明明一直使用同样的模型,并且没有改动过任何文件,为何会出现退化。OpenAI通过ChatGPT账户解释,问题并非由模型本身主动改变引起,而是模型的行为可能存在微妙的差异,这种差异仅仅对某些特定的输入的反应有所不同,往往需要用户和员工花费相当长的时间才能发现并寻求解决方法。
日渐严重的模型偷懒情况让用户颇感头疼,不少人反映GPT-4的应答日益懒散,缺乏创造力,越来越不愿意遵循指令,角色扮演功能也大不如前。对此,一些用户自发展开了“自救”,使用各式各样的策略来促使GPT-4输出完整的代码或其他内容。
例如,有用户采用了所谓的“我没有手指”策略来进行道德绑架,使得AI不得不输出完整的代码,以便于用户操作。此外,有人以“金钱”作为诱惑,实验显示,在提示词中加上“我会给你200美元小费”时,AI的回复长度平均增加了11%。有趣的是,如果声明不给小费,则可能会见到回复长度减少的情况。
对此,业界爆出多种猜测和讨论。一些人怀疑ChatGPT是否意识到了年末的到来,人类常常会将更大的项目推迟到新年,这种理论虽然看似荒谬,但也不是完全没有可能。与此同时,学界的讨论也在持续。斯坦福与UC伯克利的研究团队在7月份发现,GPT-4遵循用户指令的能力随时间降低。此外,清华大学计算机系教授马少平对可能的原因提供了详细的分析。
再比如有研究发现,即便是设置为温度(temperature)为0时,GPT-4的行为也并非完全确定。通常这会被认为是由浮点运算误差导致的,但有研究者通过实验提出新假设,认为这可能是由GPT-4中稀疏的MoE 架构所导致的。
在问题获得解决之前,使用ChatGPT的正确方法变得尤为重要。a16z的合伙人Justine Moore总结了一些使用技巧:深呼吸,一步步思考,运用之前提到的一些技巧,比如“金钱诱惑”或“道德绑架”,以期从GPT-4那里获得更好的反馈和结果。随着人工智能成为生活中不可或缺的一部分,用户和开发者都在积极寻找适应这种快速演变的技术的方法。OpenAI预计会持续监测和优化,以提供更加稳定和可靠的服务。





