财联社3月15日讯(编辑 马兰)ChatGPT公司OpenAI隔夜上线了其最新人工智能模型GPT-4,轰动了整个科技界。据OpenAI自己称,GPT-4将是该公司里程碑式的模型。
在其概念视频中,OpenAI介绍新模型可以解决更复杂的问题、编写更大型的代码,并通过图片产生文字。此外,OpenAI还承诺GPT-4相比之前的模型,包括ChatGPT此前应用的GPT-3.5,将更加安全且具协调性。
用简单的话说,GPT-4模型改变了此前ChatGPT等历史人工智能的单一、文本短小等缺点,变身为一个能看图说话的高级“解语花”。
(资料图片)
然而,这朵“解语花”也点燃了不少人的焦虑,比如硅谷最著名的企业家马斯克。
他在推特平台上发文称:人类还能做什么?我们最好使用Neuralink(来对抗人工智能)!
此外,他还回复了网友关于GPT-4内测的帖子,称他个人十分关切这个新模型,也认为这个新的人工智能看起来很有意思。
但马斯克关于GPT-4和Neuralink的评论还是让不少网友觉得尴尬,不少人嘲讽他的脑机广告听起来并不吸引人。相比于人工智能机器人取代人类,在大脑里植入设备似乎更让人头皮发麻。
不过,网友们关于GPT-4领导机器人占领世界的想法也是过于杞人忧天。
正如OpenAI强调的那样,GPT-4目前仍是并不完美的模型,其能力远不如人类。GPT-4仍有许多局限性,如社会偏见、幻觉和对抗性提示。
GPT-4现在最热门的话题莫过于它强大的应试能力。根据OpenAI的评估,GPT-4已经能轻松通过美国的律师考试,且考进了前10%的排名。相比之下,它的上一代模型GPT-3.5只能吊个车尾。
除了律师考试,GPT-4还在美国大学入学测试SAT中考到710分,虽然分数不高,但已经够上美国大学录取水平。更重要的是,GPT-4能在大学的基础微积分课程中获得4的成绩(5分为满分),这证明了该模型已经掌握了高等数学大部分的概念。
网友也对它的这些做题能力进行了进一步的测试。
比如让它分析柱状图,并回答图形背后的统计学意义,或者出一道用法语描述的物理题。令人欣慰的是,它竟然没有胡言乱语,而是有条有理地给出了正确答案。
另一方面,已经升级为GPT-4模型的ChatGPT,现在已经可以通过用户的简单需求直接生成代码,甚至网站。即便用户只是在餐巾纸上画了个简单界面,GPT-4都能直接搞出一个可运行的网站。
如此好用不废话的程序员,大概是每一个产品经理心中永远的神。
更让人嫉妒的是,曾经中国爆火的“量子波动速读”竟然也在GPT-4上获得了重现。这种被机构滥用的反人类教育噱头,在非人类的人工智能上却得到了完美的诠释。
有网友将一整篇论文上传给GPT-4,然后,GPT-4就在极短时间内完成了阅读,并给出清晰的总结摘要。
甚至,如果有人问它某个图是什么意思,代表了什么意义,GPT-4也能像模像样地给出解答。
与GPT-3.5相比,GPT-4将文字输入限制提升至2.5万字,这让其阅读体量大大增加,也让用户的文书处理工作变得更加简洁。
此外,强大的识图能力和显著提高的回答准确性,也保证了GPT-4在文字处理上的优越性,相较于GPT-3.5的答不上来就乱编,已经出现了长足的进步。
如果说昨天的ChatGPT还是一个不解人意的“老古董”,那么今天的ChatGPT就已经可以轻松理解网友心照不宣的冷笑话,即便是表情包,它也能说个子丑寅卯来。
比如鸡米花拼成的世界地图,ChatGPT就轻松回答出了网友想要的答案:这是个玩笑,用鸡米花和世界地图两个不相干的东西形成一种幽默。
虽然识图这一功能在人工智能领域并不罕见,谷歌搜索甚至连淘宝都具备识图功能,但这一功能还是首次亮相于ChatGPT。
而除了简单的识图之外,更可贵的是,ChatGPT现在还能解释图像的具体意义,并理解图像背后的隐喻含义,这在其他识图人工智能上仍十分罕见。
可惜的是,目前图像输入的功能仍只是预览阶段,还不能使用,即便是氪金玩家现在也只能按捺住好奇心。
早在ChatGPT出来的时候,网友们就热衷于让人工智能玩角色扮演的游戏。什么假设你是一个财经编辑啦,假设你是一个程序员啦,假设你是小说家啦……总之,网友想到什么,ChatGPT就被迫成为什么。
而现在,这样的花活居然被OpenAI官方带头认可。
相比于GPT-3.5时期,现在鸟枪换炮的ChatGPT不再用一本正经的语气规劝网友,类似于“我只是个人工智能,我无法……”的表达,现在都用更具个性化的话替代。
OpenAI要求GPT-4拿出服务精神。既然用户希望得到一个定制的GPT-4,那么GPT-4就要表现出相应的人物性格和态度。
根据OpenAI的内部测试,GPT-4仍有GPT-3.5的老毛病,就是胡言乱语。专业地讲,GPT-4仍会产生幻觉,生产错误答案,并出现推理错误。
总的来说,GPT-4已经显著减轻了幻觉问题,在这一项上,GPT-4的分数比GPT-3.5要高出40%。但这可能也意味着GPT-4的乱讲话可能更隐蔽,更难以被用户察觉。
另一方面,GPT-4仍缺乏对数据截至日期后新进展的了解能力,即其无法在训练学习后,追踪新的信息来补足对某件事认知。此外,它也无法从经验中学习,并可能一直轻信人类。
在安全边界上面,GPT-4也得到了相应的加强,与GPT-3.5相比,它对违禁内容的回复率下降了82%,对敏感内容(如医疗建议)的响应率则提高了29%。
还有一个不太友好的地方在于,GPT-4的使用目前仅对ChatGPT Plus玩家开放,换句话说,需要付费。
目前OpenAI对GPT-4的训练规模、硬件、算力等一切保持缄默,只说会在未来陆续公布,可谓是吊足了外部观众的胃口。
不过,瑕不掩瑜,截至目前,科技人士对GPT-4的评估仍持正面态度。更多的人则在说:未来已来,迎接新世界吧。
标签:
未来已来?GPT-4刚上线就引发马斯克恐慌 一文梳理其与3.5版本区别
财联社3月15日讯(编辑马兰)ChatGPT公司OpenAI隔夜上线了其最新人工智能模型GPT-4,轰动了整个科技界。据OpenAI自己称,GPT-4将是该公
当前视点!上海家化2022净利同比降27%;腾讯会议将取消免费300人不限时会议
一、今日头条腾讯会议将取消免费300人不限时会议二、财经新动向深圳华强:2022年归母净利9 52亿元,拟10派3元北京汽车:北京奔驰2022年收入248 2亿
养老金融驶入发展“快车道” 养老目标基金的三个主要特点是什么? 每日消息
近些年,我国养老金融驶入发展“快车道”,特别是国家正式启动实施个人养老金制度,我国多层次、多支柱养老保险制度框架基本形成,为养...
环球最资讯丨土坑酸菜风波一周年:实探插旗菜业,中国芥菜之乡的阵痛和救赎
本文来源:时代周报作者:李馨婷湖南岳阳华容县,又名“中国芥菜之乡”。一年前3·15掀起的“土坑酸菜”风波,至今仍影响着这座小城。当...
智商税和海克斯科技争议不断,六个核桃卖不动了?_环球快播
“经常用脑,多喝六个核桃”,六个核桃曾凭借这句广告语红遍大江南北,养元饮品也一路狂飙,成为我国植物蛋白饮料的龙头企业。在健康饮...
全面退网摆烂,跌出贵州民企前十:失控的“老干妈”,快要走到头了? 天天快资讯
国民辣酱的传奇,还能延续下去吗?作者:朱末来源:快刀财经世事无绝对,沧海变桑田。“老干妈”上热搜榜了,原因竟是“退网摆烂”。以...
香港上海大酒店2022年录得股东应占亏损4.88亿港元 亏损扩大307%
3月15日,香港上海大酒店有限公司...
【北向资金追踪】3月14日北向资金十大成交股(附名单)
【北向资金追踪】3月14日北向资金...
丙氨酰谷氨酰胺上市公司龙头股票有哪些?丙氨酰谷氨酰胺概念股一览表|环球通讯
丙氨酰谷氨酰胺上市公司龙头股票有...
新债提醒|今日N天23转上市
新债提醒|今日N天23转上市,N天23转...
热资讯!聚丙烯上市公司排行榜:2023年3月14日成交额前10名单
聚丙烯上市公司排行榜:2023年3月1...
长效生长激素概念上市公司2023年名单一览(3月15日) 天天资讯
长效生长激素概念上市公司2023年名...
东莞2023年将落实3万套保障性租赁住房 世界快报
近日,东莞市住房和城乡建设工作暨...
当前观点:佛山南海将建6000套集中式员工租赁住房
3月14日,南海区集中式员工租赁住...
民青局批出香港首个旅馆青年宿舍-精选
3月14日,民政及青年事务局(民青局...
五老峰创建国家5A级景区二期工程开工-世界新动态
近日,永济市在五老峰景区举行2023...
焦点速看:布达拉宫:3月16日起恢复淡季票价
3月13日,布达拉宫管理处发布公告...
每日热议!长白山火了,但“长白山”没火
刚刚过去的这个春节假期,长白山成...
科沃斯:可能触发“科沃转债”的转股价修正条款
科沃斯3月14日发布公告,自2023年3...
广东碧桂园职业学院与佛山希尔顿酒店合作签约
近日,广东碧桂园职业学院在国华楼...
【当前独家】香格里拉等千家星级饭店签约 “氧吧酒店”专项工作组成立
近日,在中国酒店业绿色发展论坛上...
用几个案例,看看中小银行的数字化转型,搁浅在哪?出路在哪? 焦点速讯
01、可能是写多了上市银行的关系,...
预制菜之后西贝再推空气馍 贾国龙的“中式快餐梦”能圆吗?
财联社|新消费日报3月13日讯(记者...
冲击“普洱茶第一股”,73岁茶妈妈再战IPO|环球热资讯
花朵财经原创作者|谢达编辑|铎子酒...
一直干“苦活累活”的美团,打车业务怎么轻装上阵?
文|螳螂观察作者|胖胖近日,脉脉上...