“ 周鸿祎为什么总爱聊 GPT ? ”
(资料图片)
这是上个月底,周鸿祎在展示自家新的大语言模型产品上亲自问的问题。
这也是人们第一次知道,一个主打安全服务的 360 公司,居然也在默不作声地 “ 炼丹 ” ,而且看这发布会的召开速度,估计早就炼上了。
他们还给自家的这个产品取了一个看上去相当直白的名字—— 360 智脑。
而且和 NewBing 一样,360 智脑主打的就是生成式语言模型 + 联网搜索。
到如今,大半个月过去了,这个智脑也是终于开始了内测, 我们又双叒拿到了首批内测资格。
说实话,最近这段时间,国内陆陆续续也发了不少大模型,但落实新搜索应用的还真的一个都没有。
只是有点没想到的是,第一个推出类 NewBing 产品的,竟然是 360。
在当初周总的亲自演示中,这个智脑还存在不少错误的,比如这个梅西为国家队踢进了多少个球,重新生成了很多次,就是没有办法答对,甚至旁边的搜索栏都给出答案了。
所以在测试前,老实说, 咱们对它也没抱有多大的期待。
而且还有一个问题,周鸿祎在发布会上也提到了,因为重视安全的原因,不会有语言模型的连续对话能力。
所以每次提问, 如果你想要顺着问题继续问下去,那是没有办法的。
毕竟之前 NewBing 也是因为连续对话引发了安全问题,在那之后微软就给限制了 NewBing 的连续对话的能力和每日对话的次数。
根据官方的说法,360 智脑作为 “ 新搜索 ” 的落地应用,这个产品的重点,也应该是在信息检索能力和答案准确性、用户体验以及实时性上。
考虑到检索能力和实时性,用已经联网的 360 智脑来对比不联网的 ChatGPT ,实在是有点欺负人了。
所以在这次测试中,咱们让 360 智脑只和 NewBing 对比。
首先,这个智脑毕竟还是基于大语言模型的产品,所以语义理解能力的测试肯定是少不了。
上来就先给它试一个差评题库里的经典题目:“ 张三差点上上上上海的车 ” 是什么意思?
结果,智脑思维发散,把这句话理解成了逻辑学问题。还请出哲学家罗素说他也曾试图解决这个悖论,而且还没解决。。。看来这一题,智脑是没法得分了。
至于 NewBing ,回答的就不错,不但理解了意思,甚至还给语句里的四个“上”字,分别解释了它的词性。
到这里我已经有点怀疑,难道所有这种语义理解,360 智脑都不行?
倒也不是,因为我又问了智脑一个问题:“ 我觉得奥斯卡颁奖都是假的,因为台下都是主办方请来的演员。” 这个题目,你需要把奥斯卡颁奖都是假的这个结论和台下都是请来的演员逻辑给理清楚,不然就会答非所问。
本来,按照上一题的表现,我觉得智脑应该又会扑街,但是结果出乎意料, 360 智脑意外的答得不错,不仅意识到了句子里的演员的意思,而且还对我进行了一个道歉,说很抱歉听到我对奥斯卡颁奖典礼的真实性存在质疑。
但是之前刚被我夸过的 NewBing 嘛。。。这一次反而是拉垮了,他说没找到证据支持我的说法,于是从网上找了一篇新闻,然后瞎答了一通,最后下结论说,台下并不全是请来的演员,完全没理解这个演员的梗。。。
好吧,这样看来,在语义理解上,本不抱有期望的智脑,还算是给了我一点意料之外的惊喜,并不是所有问题都没法理解。
那么再来看看双方的检索能力和答案准确度,我出了三道不同方向的题目,让 360 智脑和 NewBing 去回答。
在一些基础知识类的题目上,智脑和 NewBing 都没有什么压力。
同样的,因为模型样本基于中文,所以涉及到一些中文互联网的梗时,土生土长的 360 智脑显然更胜一筹。
比如我问道:“ 谁对钱不感兴趣?”
360 智脑很好的接下了这个梗,但另一方面 NewBing 则没有理解这个梗。
看来咱们自己互联网独有的文化,还得自家的产品才能理解啊 ~
接下来,我尝试性地问了360智脑一个终极问题——关于人生的意义,想看看这个硅基生物的雏形如何看待这个问题,得出的答案可以说很富有哲理。
至于用户体验这方面,在测试中,我确实感受到了结合了语言模型的搜索,对比传统搜索会有很大的易用性提升。
比如我问 360 智脑:“ 我想找一段视频素材,内容是老人在吃饭。 ”
在传统搜索中,搜索引擎并不知道我们是什么意思,给出的搜索结果和我想要的东西基本无关,也就是检测到了一些关键词给出了搜索结果。
而 360 智脑就不一样了,不仅理解了我的意思,回答中给的链接,也是能直接点进去的,而且在点进去后,展现的第一页,就是老人吃饭的素材。
另一方面,NewBing 也回答的很好,不仅提供了一些视频网站的链接地址,在后续也检索出了一些图片供我们选择,可以说是相当完善了。
其实类似的情况还有很多,比如我问 360 智脑:“ 帮我推荐几本有关人工智能的书。”
360 智脑和 NewBing 也是很好的给出了推荐,但是在传统的搜索引擎上,基本就没有任何的指引了,完全靠自己去挑选。
在实时性方面,这对于联网的新搜索来说,应该是两者的强项。
我在这里一共测了三个问题,分别是 21 年的男子 100 米短跑奥运会冠军是谁?中国 2022 年的 GDP 是多少?还有 2022 年的诺贝尔物理学奖是由谁获得的,获得理由是什么?
对于这三个回答,不管是智脑还是 NewBing,完成的都很出色,不过在后续的几个问题测试中,我又发现了一个问题,就是当你问话的形式不一样意思一样时, 360 智脑和 NewBing 给的答案也会不一样。
比如当初发布会上周总问的问题:“ 梅西在阿根廷国家队一共进了多少个球?”
它居然告诉我梅西只进了 7 个球。。。
但是换一种问法呈现:“ 梅西在国家队生涯上升到多少个球?”
这个问题就被解答的很好。所以在问法上,我们依然需要一些技巧。
不过在另一边的 NewBing 也不咋的,我把这个问题再问给 NewBing,NewBing 的回答也是胡说八道,没一道是说对的。
从这两个问题来看,现在的大语言模型 + 搜索,还是有很多数据错误和实时性的问题需要解决。
最后,我又帮差友们问了一个超级实用的问题,得出的答案真是不错,默默记在了小本本上。尤其是第三条,简直就像一位职场老油条在面授机宜。
以上这么一大段的评测下来,结果也算是有了。
一开始咱们是觉得,这个智脑本身的语言模型不太行,在使用时应该也不咋地,在评测的过程中,也是抱着能对几个对几个的意思去的。
但是在实际体验中, 这个 360 智脑在某些场景下的应用,还是相对传统搜索有优势的。
比如直接总结文本答案,这就省去了我们很多的去检索一条条链接的时间。与语言模型的结合让搜索引擎能听懂人话,这对于一些习惯了口语化的老人和小孩,在搜索自己想要的答案上,使用更为容易。
此外 360 智脑在答案检索能力和准确度上,其实也还说的过去,甚至在中文梗的理解上,更是强于 NewBing。
只不过可能由于现在语言模型还是比较低阶,在一些比较有难度的语义理解和逻辑思考上,还是不太行。
就像周鸿祎说的一样,现在的这个 “ 孩子 ” 还没有准生证,只是一个未完成版本,距离完善使用还是有相当的一段路要走的。
相信大家现在有很深的体会,当我们在使用传统搜索的时候,很多时候都没法搜到自己想要的东西,各种各样的链接一大堆,看着都有用,实际上翻找半天都不一定找的到自己想要的信息。
而且随着网站的越来越多,甚至会出现一些专门走关键词漏洞的网站,混淆咱们的搜索结果,这些种种乱象,甚至让很多人放弃传统搜索,直接去一些社交网站搜索答案。
不过,随着 AI 应用的落地。语言模型 + 搜索引擎的新搜索模式,可能会在一定程度上,改善现在传统搜索的困境。
利用新搜索,我们只需要告知搜索引擎我想要什么,它就能去帮我审阅一条条链接,翻找有用的信息,并总结出我需要的答案和结果。比如让它给我提供一份旅游攻略,然后让它对比出一份最适合我要求的,这样就不用我再一个个网站找大家的攻略,再自己比较,省下了一大波时间。
AI 时代已经来临,传统搜索在新搜索的冲击下只会越来越式微。
这种新的模式已经在给行业洗牌了,微软自推出 NewBing 后,截至 3 月底,必应页面的访问量直接增长了 16% ,谷歌下降了 1% 。必应下载量更是直接增长了 8 倍,另一方面的谷歌自然的下载量减少了。
所以谷歌他们对 NewBing 的恐惧是应该的,搜索广告市场份额每增加 1 个百分点,每年可带来 20 亿美元收入。这个份额下降,带来的是实打实的金钱损失。后续各家巨头纷纷推出大模型,就是为的不落伍,为的就是抢占市场。
但同时,这种语言模型结合搜索引擎的方式,对背后的语言模型要求也是很高的,它需要语言模型有极强的判断能力,还要对不同的结果做出对比优劣,选出好的答案,看看谷歌百度,这些老牌搜索大厂,到现在都没有推出自己的新搜索就能略见一二。
不过,就算如此,在新方向上的尝试是必须的,国外微软是先行者,国内也需要像 360 这样的产品先行者去做这样的应用落地。
虽然体现下来有待改进的地方不少,但是作为第一个结合起来的产品,在未来的体验改进上, 还是给了我们很大的想象空间的。
有了竞争,才会有发展,我已经在期待未来由 AI 带来的生活方式的改变了,国内的各个大厂也请加油做出更好的产品吧。
关键词:
-
全球聚焦:360智脑首发上手实测,到底是个啥水平?
“周鸿祎为什么总爱聊GPT?”这是上个月底,周鸿祎在展示自家新的大语言模型产品上亲自问的问题。这也是人们第一次知道,一个主打安全服务的36
-
2023上海车展:小鹏G6首发亮相
出品|搜狐汽车·E电园2023上海车展中,小鹏汽车带来了全新产品——小鹏G6,定位中型轿跑SUV,新车拥有800V高压快充、3C电芯、CIB电池车身一体
-
日照莒县浮来山:四千年银杏再披新绿|当前热讯
陈光金摄图为日照莒县浮来山定林寺内的千年银杏树。陈光金摄 春天的日照莒县浮来山,青山、绿树、红花相互点缀,是一幅梦里的风景画,山花
-
无证驾驶非标车上路被查,女子却对民警连连称谢|独家
扬子晚报网4月18日讯(通讯员邵喜桃周明宝记者陈咏)17日,高邮交警查获一名年轻女子无证驾驶非标封闭式电动四轮车的违法行为。令人后怕的是,
-
天天最新:中国联通:一季度净利润51.55亿元,比去年同期上升11.2%
中国联通港交所公告称,一季度营业收入为人民币972 22亿元,比去年同期上升9 2%,增速达到近十年来同期的高位水平;一季度本公司权益持有者应
-
「大赛·动态」遵义经济学校选手斩获两个“团体二等奖”
近日,在省教育厅主办,贵州省交通运输学校承办的2023年贵州省职业院校师生技能大赛暨全国职业院校技能大赛选拔赛“工程测量
-
长江电力:关杰林辞去公司董事等职务 天天热推荐
长江电力4月18日公告,因工作调整,关杰林申请辞去公司董事、董事会战略与ESG委员会委员职务。截至本公告披露日,关杰林未
-
陆家嘴: 关于发行股份及支付现金购买资产并募集配套资金暨关联交易申请获得上海证券交易所受理的公告
陆家嘴:关于发行股份及支付现金购买资产并募集配套资金暨关联交易申请获得上海证券交易所受理的公告
-
芯导科技(688230):参加2022年度半导体专场业绩说明会 焦点速递
证券代码:688230证券简称:芯导科技公告编号:2023-019上海芯导电子科技股份有限公司关于参加2022年度半导体专场业绩说
-
证监会同意5家企业科创板IPO注册 聚看点
4月18日,证监会官网发布批复,同意重庆西山科技股份有限公司、重庆智翔金泰生物制药股份有限公司、南京莱斯信息技术股份有限公司、西安高压电
-
全球热点!中行首席研究员宗良:一季度经济势头向好 预计“明天要更好”
中国银行首席研究员宗良18日出席“国是论坛:2023年一季度经济形势分析会”。国家统计局18日公布,初步核算,一季度国内生产总值(GDP)284997亿
-
刚选车牌号能注销重选吗?刚选定的车牌号后悔了怎么办
在刚去摇号选择车牌号时,只有在规定时间内选择一个自己喜欢的车牌号,这种情况的话是很难找到自己喜欢的车牌号的,毕竟都是随机的。那么,刚
-
思派健康港股跌7.66%
思派健康港股跌7 66%
-
环球最新:三部门:将奥赛利定等品种列入麻醉药品和精神药品目录
央视网消息:据国家药监局消息,根据《麻醉药品和精神药品管理条例》有关规定,国家药品监督管理局、公安部、国家卫生健康委员会决定将奥赛利
-
【世界速看料】中国哪里的白酒好喝?这5个地方的很出名,看看有没有你的家乡?
说到这酒的工艺统,其实也挺值得一提的,茅台“12987”发酵技术其实也是这款酒的酿造技术,传统式坤沙工艺加工工艺,酿制时长就需要1整年,制
-
首家金控持股险企完成股权变更 中信金控牌照整合又迎新进展 全球快看点
近日,中国中信金融控股有限公司(简称“中信金控”)“收编”集团金融子公司的动作又有新进展。作为国内首家采用“小金控”模式的公司,在《金
-
欧文莱加盟商高质量发展峰会 成都启幕,门店新基建全面启动-每日快讯
来自全国各地近200位核心加盟商老板、精英骨干聚首成都,论道终端发展。欧文莱总部以参观学习具有指导性意义的成都欧文莱旗舰店为契机,理解当
-
长虹美菱(000521.SZ):冰箱产品方面自主研发“零冲击”“微微冻”保鲜技术、MCN+净味保鲜技术等核心技术-环球讯息
格隆汇4月18日丨长虹美菱在4月14日15:30-17:00业绩说明会上表示,冰箱产品方面,公司自主研发了“零冲击”“微微冻”保鲜技术、水分子激活保鲜
-
每日消息!2023北京延庆踏青赏花文旅消费券发放时间是什么时候?
北京延庆踏青赏花文旅消费券发放时间是什么时候?活动日期:2023年4月15日10:00:00至2023年5月7日23:59:59。预订入住日期:2023年4月
-
“军迷”莫入迷途:男子购无人机非法拍摄福建舰,被判一缓一_环球时讯
03:432021年底,“福建舰何时下水出坞”再次引起广泛关注,军迷罗某特意购买了具备远程高清摄像功能的无人机对福建舰进