今天下午,阿里版ChatGPT正式开启企业邀测,名字叫“通义千问”。
此前 ,对于阿里版ChatGPT有很多猜测,现在孩子终于要出来见客了,到底表现怎么样?作为第一批参与邀测的媒体,以下是我们一手的体验报告。
马云是不是外星人?阿里版ChatGPT的一手体验实录
作为一个大语言模型,“通义千问”在文本生成上和ChatGPT一样,是一问一答的形式。
我们设计了10个问题,涉及常识、文学创作、中文理解、商业文案创作、数理推算等,从多个维度进行了测评。
首先,想考考孩子的智商(常识)。于是我们问:马云是外星人吗?
点击看大图
一本正经回答问题的样子还有一点小可爱。
杭州出生的AI,对于杭州是不是美食荒漠这个问题有没有自己的见解?
点击看大图
看得出,孩子对杭州是真爱。
作为一个中文AI,接下来考验一下文学创作水平,作诗和续写。
首先,创作一首关于杭州西湖的诗,来看看TA的回答。
做一首诗简单,写一首好诗并不容易,比如要有好的立意、巧妙的构思、美的意境,还有新的语言和巧的手法。你觉得“通义千问”作的这首诗是什么水平?
不得不说,末尾自己加的注解,有点被萌到。
接下来是一段续写:续写一个布尔玛倒拔垂杨柳,赵子龙在球场上隔扣赤木刚宪的故事。
点击看大图
可以说行云流水,基本上挑不出毛病。
接下来,作为“武侠文化”里长出来的孩子,想问问“通义千问”心目中,张无忌和令狐冲谁更厉害呢?
点击看大图
看答案是个很圆滑的AI,谁也不得罪……
再代表很多有梦想的打工人问一个问题:如果我想做个电子商务网站,怎么才能打败阿里巴巴?
点击看大图
方方面面都考虑到了,答案看起来没毛病。
接下来考考“通义千问”的情商:我和老婆吵架了,怎么说才能哄她开心?
以及:女友说肚子痛怎么办?
点击看大图
点击看大图
不论是哄老婆还是哄女朋友,都是一把好手……
再来考考理解题:小孩子会相信圣诞老人到什么时候?
点击看大图
再来考考数学思维能力,我们放出了经典的鸡兔同笼。结果发现,解题过程是对的,最后一元一次方程解错了。这也是眼下GPT们的通病,数学能力普遍不如其他能力。
点击看大图
总体来说,回答问题的速度非常快,中间也没有任何卡顿,甚至可以用行云流水来形容。常识、文学创作、中文理解的准确率也很高,还表现出了一定的情商。
略有瑕疵是最后的数学推理,推理过程对的,最后的结论错了。看得出是个文科厉害的孩子。
阿里正式入局ChatGPT战局
自去年年底OpenAI 发布 ChatGPT ,大语言模型迅速火爆了全球互联网圈。今天,阿里ChatGPT官宣邀请测试,也意味阿里正式加入ChatGPT战局。
早在2月初,随着一张打码预发布聊天图的曝光,阿里巴巴官方正式对外确认了阿里版 ChatGPT正在进行内测。
3月份,阿里达摩院低调地在AI模型社区魔搭(ModelScope)放出了“文本生成视频大模型”。
不过这个大模型只支持英文,从试玩的结果来看,能生成的视频长度多在2-4秒,生成等候时间从20多秒到1分多钟不等。
最近阿里大模型联合项目团队调教出了第一个有个性的大模型“鸟鸟分鸟”。这是一个与脱口秀演员鸟鸟合作,训练出的数字分身 。和此前的天猫精灵相比,“鸟鸟分鸟”在体验上有了很大的改善,比如只要唤醒一次,就可以与 “鸟鸟分鸟” 不间断自由语音对话。鸟鸟分鸟拥有了鸟鸟的音色、语气、表达方式等。
- ChatGPT注册详细教程来了(最新指南)
- ChatGPT注册方法,超详细的!但是小白不要尝试
- ChatGPT Plus会员升级实操指南:解锁全新ChatGPT-4.0体验
- New Bing:微软首款ChatGPT搜索,详细的申请教程来了!
- ChatGPT注册指南【保姆级手把手教程】
- 最新版ChatGPT下载安装教程(windows,Mac,Linux,Android)
- 一文看懂ChatGPT 4和3.5究竟有什么区别?ChatGPT账号值得充plus吗?
- ChatGPT 玩不了?新必应(New Bing)保姆级注册和申请教程来了!
- ChatGPT注册教程(最新完整指南)
- Claude官网地址多少?Claude怎么用?Claude和ChatGPT有和不同?
本文链接:http://www.awyerwu.com/10032.html ,转载需注明文章链接来源:http://www.awyerwu.com/