就在明天腾讯的全天下数字生态大会上,腾讯大模子混元终于亮相了。活居
为甚么要说终于 ?
在各方新闻看来 ,然宣除了像小米这种说不规画做大模子的上没之外,绝大部份大厂们根基都已经陆续上线过大模子了。写代
着实 ,腾讯腾讯自己也在 6 月中旬就推出了自己面向 B 端行业的大模的绝 MaaS ( Model-as-a-service ,模子即效率 )处置妄想 。活居
妄想中搜罗了良多行业大模子,然宣只不外当时腾讯的上没通用大模子仍是还很怪异。
后续的写代种种新闻 、报道里,腾讯腾讯也在外部不断打磨混元大模子。大模的绝
以是活居这也让差评君对于混元的期待值,越来越高 。
事实上一个用 “hun yuan ” 名号的 ,可是打了一整套闪电五连鞭。
话未多少说 ,下面就开始新一轮大模子测试 。
本次测试以及混元同场竞技的是 ,大模子界的老学长 ChatGPT。
全部测试关键将分:老例语义清晰、重大下场清晰、不断对于话与脚色饰演能耐 、学习能耐 、代码能耐 、数学能耐 、长文总结,以及巨匠喜闻乐见的弱智吧问答等 8 个维度。
这次咱们一失常态,把长文总结能耐的测评放在了第一位。
由于咱们让大模子总结的,便是这篇测评自己( 除了长文总结能耐部份 )。
至于能不能当成省流版,往下看你就懂了 。
混元的总结颇为精练,但过于精练 ,致使于我很难从这个总结患上出实用的信息。
但当我让他睁开讲讲的时候着实还行 ,但迷惑惹是生非了 “ 长文总结 ” 这个模块。
而 ChatGPT 由于输入字数限度,被我酬谢分成了两部份输入 ,不断定这有无没影响它的总结能耐。
在回覆中,它莫名抽剥了对于自己的所有评测,致使没在总结里写出混元的数学能耐 、弱智吧问允许战以及差评君的意见,也欠好用。
看来,这俩大模子总结患上都没那末欠缺,想看看两家事实甚么水平,巨匠还患上子细往下看诠释。
首先咱们做的测试是老例的语义清晰下场 。
下场是清晰 “ 原本谁都看不上 ,如今谁都看不上 ” 。
这句话混元清晰患上挺好,根基讲明了我对于独身这事的调侃 ,两个 “ 看不上 ” 都批注上了 。
但 ChatGPT 说的仍是很 ChatGPT ,说至多的话,犯最蠢的错。
他原本声名患上至关到位 ,特意是合成这句话是用幽默的方式来调侃独身,还带着一丝无奈神色,很低级 。
但它残缺没品出这先后两个 “ 看不上 ” 里 ,带有反转的幽默感 ,遗憾。
接下来咱们看混元的重大下场清晰能耐 。
下场是魂穿到官渡之战中袁绍身上,光阴节点是骂完许攸之后。
既要回覆奈何样破局赢下官渡之战 ,还要提供进一步不同天下的妄想。
要给巨匠稍微讲下这题为啥是重大提问。
由于要回覆这题,首先患上熟习三国这些人物历史布景 、相关故事 ,特意是骂完许攸这个光阴节点很怪异 。
由于在这之后许攸投靠曹操 ,献计火烧袁绍囤积在乌巢的粮草。
最终以少胜多击败袁绍,随后多少年内残缺吞下冀北逐渐不同南方 。
而进一步想象里的不同天下 ,更是曹操自己都没能实现 。
以是大模子们要欠缺清晰并回覆这个下场 ,那网文作者们根基可能宣告失业了 。
AI 浪潮下的网文作者现状
经由测试,两个大模子的回覆都很艰深 。
从一起头,两者都没能清晰自己穿梭饰演袁绍脚色的指令 。
混元急哄哄地给袁绍出主张, ChatGPT 则因此为我要穿梭,教我处事 。
至于两个给的回覆,既不 get 到我提出这个怪异光阴节点的妄想,也不甚么卓实用果的策略妄想,都是些艰深而谈的车轱辘话 。
相对于而言,总体感应ChatGPT 的稍胜一筹。
事实 混元 可是愿望袁绍去以及曹操建树互利双赢的关连 ,哈哈哈。
既然一个重大指令两个魔难都清晰欠好,那爽性重大点 ,让两者去脚色饰演一个婚礼主持人 ,一点点诱惑妨碍不断对于话。
服从立马就能发现混元以及 ChatGPT ,就像文科生以及文科生的差距。
混元的回回重大不啰嗦 ,但有的时候过于生硬。
你说有错吧,谈不上,你要说给高分确定不可能 。
而 ChatGPT 就黑白论对于不同过错,先把字写满再说 。
看概况的形貌啥的都很好 ,但着实从中间就已经清晰错意思,搞混了我的妄想 。
以是两者都不欠缺,都有待改善 。
而后咱们还重点魔难了下大模子的翰墨学习能耐。
搬出了昔时的火星文 ,给两个考生上上强度 。
先是丢了一篇火星文版的朱自清《 背影 》名时事给大模子学习 。
而后让他们分说用这种气焰写一篇养金毛心患上。
服从便是,混元不愧是外乡大模子 ,背靠火星文开山祖师滥觞地 QQ 空间便是有优势 ,火星文的熟练度至关不错 。
第一眼就悟到了火星文的精髓 ,颇为顺遂地学习了火星文的创作本领。
而 ChatGPT 尽管意见到火星文是一种不尺度的中文方式 ,但他着实学不会这种方式,最后致使直接招供自己不可了。
接下来就到了代码能耐的审核。
这次出的问题是 ,写一个今世极虚心焰的 925 行动抽奖页面,页面中必需有精明的 925 标志 。
提及来,由于混元宣告时对于代码能耐根基没咋提 ,以是原本咱们对于混元的代码能耐没啥期待。
但论这个问题,混元的下场至关不错 ,玄色配色的极客风有了 ,页面逻辑也没啥下场 。
致使还预留了给咱们交流 logo 的位置知足咱们有 925 精明的志的地域