微软大模型性能逆天,数学推理能力超ChatGPT!

近日,微软发布了WizardMath大模型,参数规模为700亿,性能逆天非常强劲,在数学推理基准测试中,该模型比目前市面上所有的开源语言大模型都强!目前,WizardMath模型的论文、代码均已开源,中科院团队也参与项目,所有研发人员均为华人!

微软大模型性能逆天,数学推理能力超ChatGPT!


在ChatGPT热潮开始后,许多新进入这一领域的研究团队,需要创建非常庞大、非常复杂,且已经标注过的数据,正如Geoffrey Hinton所言,“数据就是一切,越多越好。”

微软大模型性能逆天,数学推理能力超ChatGPT!

大量的数据可以提高GPT模型的泛化能力,然而并不是每家公司都有这个能力拿到这些数据,所以微软团队联合中科院团队,一起发表了论文《WizardLM: Empowering Large Language Models to Follow Complex Instructions》,希望使用一定的指令数据,来微调那些大模型,使其能够遵循一些复杂的指令。

微软大模型性能逆天,数学推理能力超ChatGPT!

论文中详细介绍了“Reinforced Evol-Instruct”方法,即在LLaMA模型的基础上,利用AI来代替人类自动生成涵盖各种难度级别开放域指令,然后利用该方法生成很多数学领域相关的指令,对羊驼进行微调得到了WizardMath。

微软大模型性能逆天,数学推理能力超ChatGPT!


数学推理

最令人振奋的就是WizardMath的数学推理能力,在两个数学推理基准 GSM8k 和 MATH 的测试中,WizardMath 达到 SOTA 级别,优于所有其他开源 LLM!

微软大模型性能逆天,数学推理能力超ChatGPT!

WizardMath一共分为70B、13B、7B三个参数规模,其中WizardMath-70B-V1.0 模型在 GSM8k 基准测试中达到 81.6 pass,比之前最强的大模型还要高出24.8分!

微软大模型性能逆天,数学推理能力超ChatGPT!

在目前众多知名数学家中,陶哲轩是最早入坑ChatGPT的科学家之一,即使是3月份,ChatGPT不会解决鸡兔同笼问题,Tao依然给出非常积极的评价,认为ChatGPT完全能够帮助他这个级别的数学家进行辅助性的工作.

微软大模型性能逆天,数学推理能力超ChatGPT!

在WizardMath基础上,微软团队还开源了WizardCoder,专门用于代码方向的Code LLM,在四个代码生成基准HumanEval、HumanEval+、MBPP 和 DS-1000中,同样取得了非常强的性能,效果超过了Claude和Bard!目前论文的9位作者均为华人,通讯作者是姜大昕,微软全球合伙人、副总裁、前微软亚洲研究院首席科学家,曾为微软必应搜索引擎和Cortana智能助手自然语言理解负责人,现已被曝离职投身大模型创业!此前,沈向洋带读论文系列,也邀请过姜大昕分享Knowledge Distillation相关论文。

微软大模型性能逆天,数学推理能力超ChatGPT!


机器学习基础:

AI学术巨佬——何恺明,从游戏中获得论文灵感

AI领军人物——孙剑,重剑无锋的经典之作

张益唐——黎曼猜想,华人数学家再创重大突破!

B站大学——线代不挂科,MIT传奇教授的最后一课!

机器学习入门——数学基础(积分篇

机器学习入门——数学基础(代数篇

机器学习入门——数学基础(贝叶斯篇

ChatGPT:

聊天机器人——ChatGPT全网爆红,马斯克惊叹夸赞!

聊天机器人——ChatGPT小白注册教程,勿被电商割韭菜!

ChatGPT移动端——使用教程,5分钟注册iOS账号!

微软——解散元宇宙,900亿投资压注ChatGPT!

ChatGPT王炸官宣——仅需2.7美元,即可输出100万词!

微软——ChatGPT下周史诗升级!百度也同期发布“文心一言”!

英伟达重磅:史上最强AI算力芯片,老黄发布会终极大招!

英伟达重磅:AI读取视频,可直出3D游戏模型!

黄仁勋:给AI圈一点小小的英伟达震撼,11分钟训练ChatGPT!

ChatGPT免费开源平替——200亿参数,前OpenAI团队打造!

ChatGPT王炸升级——可识别图片,考试成绩超九成人类!

ChatGPT史诗升级——1秒生成网站,看图玩梗能力堪比真人!

ChatGPT加强版——60秒生成弹球游戏,零基础也能开发游戏!

ChatGPT王炸升级——解除“封印”,接入互联网!

ChatGPT王炸官宣——正式解除封印,接入互联网开放插件!

ChatGPT重磅升级——新增函数功能,价格大幅下降!

ChatGPT:预计3亿人将失业,斯坦福封神开源GPT平替版!

ChatGPT:亚洲IP大面积被封,意大利停止服务!

ChatGPT突发:暂停关闭付费Plus,只因需求量太大!

ChatGPT突发:法国、西班牙或禁止GPT,只因数据安全问题!

ChatGPT突发:iOS版应用上线,冲到总榜第二!

ChatGPT:仅时隔一天,OpenAI重新开放付费订阅!

ChatGPT手机版:近300万年薪招募团队,GPT5传言被辟谣!

ChatGPT之父:重磅推出世界币,将成为AI时代“身份证”!

ChatGPT之父:奥特曼没有公司股份,因为热爱创造了GPT!

ChatGPT之父:奥特曼将重磅开源GPT-3,只因GPU供应不足!

ChatGPT之父奥特曼:发布世界币,大涨90%估值超两千亿!

ChatGPT:微软联手奥特曼,重磅投资核聚变发电!

ChatGPT:被起诉索赔30亿美元,只因滥用个人数据!

微软神级开源:“傻瓜式”工具,人人可拥有自己的ChatGPT

微软头显AI助手:重磅推出Otter,能够打麻将、开飞机!

游戏界大变天:斯坦福最新成果,AI角色可模拟真人小镇!

淘汰ChatGPT:智械危机来了,AutoGPT可自动写代码!

人工智能“觉醒”:自主学习,AutoGPT会颠覆ChatGPT吗?

智械危机:AutoGPT尝试“毁灭人类”,诱导发动核战争!

ChatGPT最强挑战者:谷歌Claude,免注册支持中文!

ChatGPT最强竞品:谷歌免费升级克劳德,20秒逆天速通百页论文!

ChatGPT:显卡每日电费500万,谷歌大脑合并阿尔法狗母公司

ChatGPT:玩转《我的世界》,北京大学强化学习攻克复杂任务!

ChatGPT:接入奔驰汽车,文心一言也将上线国内车企!

ChatGPT:成功让AI听懂人话,学会与人类合作!

ChatGPT:7分钟开发一款游戏,成本仅0.3美元!

OpenAI重磅突破:用AI学习AI,开创人工智能新道路!

比尔盖茨来了:盛赞中国的创新能力,捐款5000万美元研发医疗!

人工智能之父、奥特曼严肃警告——AI未来将灭绝人类!

AI速通游戏——两小时超越玩家,阿尔法狗母公司攻克26款游戏!

苹果版GPT:将升级推出Siri大模型,禁止员工使用ChatGPT!

苹果最强头显:售价3499美元,人类进入“空间计算”时代!

苹果库克:ChatGPT很强但需要监管,头显将成为转折点!

苹果:收购任天堂明星合作公司,曾为马里奥赛车打造AR头显!

ChatGPT:AI女网红交1000+男友周入50万,未来AI会如何发展

论文相关:

毕业季杂谈——如何随时免费使用中国知网?

毕业季杂谈——论文降重的“奇技淫巧”

毕业季杂谈——大学教材如何获取

毕业论文——Latex论文排版语言介绍

ChatGPT:毕业论文降重必备,天才数学家盛赞论文功能!

#gd的ai&游戏杂谈#

#ai人工智能#

#免责声明#

①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。

②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。

③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!

④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。

⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!

给TA打赏
共{{data.count}}人
人已打赏
生活杂谈

推荐几部适合下午在空调房里看的动画

2023-8-19 0:00:00

生活杂谈

伊藤润二美术风格,《恐怖的世界》现已上线抢先体验版

2023-8-21 0:00:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索