独家|李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成
02-06 20:28 星期四
【独家|李飞飞团队“50美元”复刻DeepSeek的R1真相:基于阿里云Qwen模型监督微调而成】《科创板日报》6日讯,今日有报道称李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。《科创板日报》记者调查后发现,s1模型的训练并非从零开始,其基座模型为阿里通义千问(Qwen)模型。s1用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对千问模型进行微调而成。(记者毛明江 黄心怡)
财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
热门评论
cls-2dhrv9回复1年前·湖北0
这么说吧,没有李飞飞,就没有现在的ai发展,还在这炒ai,炒空气去吧,有些人真是无知无畏
呵呵呵呵呵回复1年前·IP未知0
反正看端侧,对端侧来说都无所谓
cls-7i9lft回复1年前·IP未知0
成本是给阿里云的包年费
cls-mryyuk回复1年前·IP未知0
Charles_Qiu回复1年前·IP未知2
纯粹蹭热点吸流量
paopao回复1年前·浙江2
维海德 知识蒸馏概念龙头
风吹雪45回复1年前·广东2
明天知识蒸馏涨停 我就信
cls-1359040回复1年前·IP未知0
李飞飞都不认识就别看AI了
TONGYUANZHAN回复1年前·IP未知1
粘贴复制的技术就别吹了
cls-1352084回复1年前·北京1
牛顿用一生研究的东西我几节课就整明白了,我比牛顿牛B
cls-8q56p0回复1年前·上海1
一个资深程序员告诉大家 利好算力 懂得都懂 不多做解释 这里面很复杂 莲花股份可以关注 有算力公司 又是ds 概念
海滩的眼泪回复1年前·IP未知4
利好ai端测,利空做ai的公司
cls_2196789回复1年前·江苏1
人家负责发明新东西,我们负责应用新东西。你只要能发明出来,我们就能给你一一实现
凭实力赚钱运气亏回复1年前·陕西3
不会又是什么行为艺术吧
波風水門回复1年前·IP未知4
应该像原油宝一样,训练费用为负数[龇牙]
cls-ra3i4z回复1年前·上海3
你们先玩着,我们一边看结果。
鑫羽回复1年前·浙江3
站在巨人肩膀
cls-qqm094回复1年前·广东2
呵呵呵,dp开源就可以复制。
回复1年前·IP未知3
云计算起飞
金刚经回复1年前·北京3
哇靠,要是50美元就搞定,就是有鬼了。
转弯回复1年前·贵州3
照葫芦画瓢
cls-mr3fr6回复1年前·广东1
要我交智商税吗?
天威火回复1年前·内蒙古0
说了点啥
道心破碎ing回复1年前·IP未知3
李飞飞就是被马斯克从推特开的那个吗
clwyyp回复1年前·浙江1
蒸馏!!!
豆太。回复1年前·IP未知0
倒反天罡?
cls-1866478回复1年前·北京25
这也好意思说?
清水回复1年前·IP未知7
说说哪个是从0开始的?
cls-h7yl44回复1年前·浙江21
50美元是不是太多了。我5美分就能训练出来,问题是各位道友相信我吗?离大谱了!
虹猫虞渊回复1年前·江苏4
给钱就有的结果,谁信谁傻。
cls-1396050回复1年前·IP未知3
想表达什么?
cls-1897196回复1年前·IP未知6
全都是泡泡,什么是科技创新?
cls-406i69回复1年前·广东4
我的乖
miniluki回复1年前·广东6
资本咋理解这条新闻~
cls-1579531回复1年前·江西3
就说嘛,英伟达被财团盯上了吧
cls-tj06u0回复1年前·上海2
能有这么简单?这是一次狙击
那要不住哥哥家里吧回复1年前·陕西32
别再吓唬英伟达了