超140万亿词元调用量的背后代表哪些行业发展趋势?专家解读
03-26 07:14 星期四
央视新闻

到今年3月,我国日均Token即词元调用量超过140万亿,相比2024年初的1000亿增长了1000多倍。日均词元调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化。今年是“十五五”开局之年,也是数据要素价值释放年。日均词元调用量超140万亿,说明什么?

如何理解词元?哪个比喻更像真正的词元?

国家数据专家咨询委员会委员、北京交通大学教授 张向宏:词元是一个特别新的概念。人工智能大模型在全球出现仅5年时间,而词元在世界范围内出现也不到1年,中文名字半年时间不到。对词元的理解,以后词元会发展成什么样子,都是在探索阶段。

目前,我们认为词元分两个阶段来看。词元上游是高质量数据集,高质量数据集再往前是数据资源。下端是智能体和大模型,智能体和大模型是在各行各业,在个人、企业当中应用的。从这个角度上来说,词元是构成智能体和人工智能大模型的最小单元,就像一块块积木,搭成了智能体的应用。

从再长的时间来看,3到5年,词元应该发展成就像电和自来水一样,随取随用,用多少买多少,用多少付多少钱。随着经济社会的发展,智能经济不断提升,词元的概念会越来越丰富,内涵会越来越丰富。

如何为AI创造更多应用场景?

张向宏:人工智能的最终生命力体现在应用。如果说,人工智能不能在社会经济中深度应用,不能跟个人日常生活、政府日常管理,特别是企业日常生产经营活动深度绑定、深度融合的话,其实是没有生命力的。在这方面国家出台了很多政策。

目前来看,从个人、政府、企业在办公、在场景方面用得比较浅层。下一步,就应该在各行各业,特别是制造业企业,比如金融、商贸流通等各方面跟生产流程、市场营销、供应链深度绑定。假以时日,人工智能在生产经营活动中会越来越深入,越来越广泛。

建设更多高质量数据集,面对的问题、挑战是什么?

张向宏:有三方面挑战。第一,数据挑战。可以看到,目前数据高质量开发利用给我们生活带来很多便利,提升效率。如果数据安全性没有得到保障,也会带来很多隐私泄露等,所以,数据安全流通是摆在我们面前非常重要的话题。

第二,算力。算力有两个瓶颈,其一,GPU。目前虽然取得了重大突破,但是仍然有比较大的提升空间。其二,电力。如果个人、企业和政府大规模用人工智能,电力耗费相当大。当然,在算力协同,特别是绿电支持算力发展方面,已经做了重大布局,但是也要未雨绸缪。

第三,技术迭代,就是模型技术迭代。这几年国家大模型企业的技术发展特别快,但是下一步离企业、政府、个人的应用还要进一步深化。

财联社声明:文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
热门评论
golden888回复1周前·浙江0
虚拟化
cls-cjdk81回复1周前·上海2
使用ai辅助工作,就像当年用搜索引擎一样,逐渐融入生活
痛风的人回复1周前·云南0
又是一个新的生活单位产生!
孤独的老斯基回复1周前·河北0
词元目前来说还是太贵了
cls-n355lc回复1周前·北京0
后续比拼算力
cls-n355lc回复1周前·北京0
算力即是国力
鸣鸠79回复1周前·甘肃0
人工智能的最终使命是提高生产效率,还是要看应用。
cls-4uhw0k回复1周前·河南0
探索阶段。
cls-b8nhyg回复1周前·江西0
今天跟着相关的全完了
cls-8mr0tm回复1周前·上海0
算力
cls-1562935回复1周前·四川0
词元偏向语言,不基于语言的单位应该称呼什么?是否通用一点的翻译,比如智元
漫山遍野92猴回复1周前·内蒙古0
牛哇
Avin_jiang回复1周前·广东3
人工智能
hst885回复1周前·福建0
老猫回复1周前·山西8
电力
HellenYhu回复1周前·四川2
利好CPO、算力、半导体
回复1周前·广西壮族2
词元还应该定义一个单位,例如,我们喝水,你不好意思说我喝了1亿个水分子。水有升,口,公斤,顿等单位。词元按照个计数显然不够。今后,词元数量肯定会达到1亿亿亿个,听到这么读的人肯定以为你结巴了。
哪吒封神传奇回复1周前·黑龙江0
大国崛起的表现
尚威回复1周前·天津12
发展速度极快
尚威回复1周前·天津11
是的,随处可见
妮敦道9号回复1周前·天津1
就翻译成中文,就成新概念。好无聊
cls-1369745回复1周前·黑龙江11
新概念
cls-phnu21回复1周前·河北1
词元,挺好
黄良权回复1周前·湖南10
厉害 今年算力主旋律