客户端
官方微信
官方微博
今日头条
北疆观察
数字报刊
北疆新闻 > 国内 > 正文

记者从国家数据局获悉:中文数据在国内大模型的训练性能提升方面发挥着重要作用。国内多数模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。

在人工智能时代,Token(通常所说的词元)是处理文本的最小数据单元。国家数据局局长刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已经突破30万亿,1年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。(记者 王云杉)

北疆新闻 | 内蒙古自治区重点新媒体平台,内蒙古出版集团•内蒙古新华报业中心主管主办的国家互联网新闻信息采编发布服务一类资质平台。

编辑:方琳
5772

北疆新闻版权与免责声明:

一、凡本站中注明“来源:北疆新闻”的所有文字、图片和音视频,版权均属北疆新闻所有,转载时必须注明“来源:北疆新闻”,并附上原文链接。

二、凡来源非北疆新闻的新闻(作品)只代表本网传播该消息,并不代表赞同其观点。

如因作品内容、版权和其它问题需要同本网联系的,请在见网后30日内进行,联系邮箱:bjwmaster@163.com。

绿色农业促农民增收

版权声明:北疆新闻版权所有,未经书面授权,不得转载或建立镜像,违者依法必究。 本站违法和不良信息举报电话:15648148811蒙ICP备16001043号-1

Copyright © 2016- 北疆新闻 All Rights Reserved互联网新闻信息服务许可证:15120200009-1广播电视节目制作经营许可证:(蒙)字第631号蒙公网安备:15010502001245