申请免费试用
完善信息,立即试用
点击提交,表示您同意我们的 《隐私声明》《网站协议》
提交申请
获取
隐私声明隐私声明隐私声明隐私声明隐私声明隐私声明隐私声明隐私声明
确认
网站协议网站协议网站协议网站协议网站协议
确认
国家数据局:国内多数模型训练使用中文数据占比超60%
发布时间: 2025-08-19 09:27:01
浏览量: 123

   中文数据在国内大模型的训练性能提升方面发挥着重要作用。国内多数模型训练使用的中文数据占比已经超过60%,有的模型达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能快速提升。
   在人工智能时代,Token(通常所说的词元)是处理文本的最小数据单元。国家数据局局长刘烈宏介绍,2024年初,我国日均Token的消耗量为1000亿,截至今年6月底,日均Token消耗量已经突破30万亿,1年半时间增长了300多倍,反映了我国人工智能应用规模的快速增长。

来源:人民日报

免责声明:本网站部分信息为互联网收集而来,如侵犯了您的版权,请与我们联系,我们会及时删除侵权内容,谢谢合作!

联系我们
  • 市场合作:hz@kolahr.com
  • 产品咨询:0551-64213051
产品
  • 自助入职
  • 组织人事
  • 假期管理
  • 审批管理
  • 薪酬管理
  • 行政管理
  • 招聘管理
  • 智能报表
资讯
  • 新闻动态
  • 产品动态
关于
  • 平台简介
  • 专利证书
  • 联系我们
加入HR互动社群
  • 您将定期收获:
  •   行业资讯
  •   经典案例
  •   活动微课
添加微信快速入群
Copyright © 2024 可拉熊软件科技(合肥)有限公司 版权所有    皖公网安备34010202601960号 皖ICP备2024034412号-2