本报讯 (记者张嫱)近日,国家数据局在《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》中,首次提出“探索词元交易等新型交易模式”。华通集团所属青岛数据集团紧跟关于词元交易的战略部署,依托青岛在全国率先建立的行政事业单位数据资产管理与收益分配机制,完成了从“计条数”到“算词元”的范式演进,落地了全国首个词元计量收益分配体系。
“传统数据流通交易一直面临计费难题,数据有的是结构化的单值字段,有的是非结构化的长文本、表格或图像,按‘条’或‘字段’计费,无法准确度量数据量的多少,更无法体现数据的真实价值。”青岛数据集团首席数据官、青岛数据资产登记评价中心主任赵传启对此感触颇深,“数据要素市场要真正流动起来,必须破解多源数据融合分账这一难题。而解决之道,恰恰在于引入词元作为数据价值的基本计量单位。”
在这一逻辑下,青岛数据集团落地了全国首个词元计量收益分配体系,将各类数据转化为统一的词元单位进行价值核算。为确保平稳过渡,青岛数据集团采取了“字段计量+词元计量”双轨并行策略,以两者的加权平均值作为最终贡献量。
以医疗数据为例,在转化为词元单位时,只保留性别、年龄、病种等用于模型训练的特征值,实现原始数据“可用不可见”,既消除了隐私泄露风险,又为精准计量扫清了障碍。在此基础上,通过加权系数体现不同数据的稀缺性与重要性。比如,常见病种如高血压,数据的系数设为1.2,而罕见病种如肌肉萎缩症,数据的系数可设为3.0,从而在收益分配中体现差异。
这套机制试运行以来,高价值数据集占比已超过40%,较去年同期增长了两倍以上。后续,青岛数据集团还将在词元收益分配机制基础上,进一步探索词元交易的市场化路径。
北疆新闻 | 内蒙古自治区重点新媒体平台,内蒙古出版集团•内蒙古新华报业中心主管主办的国家互联网新闻信息采编发布服务一类资质平台。
北疆新闻版权与免责声明:
一、凡本站中注明“来源:北疆新闻”的所有文字、图片和音视频,版权均属北疆新闻所有,转载时必须注明“来源:北疆新闻”,并附上原文链接。
二、凡来源非北疆新闻的新闻(作品)只代表本网传播该消息,并不代表赞同其观点。
如因作品内容、版权和其它问题需要同本网联系的,请在见网后30日内进行,联系邮箱:bjwmaster@163.com。
版权声明:北疆新闻版权所有,未经书面授权,不得转载或建立镜像,违者依法必究。 本站违法和不良信息举报电话:15648148811蒙ICP备16001043号-1
Copyright © 2016- 北疆新闻 All Rights Reserved互联网新闻信息服务许可证:15120200009-1广播电视节目制作经营许可证:(蒙)字第631号蒙公网安备:15010502001245