一、项目核心信息
项目名称:江苏省医保可信数据空间(全口径参保人群生理信息数据共享平台)(一期)项目
招采单位:江苏省医疗保障局
中标单位:南京易联阳光信息技术股份有限公司
中标金额:569.64万元
二、项目建设内容:构建全流程医保数据共享生态
本项目核心目标是释放医保数据要素价值,促进医保数据与相关数据融合共享,支撑临床科研、医药研发等场景应用,提升医保治理水平与服务质量。建设内容围绕7大核心模块展开,形成从数据标准到安全共享的全链条体系:
(一)数据标准规范制定与贯标应用
建立覆盖数据表、字段、字典值的全维度数据标准体系,融合医疗、医保、医药及相关数据,确保数据一致性与可用性。
数据表标准:识别核心业务数据域,划分主题数据模型,明确数据表的业务含义、数据来源及参考标准,经审核修订后发布实施。数据字段标准:以医保业务数据标准为基础,借鉴卫生健康领域相关标准,统一字段中文名称、英文名称、数据类型、值域范围等属性,对已有权威标准的字段直接采纳或建立映射关系,无标准覆盖的业务数据按需新建。字典值标准:优先采用医保、卫健等权威部门发布的通用标准代码,对无通用标准的字典类型,结合业务实际新建,明确字典类型、代码名称、代码值及说明。贯标体系建设:对ICD、药品、耗材等主数据及字典值域进行贯标,制定《共享平台贯标组织体系建设》《共享平台贯标管理办法》等规范性文件,确保数据按统一标准入库。(二)专病库应用管理和服务平台
面向科研团队提供全流程管理服务,涵盖团队组织、数据使用、项目管理三大核心环节:
团队组织管理:支持个人、医院、院校等多类型用户注册认证,基于角色划分权限;提供团队入驻申请与审核功能,可查看团队基础信息,对停用或退出团队自动回收数据使用权限;团队负责人可新增、移除成员并分配角色,实现敏感数据操作的精细化权限控制。数据使用管理:参考国家及行业标准规范,对数据进行分级分类管控,支持敏感数据自动识别与业务类型解析;用户可检索权限范围内的数据资源,查看表结构、数据更新时间及质量可视化摘要(含数据总量、空值占比等),通过团队负责人发起使用申请,明确使用理由与时限,临时授权数据到期自动回收。医生工作站:提供可视化查询功能,支持多条件组合筛选与模糊筛选,用户通过拖拽字段、点选条件即可构建查询;支持自定义分析维度与度量指标,实现数据深度下钻,可调用算法工具集提升分析效率;提供柱状图、折线图等多种可视化图表组件,支持钻取、筛选等交互式操作。研究项目管理:支持项目全生命周期管理,包括项目申请审核、阶段化进度管控、成果归档发布等功能,成果类型涵盖研究报告、数据集、模型等,可按安全级别设置访问权限。(三)多模态基础数据库
实现多源异构数据的集中采集、存储与全流程管理,支撑结构化、半结构化及非结构化数据的统一归集:
多源异构数据接入:汇聚医疗保障参保信息、结算数据、费用明细等数据,以及诊疗领域电子病历、检查检验等数据,支持不同来源、不同格式数据的统一接入。统一数据目录管理:建立涵盖数据表名称、业务含义、数据来源、更新频率、数据级别等关键信息的数据目录,为数据管理与使用提供清晰视图。数据分层存储管理:按使用频率与时效性划分“热数据”与“冷数据”,高频使用的医保结算、诊疗数据部署在高性能存储环境,历史数据、归档病历等采用低成本存储,支持按需调取。数据全过程管理:建立覆盖入库、使用、降级、归档的全流程管理机制,通过时间规则、业务条件触发等方式实现数据自动化流转。(四)标准化结构数据库
基于多模态基础数据库,开展数据清洗、标化等处理,形成“一人一档”的全口径参保人群生理信息数据库:
标准化结构数据模板管理:覆盖患者基本信息、既往史、门急诊病历、住院病案、医保结算等12类子模板,检查检验类模板向下穿透至指标层级(如血脂项目包含总胆固醇、甘油三酯等指标),支持模板全生命周期管理与快速检索。数据提取与清洗:支持本地文件同步、数据库同步、API接口同步等多种提取方式,提供全链路监控功能;集成智能补齐与映射功能,自动处理错误值、缺失值与重复记录,支持清洗规则可视化配置与效果验证。数据标化与标注:归集医保、卫健等行业标准,建立不同体系编码标准映射关系(如ICD编码关联映射);支持文本分类、图像分割、语音识别等多模态数据标注,集成医保垂直大模型提升标注效率与准确性。数据质控与分析:配置数据完整性、准确性等关键维度的质量规则与评价指标,自动执行检核任务并生成可视化报告;从人口学、疾病临床、治疗相关、预后情况四大维度开展人群特征宏观分析。(五)部分病种专病数据库
先期建设6类病种专病数据库,形成可复用的建设范例:
通用数据模板:从标准化结构数据库模板中选取组合数据模块,快速构建结构化病种数据库模板,支持版本控制与回滚。病例纳排与实体提取:制定统一的病例纳入与排除标准,支持定制化条件设置与智能化筛选;集成医保垂直大模型,基于自然语言处理技术从医疗文书中提取疾病诊断、手术操作、用药医嘱等结构化数据。专病与亚病种数据库:经病例纳排、实体提取后,数据自动填充至临床病例报告表(CRF),形成糖尿病、高血压、阿尔茨海默、肺癌、胃癌、乳腺癌6类病种专病数据库,并基于其特点制定亚病种数据库,适配临床科研与医保治理需求。全景分析功能:提供病种、患者、药品耗材三大全景视图,支持跨中心患者去重统计、患者诊疗轨迹追踪、医药产品综合价值评估等分析场景。(六)数据模型算法工具集
提供多样化模型算法,降低用户使用门槛:
算法清单覆盖数据统计分析(离散程度、集中趋势)、时间序列预测(ARIMA、LSTM)、聚类分析(决策树、随机森林)、异常检测(孤立森林、自编码器)等类型,用户可快速检索适配算法。支持基于分析场景与目标的算法推荐,通过前端界面实现数据导入、参数配置与一键调用,自动返回结果。建立算法效果评价机制,用户可对输出结果的实用性与准确性进行评价,系统根据反馈优化算法清单。(七)数据共享安全管理体系
构建安全、合规、可监管的数据共享机制:
共享权限管理:明确可共享数据范围,对各级各类数据进行分级授权,实现统一发布与授权管理。数据脱敏管理:提供替换、遮蔽、泛化、假名化、加密等多种脱敏规则,针对不同病种与数据类型配置脱敏项,保障数据脱敏后业务逻辑完整性。数据共享方式:提供数据共享目录查询、检索、申请、下载、订阅等功能,支持有序共享与安全开放。数据使用监管:实现数据共享全流程日志留痕与溯源分析,提供数据溯源管理、使用日志管理等功能。三、关键洞察(KeyInsights)
数据治理标准化是核心前提:项目构建了从数据表到字典值的全层级标准体系,通过贯标应用打破医保与卫健等领域的数据壁垒,为数据共享与分析奠定基础,这也是政务数据要素化改革的核心方向。AI大模型深度赋能医疗数据处理:医保垂直大模型的应用贯穿数据标注、实体提取、算法推荐等关键环节,显著提升非结构化数据处理效率与准确性,成为医疗数据价值释放的重要技术支撑。国产化适配与安全合规并重:项目明确要求适配国产操作系统、CPU及数据库,满足等保2.0三级安全要求,通过源代码安全扫描、应急演练等多重措施保障数据安全,契合当前政企信息化建设的核心诉求。服务保障体系完善且刚性:首年配备12名驻场数据工程师与2名技术工程师,提供7*24小时运维服务,明确故障响应与解决时限(一级故障4小时内解决),通过“15分钟响应、24小时闭环”机制保障系统稳定运行。项目具有强示范效应:先期建设的6类病种专病数据库与标准化建设流程,为后续扩展更多病种、扩大数据覆盖范围提供了可复用的模式,将加速医保数据在临床科研、医药研发等领域的应用落地。“数说123之江苏”是北京数说政通科技有限公司旗下自媒体矩阵“数说123”子账号,依托数据、情报、自媒体、资源为省、市、县三级数政局、运营商、国有数智平台公司、系统集成公司提供招投标数据定制、商机捕获、市场洞察、行业对标、生态与渠道建设、解决方案提供、自媒体宣传与账号运营等专业服务。