山东省启动工业领域重点行业产业数据仓和知识语料库征集
2025年02月20日08:56 | 来源:大众日报 02版

记者从省工业和信息化厅获悉,为加快推动工业领域重点行业数据汇聚流通和创新应用,以“产业大数据+行业大模型”赋能特色优势行业数智化转型,2025年工业领域重点行业产业数据仓和知识语料库征集工作正式启动。省工业和信息化厅将组织专家或第三方专业机构对申报项目进行评审,重点评估产业数据仓和知识语料库的完整性、可用性和应用价值等,经公示无异议后予以公布。
数据仓、知识语料库可以被看作是人工智能产业发展的重要原材料。其中,产业数据仓的申报单位面向全省高端装备制造、新材料、新能源、新一代电子信息、绿色化工、生物医药、智能家电、食品加工等重点工业行业,包括行业通识和行业专识数据集。数据集类型包括结构化数据、文本、视频、音频、图形图像等多模态形式。知识语料库的申报单位聚焦工业研发、设计、生产、管理、服务等关键环节和特定场景,通过收集生产流程描述、设备运行数据、工艺参数、质量检测报告、故障诊断记录、供应链信息、企业管理文档等语料资源,对语料进行清洗、去噪和统一格式,并对整理后的语料进行标注,形成直接用于行业大模型或场景大模型开发、训练和微调的高质量语料库,类型包括各类文本、表格、图像、音频、视频等。
省工业和信息化厅将建立项目库,对未覆盖的细分行业和领域,滚动开放补报通道,并将联合行业协会、产业联盟等举办“人工智能应用专场对接会”系列活动,将符合推广条件的数据仓和知识语料库面向大模型企业进行全省推广,择优推荐申报国家级示范项目。(付玉婷)
(责编:刘颖婕、邢曼华)
分享让更多人看到
- 评论
- 关注