為深入貫徹落實國家數據局、河北省數據和政務服務局關于高質量數據集建設有關工作部署,加快構建本市高質量數據集開發利用體系,進一步發揮數據要素對“人工智能+”的賦能作用,石家莊市數據局擬面向社會公開征集一批高質量數據集,有關事項通知如下。
一、征集要求
(一)征集范圍。重點圍繞我市五大主導產業(生物醫藥、新一代電子信息、先進裝備制造、現代食品、現代商貿物流)和重點特色產業集群,覆蓋領域包括但不限于科學研究、工業制造、農業農村、智慧能源、交通運輸、金融服務、醫療衛生、教育教學、商貿流通、人力資源、文化旅游、應急管理、氣象服務、綠色低碳、公共安全、城市治理等重點行業領域,以及低空經濟、智慧駕駛、具身智能、智慧海洋、生物制造等創新領域。
(二)數據集要求。
1.數據質量。數據集至少聚焦1個行業,匯聚跨區域、跨層級、跨機構的行業數據資源,可直接用于開發和訓練人工智能模型,能有效提升模型性能。數據集規模需達到一定量級,不低于50GB(非結構化數據)或10萬行(結構化數據)。數據模態包括結構化數據、文本、圖形圖像、音頻、視頻等。
2.應用推廣。數據集原則上至少應有1個實際已落地的應用場景,具備較強的推廣價值;暫未落地的,應有較為明確的潛在應用場景。同時應具備一定先進性、創新性、示范性和定期更新機制。數據集為已建或在建的項目均可申報。
3.安全合規。數據集應符合國家數據安全與合規相關要求,不涉及個人隱私、商業秘密和國家秘密等。同時數據集持有單位應有明確的數據權屬,流通和開發利用后可較為清晰地界定加工使用權、產品收益權,無產權糾紛。
(三)申報主體要求。申報單位應為在石家莊市內注冊的獨立法人單位,包括政府部門、企事業單位、科研院所、行業協會等。申報單位近三年經營狀況良好,在信用、質量、安全等方面無不良記錄。涉及多家單位的,可結合實際情況聯合申報。
(四)其他要求。申報單位報送的相關資料按照征集要求嚴格把關,提高案例質量,確保案例合規、真實,材料完整、可公開。
二、征集程序
(一)申報材料。請申報單位認真對照通知要求,填寫 《高質量數據集申報書》(詳見附件),以“單位名稱+高質量數據集”命名報送石家莊市數據局,申報單位涉及多個申報案例的,每個案例提交一份申報書。申報書電子版請于10月17日前發送至郵箱sjzsjjsjk@163.com。
(二)遴選推廣。石家莊市數據局擇優推薦至河北省數據和政務服務局,爭取政策支持,充分釋放典型示范作用。對于存在交易需求的數據集,將依托數據交易平臺進行產品化展示,以促進數據要素高效流通與合理利用。
三、聯系方式
聯系人及電話:湯淼,86688495;周雪怡,86687901
郵箱:sjzsjjsjk@163.com
聯系地址:石家莊市數據局2101辦公室(石家莊市中山東路216號)
石家莊市數據局
2025年9月30日