90%科研数据浪费!中国新系统几分钟盘活保数据价值成果不白做
全球每年产生的科研数据里,90%的data还没派上用场,就悄摸摸躺在实验室的硬盘或文件柜里,最后彻底“沉睡”。
更可惜的是,每100个数据集中,80个会被困在实验室里没法共享,就算有20个能拿出来,符合国际FAIR标准的还不到2个,最后真能催出新发现的,往往就1个。
说起来,这种浪费对中国科研人其实更有感触,咱们不少实验室都遇过类似问题,熬夜测的实验数据、跑了半年的田野调查结果。
项目一结束就存进硬盘,想共享给其他团队却没合适工具,最后只能落灰,反观国外,很多实验室也面临同样困境,可为啥中国能更快找到破局办法?
答案就藏在一套能“盘活”数据的新系统里,先说说数据浪费的影响,其实早渗透到咱们身边了。
医学领域里,癌症治疗想突破,就得靠大量临床数据整合分析,可过去不少医院的实验数据困在单个科室,没法互通,直接拖慢了新药研发的节奏。
气候科学方面,中国科学家想精准预测台风路径,却因为不同省份的气象数据格式不统一,模型缺了关键证据,预测结果总差那么一点。
就连基础研究里,有些实验因为原始数据没法重现,结论的可信度打折扣,后续团队还得走弯路。
Frontiers联合创始人KamilaMarkram博士说“90%的科学消失在虚空中”,这话放全球都对,但对正追科研前沿的中国来说,这种浪费更可惜。
毕竟咱们的科研人员,同样在为每一组数据熬大夜、花心思,好在今年10月13日,开放科学出版商Frontiers推出的FAIR²数据管理系统,给中国科研人送来了“解药”。
这是全球首个AI驱动的研究数据服务平台,有意思的是,它不是国外“水土不服”的工具。
中国早就有数据共享的基础了,比如国家科技资源共享服务平台,这几年一直在帮科研团队存数据、促共享,而FAIR²相当于在这个基础上“加了AIbuff”。
它的核心逻辑很实在,在国际FAIR原则之外,专门加了“AI兼容性”,既能让研究员轻松用,也能适配机器学习算法。
最让中国实验室团队惊喜的是效率,Frontiers旗下Senscience开发的AI数据管家,能把过去要花数月的人工活,压缩到几分钟搞定。
比如中国农业大学的一个团队,之前整理作物生长数据,3个人要忙3个月,现在提交给系统,不到10分钟就完成了分类、验证,还自动生成了元数据。
省出的时间,他们多做了两次田间实验,更关键的是,这个系统能让中国科研人的“付出有回报”。
以前不少人不愿分享数据,怕“自己做的数据被别人用,却没自己的份”,现在提交数据后,能直接拿到四样实用成果。
经过认证的数据包,不用再担心“数据不准”被质疑,能引用的数据文章,数据本身也算学术成果,评职称、报项目时都能用上。
带可视化和AI聊天功能的门户,比如中国环保领域的基层人员,不用懂复杂公式,看图表、跟AI聊两句就能明白环境数据。
还有FAIR²证书,相当于给数据发了“合格证”,其他团队用着也放心,Senscience联合创始人SeanHill博士说“每个数据集都被引用,每个科学家都得到认可”。
这话正好戳中了中国科研人的痛点,谁也不想自己的努力白费,而这个系统,正好能保住这份价值。
现在,FAIR²的价值已经在四个领域落地,每个都跟中国的科研需求贴得很近。
病毒学方面,SARS-CoV-2变异数据集整合了3800个刺突蛋白数据,还关联了结构预测和结合数据。
中国疾控中心的团队用它做分析时,原本要一周的工作半天就完成,还能快速对接国内其他实验室,为应对新变异做准备。
神经科学领域,343次脑损伤MRI扫描数据来自四个研究中心,以前因为协议不统一没法共熊猫体育直播平台用。
现在系统一标准化,中国医科大学的团队直接加入跨中心研究,生物标志物的发现速度快了不少。
环境科学上,覆盖43国1990-2050年的压力指标数据集,中国生态环境部在制定气候政策时,能直接对比国际数据,让方案更精准。
生态学领域的印太环礁数据集,涵盖280个环礁,中国科学院的团队用它研究南海珊瑚礁保护,不用再从零收集跨区域数据,省了大量时间。
这些效果也得到了学界的认可,而且评价跟中国科研人的使用感受特别像,巴斯克研究与技术联盟的ÁngelBorja说“能快速生成有用信息,格式对谁都友好”。
莱顿大学的ErikSchultes(还是GOFAIR基金会负责人)觉得系统“抓得住科研的本质”,这对看重严谨性的中国团队来说,是很重要的保障。
加州大学的NeilHarris提到“能客观查数据质量,帮非专家理解”,中国跨学科团队也受益。
比如医学和计算机团队合作时,不用再为“数据看不懂”吵架,推进得更顺,其实FAIR²对中国科研的意义,远不止“管数据”。
过去传统模式里,数据跟着项目结束“退休”,研究员没动力分享,现在有了数据引用和声誉激励,慢慢从“要我分享”变成“我要分享”。
OpenDataCommons主编MaryannMartone说“FAIR²降低了数据公平的障碍”,对中国来说,这意味着不管是北大、清华这样的大机构,还是地方高校的小实验室,都能公平用数据。
不会因为没能力管数据,就落后于人,对做科研的人来说,省出的时间能多做实验。
对科学界来说,数据流通起来了,中国的气候团队能跟国外同行快速共享数据,一起解难题。
对普通人来说,好处更实在,可能是癌症新药研发快一点,可能是极端天气预警准一点,这些都是数据“活”起来之后的连锁反应。
现在AI在科研里用得越来越多,FAIR²正好踩准了这个节奏,它不光解决了当下90%数据浪费的问题,还为中国未来的AI科研铺路。
只有数据标准化、能访问,机器学习才能真正用上这些“宝藏”,当更多中国团队用它盘活数据,咱们熬夜做的实验、辛苦收集的样本,就再也不会白忙活,每一份努力都能真正推动进步。
辽宁失联44小时女童被找到后父亲首度出镜发声:女儿仅有轻微的擦伤和磕碰伤,网上出现仿冒账号请不要上当
极目新闻记者 李迎见习记者 毕若雪10月17日上午,辽宁建平县4岁女童丁一失联44小时后被找到,关注此事的全国网友都松了一口气。当天,丁一被送往镇卫生院后,又转至朝阳市区的医院检查。
10月17日,前小米REDMI品牌总经理王腾转发REDMI手机官微推文并预祝“发布顺利、大麦!” 随后小米集团公关部总经理王化在该条博文评论区回复了“拥抱”表情,王腾也回复了“比心”表情。
网约司机酒驾 发生纠纷后逃逸,和朋友吹嘘:回家赶紧喝一口就没事了,交警:喝懵了吧!网约车都有行车记录仪 记者 刘航#北京 #交通安全
两千来吨 全生芽子了。懵逼了 #幸福乡村丰收季 #土地全程托管刘辉 #助农帮帮团 #三农耕耘计划
被开除军籍、持外国绿卡、骗财骗色,蒋大为身上的标签哪个是真的 #历史 #近代史 #人物 #人物故事
天神之眼这么厉害了,腾势Z9GTAEB躲过一场事故!#惊险时刻 #交通安全 #天神之眼 #智驾 #比亚迪
日产中国 40 周年品牌之夜,推插混 N6、天籁鸿蒙版、中国主导研发的全球首款插混皮卡 FRONTIER PRO,及月销破 6 千的纯电 N7,以 “电动 + 插混” 矩阵,进行“中国制造反哺全球” 的转型。
搜救人员讲述辽宁失联44小时女童被发现细节:距离失联地点约2公里,光着脚,见到家人后说“爷爷别怪我”
10月17日上午,失联44个小时的辽宁朝阳市建平县4岁女童已被找到,引发广泛关注。17日下午,现场一名搜救志愿者向极目新闻记者讲述了搜救细节,当时救援队先发现红衣服后人为找到孩子,孩子很安全,看到家人后说“爷爷,别怪我”,爷爷奶奶都哭了,见人就磕头,目前孩子在朝阳市中心医院检查。
据《广西日报》消息,10月17日,曹志强赴南宁、来宾调研工业经济运行情况,强调要因地制宜发展新质生产力,实事求是分析各地比较优势,积极抢抓人工智能发展机遇,要紧盯产业和科技前沿,做好“农头工尾”“接二连三”文章,不断提升产业竞争力、产品附加值。
据澎湃新闻消息,雷军在小米汽车成都事故后首次公开露面演讲。10月16日,世界智能网联汽车大会,小米CEO雷军在演讲中表示,智能网联汽车不是零和博弈,需要全行业的团结一致,共建共享智能网联汽车的新生态,共同推进行业发展。
