神经影像实验数据采集流程。中科 中科院自动化所 供图
中新网北京10月9日电 (记者 孙自法)中国科学院自动化研究所(中科院自动化所)9日向媒体发布信息说,院团语同影像该所自然语言处理研究组历时近两年,队发大规采集处理完成迄今国际上规模最大、布国步多包含信息最丰富的际最集汉语同步多模态神经影像数据集,并于近日正式对外发布。模汉模态
该数据集覆盖了近万个汉语词汇,神经数据是中科当前国际上最大规模的用于脑语言处理机制研究的多模态同步神经影像数据集。其相关研究成果论文已在《自然》(Nature)旗下专业学术期刊《科学数据》(Scientific Data)发表。院团语同影像
据中科院自动化所自然语言处理研究组介绍,队发大规大脑在加工语言时,布国步多需要实时调动多个脑区的际最集神经元进行协同工作。构建高时空分辨率的模汉模态神经影像数据可以帮助人们更好地了解各个脑区以及脑区之间的协同合作,对于研究大脑的神经数据语言加工机制至关重要。
当前已有的中科开源数据主要针对英文采集,只包括单一模态的神经影像数据,如高空间分辨率的功能核磁共振(fMRI)或高时间分辨率的脑磁图(MEG),并且大多使用1小时以内的实验材料,数据规模有限,无法借助数据需求量大的计算模型进行更全面、更深入的大脑语言加工机制探索。
为突破上述问题,该研究组历时近两年采集处理完成目前国际上规模最大、包含信息最丰富的汉语同步多模态神经影像数据集,针对12个被试收听约6个小时故事时的功能核磁共振(fMRI)、脑磁图(MEG)、每个被试的T1/T2加权结构像、扩散磁共振成像(diffusion MRI)和静息态核磁共振(resting MRI)数据采集整理而成。为了便于利用计算模型进行脑语言处理机制的研究,所有故事材料都由人工标注了句法结构树,计算了文本中每个词汇对应的音频时间点、词频以及多种不同字和词汇的向量。同时,所有测试指标均超越或可比于已有的同类数据集,具有充分的质量保证。
实验材料对应的标注信息。 中科院自动化所 供图中科院自动化所自然语言处理研究组表示,目前国际最大规模汉语同步多模态神经影像数据集的公开发布,可以为全方位研究大脑在真实场景下理解词汇、短语和句子时如何调动不同脑区以及不同脑区之间如何协同工作等科学问题提供重要支撑。
特别值得注意的是,该数据集覆盖了近万个汉语词汇,这不仅对于研究大脑理解汉语的认知机理具有重要意义,而且将在探索自然语言计算模型与人脑语言处理机制之间的关系,研究如何利用神经影像数据提升现有语言计算模型的性能,从而构建新一代受脑启发的神经语言模型等一系列工作中发挥显著作用。(完)
>友情链接: 高端向左低价向右 地板市场消费分层正黄·翡翠云庭惊艳绽放门窗平民化 低端价格成国民宠儿橱柜企业微信营销首先要明确受众定位挖掘市场服务需求 橱柜企业重组品牌赢利模式市工商局“三举措”齐发力 护航我市首届熊猫灯会提高组织工作科学化水平发挥资源优势 巩固创建成果市场现整木家装热 木门企业转型之路要步步为营好吓人! 6座商务车“塞”进28人 司机将面临刑事处罚患上肾结石 求医路一波三折 碾转到仁康 除结石一身轻松南外环线中段建成通车 道路宽敞美观橱柜企业微信营销首先要明确受众定位紧跟消费渠道变化 橱柜品牌营销需形成互动木门行业不断涌入新的血液 营销道路越走越远紧跟消费渠道变化 橱柜品牌营销需形成互动欧洲塑料原料成本高涨 需求下落橱柜企业谋深度发展 抓好标准文化两利器围绕村集体经济发展建言献策倡导绿色消费理念 营造放心舒心消费环境挖掘市场服务需求 橱柜企业重组品牌赢利模式地板电商小心在“刷”出来的排名中迷失雅安消防十项便民服务举措落地惠民今年我市春茶采摘期推迟 单价创新高橱柜跨界联盟更趋活跃 品牌合作成有效增值工具今年我市春茶采摘期推迟 单价创新高擦亮“火眼金睛” 维护合法权益工人工资上涨 卫浴改善生产环境留人才地板品牌集中加强 企业需学会以共享盈利钢价维持久跌之后 将转为上涨幅度不大橱柜跨界联盟更趋活跃 品牌合作成有效增值工具橱柜跨界联盟更趋活跃 品牌合作成有效增值工具木门行业不断涌入新的血液 营销道路越走越远倡导绿色消费理念 营造放心舒心消费环境橱柜企业抓住年会时机 加强经销商的品牌认同感紧跟消费渠道变化 橱柜品牌营销需形成互动搞好“菜篮子” 摘掉“穷帽子”钢市开局不利跌势延续市工商局“三举措”齐发力 护航我市首届熊猫灯会五金挂件市场饱和 竞争力仍显乏力