大数据在生物医学的应用研究
引言
生物医学是应用生物医学信息、医学影像技术、基因芯片、纳米技术、新材料等技术的学术研究和创新交叉领域。随着以“社会-心理-生物”为代表的大医学模式的提出和系统生物学的发展,形成了现代系统生物医学。在医学领域,我们正处在一个医学信息爆炸的时代。基因序列、各种医学图像、电子病历记录和多中心临床药物试验等领域每天产生大量的形式多样的数据,并呈爆炸式增长,使生物医学领域跨入网络化的大数据时代。而大数据时代的显著特征——大数据分析则是生物医学大数据中的重要组成部分之一,大数据分析的深入开展需要大数据储存的强力支持。
1 生物医学大数据研究的特点
大数据是一个时髦的词,但其背后的内涵与历史却非常深刻。大数据经历着从概念到小范围技术实践,最终到广泛接受并成为一个新兴研究方向的历程。2008年9月,Nature杂志率先出版了“大数据专刊”,表明大数据的影响已触及自然科学、社会科学和工程学的各个领域。而后与大数据关系密切的数据密集型科学发现范式已被确立和广泛认可,自此拉开了大数据研究的序幕。而2014年Science杂志推出“Bigbiologicalimpactsfr ombigdata”正式宣告生物学、医学的相关研究也进入了大数据时代。在大数据时代,庞大繁杂的数据以及对数据的研究对社会、科技、经济的发展将发挥支撑促进作用[1]。
大数据本身是一种潜在的战略性资源,具有小规模数据无法匹及的趋势预测潜力,大数据的分析和应用才能将这些资源的效益真正释放出来。美国、欧盟等已在国家和地区层面开展了大数据研究和发展计划,将大数据研究提升到国家和国际重大战略层面。2013年5月9日美国总统奥巴马签署了一项行政命令,要求政府帮助公众和企业更容易取得政府持有的数据,从而促进美国的创新和经济增长。谁掌握了大数据以及大数据的研究技术,谁就掌握了主动权。尤其是在生物医学等事关人类健康和命运的研究领域,对相关大数据的研究就是对健康领域未来的掌握。而从医学的角度来看,大数据技术需要借助高通量测序仪器、单细胞检测装备和实时动态图像系统为代表的生物分析平台进行数据挖掘。再具体到生物医学的大数据研究而言,大数据研究的特点体现如下:第一,生物医学数据量大。通常对于一个样本的人体基因组和转录组测序数据量会分别超过100和30GB,几乎一个人的数据量就要占满一部智能手机的内存。而考虑到一次试验中通常会涉及数百个甚至上万个人体样本,相关的数据量产出必然达到天文数字。第二,数据处理结果需要准确性和较快的处理速度。如个性化医疗就具有较高的时效性要求,而单细胞测序及诊断等对突变位点和功能模块的鉴别准确性要求较高。完成生物医学大数据挖掘的要求不仅如此,还有一些很重要的客观条件对于海量数据挖掘较为不利,比如生物医学的相关源数据来源多变且具有较大的异质性。生物医学数据的分析和解释通常会利用到NCBI系列等通用数据库以及UniProt等专业数据库,但不同的数据库存在异质性,会导致数据缺失、数据矛盾等问题的普遍存在,成为相关大数据整合与分析的瓶颈。即便如此,大数据研究依然如火如荼地进行,目前也已广泛地应用在生物医学研究领域。
2 大数据技术在生物医学领域应用的场景
一方面,随着计算机技术的不断发展,大数据应用和推广得到了快速的发展,在各个领域具有应用的价值。另一方面,生物医学研究的不断进步,对人类的生命健康做出了巨大的贡献,但随着人们的生活水平提高,生物医学相关知识的普及,人们对医疗的要求也在与日俱增,更加注重个性化的医疗方案,精准医学等。大数据分析在医药领域,尤其是医药开发、疾病诊治、疾病危险因素分析、疾病发病预测、个体化的精准医学等方面具有重要意义[2]。
就目前看来,大数据分析技术在医药领域的应用大致可以分为两类:即大数据技术在医学上的应用以及大数据技术在药学中的应用,尤其以医学为主要应用主体,如大数据分析技术在基因生物学中的应用,具体包括致病基因路径分析、基因序列关联分析等;同时大数据分析技术可以应用在致病因素分析与疾病诊断和治疗中的。除此以外,大数据分析技术在疾病发病预测、医学影像分析、检验医学中均有应用价值;除医学本身之外,大数据分析技术还可以在医院管理中发挥作用。相对而言,大数据分析技术在药学领域中目前较少,例如大数据分析技术在新药研发中与副作用分析中扮演重要的角色,在不久的未来,必然覆盖的子研究更加广泛。
文章来源:《中国病原生物学杂志》 网址: http://www.zgbyswxzz.cn/qikandaodu/2021/0126/414.html
上一篇:浅谈纳米材料在生物学及医学领域的应用
下一篇:蔬菜食品安全中的生物学危害与控制