科技日报北京1月16日电 (实习记者张佳欣)近日发表在《自然·方法》杂志上的一篇新论文中,美国加利福尼亚大学圣克鲁斯分校(UCSC)的研究人员介绍了有史以来第一种使用“泛转录组”分析全基因组RNA测序数据的方法。
分析一个人的基因表达需要将他的RNA图谱映射到一个标准参照物,以深入了解基因在多大程度上“开启”并在体内发挥功能。但当参照物不能提供足够的信息来进行准确映射时,研究人员可能会遇到问题,这被称为参照偏差。由UCSC生物分子工程副教授本尼迪克特·帕特恩领导的一组科学家发布了一个工具包,允许研究人员将个人的RNA数据映射到一个更丰富的参照物上,解决参考信息的偏差,并带来更准确的映射。
研究人员表示,泛基因组和转录组的结合在此前从未真正完成过,这是第一次有人尝试将泛基因组作为RNA测序图谱的标准特征。该工具将帮助世界各地致力于通过RNA测序分析了解基因表达的研究人员。
“有了这个工具包,我们正在利用从泛基因组获得的更多样化的数据来改进基因表达数据的测量,这一点在个体之间可能会有很大的差异。”帕特恩说,“这样做的目的是让人们在关注基因表达的研究中感受到更多样化的数据的影响,从而更好地分析细胞模型、有机体模型和其他研究应用。”
绘制RNA测序数据以了解基因表达可能很困难,因为RNA序列是由细胞机制拼接而成的,这意味着一组RNA数据可能来自基因组的非连接区域,这使得将它们正确地与参照物对齐成为一种挑战。这些剪接点在人类群体中因人而异并不统一,也很难知道RNA来自哪个单倍型。
利用新的开源工具,研究人员可获取个体RNA的拼接片段,绘制它们在泛基因组上的排列位置,确定数据属于哪种单倍型,并分析基因表达。