南方医科大学基础医学院导师:余光创
[通讯方式]
电子邮件:gcyu@connect.hku.hk
[个人简述]
本人一直致力于开发基础性的生物信息学分析软件,推动学科的发展,为生物学家提供易于使用的软件,让计算分析服务于高通量的生物学数据,整合生物学数据和知识,挖掘更深层的生物学意义。本人所开发的软件涵盖生物学和生物信息学的多个领域,同时也被应用于更广阔的领域中(包括被整合于其它软件或分析流程中), 其中GOSemSim软件包为首次实现图结构算法应用于语义相似性度量的R包,文章于2010年发表在Bioinformatics上,被ESI收录为高被引论文,SCI引用231次,并广泛应用于多个生物信息学分析领域,包括:疾病和药物分析、基因蛋白功能分析、表达谱数据处理、蛋白质相互作用、模体分析和非编码RNA分析等,未来我将扩展其功能以应用于微生物组学的新基因蛋白的功能预测和注释。clusterProfiler包是目前功能最为丰富的通路分析软件,支持超几何模型和基因集富集分析,支持基因本体(支持多个物种,可在线检索数据)、KEGG代谢通路(使用在线最新数据,支持超过4000个物种)、Reactome通路、Broad Institute的分子印记数据库以及用户自己的注释文件(新物种电子注释或者是定制注释库),并提供多种可视化方法辅助结果解析,文章于2012年发表于OMICS,是OMICS杂志第一高被引文章,同时也被ESI收录为高被引论文,SCI引用455次。
在生态和进化领域,也开发了几个具有创新性的软件,treeio包把各种进化树文件格式和软件输出带给R社区,允许用户使用R的统计学功能进行后续的分析和进化推断,并且treeio首次引入了合并树的功能,使得不同的进化软件分析结果得以整合,数据的整合为后续的比较分析和整合分析提供了基础。ggtree软件允许多种数据整合(包括软件分析结果和实验数据)对进化树进行注释,开创性地在进化领域中引入了图形语法,通过图层组合可以容易地产生复杂的进化树注释,ggtree的可视化产生的是可操作的图形对象,让定制、修改、加减图层等操作易于实现,ggtree开创性地提供了多种可视化功能,包括探索性的可视化操作树功能、展示表型数据的二维树等。根据Altmetric评价系统,ggtree的almetric指数是327,在所有研究中排名前0.2%,于2017年发表在Methods in Ecology and Evolution杂志中的排名是31163,被ESI收录为高被引论文和热点论文,SCI引用111次。
随着测序数据通量的快速增长,新的参考序列也越来越多,为了解决新序列产生需要重新构建进化树问题(计算量大),我提出了将新序列插入到已有的进化树上的算法,该算法利用最大似然法预测祖先节点的序列并应用简约法寻找新序列的插入位点,并且估计了新引入分支的支长。这是首次提出通过引入新序列而非从头构建进化树的方法,文章目前正准备投稿中。
目前基因组拼装算法不管是基于参考序列还是无参考序列的从头拼装都是针对单一物种,而无法解决共感染样品的拼装,针对这一问题,我设计了利用进化树指导拼装的算法,通过进化关系来区分测序片段,即使是序列相似性很高的病毒株,也能得到很好的区分。这一方法对于流感病毒监测具有重要的意义,可以区分共感染的病毒株,而共感染是产生重组的基础,也可能由此而产生大暴发的病毒株。
综上所述,本人开发的软件具有开创性和基础性(被应用于其它软件和分析流程中)、受欢迎(下载量大,altmetric指数高)等特点,相应发表的文章也具有较高的引用(目前有4篇第一作者的文章被ESI收录为高被引论文,其中一篇为ESI热点论文,有两篇文章SCI引用超过200)。
[科研工作]
[教育背景]
添加南方医科大学学姐微信,或微信搜索公众号“考研派之家”,关注【考研派之家】微信公众号,在考研派之家微信号输入【南方医科大学考研分数线、南方医科大学报录比、南方医科大学考研群、南方医科大学学姐微信、南方医科大学考研真题、南方医科大学专业目录、南方医科大学排名、南方医科大学保研、南方医科大学公众号、南方医科大学研究生招生)】即可在手机上查看相对应南方医科大学考研信息或资源。
本文来源:http://m.okaoyan.com/nanfangyikedaxue/yanjiushengdaoshi_535116.html