Our lab is working on the system analysis of multiple-omics data, including genome, proteome, transcriptomics, metabomics and other various types of omics data. We are trying to develop new computational methods for Next generation sequencing (NGS) mapping & assembling, analyzing biological networks, detecting protein complexes, predicting essential proteins and disease genes, identifying the associations about drug-target, miRNA-disease, lncRNA-disease, and drug repositioning.
本实验室以后基因组时代产生的海量生物数据为研究对象,通过对基因组、蛋白质组、转录组、代谢组等不同类型的组学数据的系统分析,深入挖掘其隐藏的数据特征和生物学特性,获得一些在传统算法技术中被忽略掉的重要参数,以参数化建模方法,结合启发式方法和多元信息融合技术,解决复杂生物数据处理中的相关热点和某些难点问题。具体研究内容包括:新一代测序技术下的序列拼接问题、复杂生物网络分析、蛋白质复合物识别、关键蛋白质与疾病基因预测、药物-靶标识别、疾病相关micRNA/lncRNA预测、药物重定位、遗传疾病的SNP位点发现、遗传影像等。以提出的各种新方法为基础,建立自主知识产权的相关软件处理平台,并将设计的面向生物数据特征的高效计算方法和软件处理平台推广、应用,为“精准医疗”等国际前沿研究和面向国家重大工程需求的高效计算方法研究提供新思路,推动计算机算法朝实用性方向发展。