由于本人个人的一些原因,距离上次更新文章已经有很长时间了。在此向大家说一声抱歉。之前有关GO注释的文章里,有读者咨询,是否有批量查找基因GO注释的方法。本期,本人就给读者推荐一个非常实用的,完成基因GO批量注释的网站。
david在本人入行期间可谓称霸一方,目前搜索应用david网站(链接:https://www.molecularecologist.com/2016/05/poorly-updated-databases-will-affect-your-results/)进行分析的文章也是相当的。当然,David的成功并不是空穴来风的。作为测序时代来临之前的芯片时代,最为知名的注释工具,老资历和高引用率是其称霸在线注释圈的资本。但是David这几年存在一个非常可怕的问题,就是目前这个网站实在更新得太不及时了。
看着david这复古的界面风格,就可以看出来,借着高引用率这个金字招牌,david运营方在功能更新上基本不在意。 。这个现象的一个深层次原因,还是科研论文发表的体制问题。对于编辑而言,叫他们实时跟进这种在线数据库更新问题其实根本不太可能,而科研工作者,为了能毕业等原因,依从先例又是最为稳妥的解决方案,所以david这种占着大量用户,但是不更新的网站才能大行其道。
抛开数据库更新速度“感人”这点之外,david网站提供的功能还是很全面的。除了ID转换、KEGG、Biocarta数据库注释,数据导出等功能。对于不是专门搞基因组的用户来说,已经涵盖了其全部需求。
那有没有更新迅速,并且功能强大的基因注释网站呢?当时是有的,这就是g:profiler。
g:profiler 的网址是https://biit.cs.ut.ee/gprofiler/gost 是一个目前更新比较及时的基因功能注释网站,其中包含多个物种,除了医学常用的人和鼠的基因组之外,还收录了其他很多动植物。
相比其他功能相对单一的基因注释网页工具,g:profile还整合了基因富集功能和可视化弄能,对于相对简单的问题可以直接完成一站式分析(也就是从数据输入,到图表产出)