我想创建与web前方的rRNA序列数据库结束对我在工作实验室,似乎在生物学中常见到要搜索大量使用比对算法如BLAST和HMMER序列的,所以我想知道是否有任何现有的PHP / Python的/导轨,使容易与网站的搜索表单创建一个通用序列数据库的项目?

<强>更新 GMOD 是服务器的我正在寻找的类型。我还建议看 BioMart 太看起来有类似的功能。

有帮助吗?

解决方案

东西少一些准系统是 http://gmod.org/ - 最简单的安装应该给你一个爆炸形式与“序列浏览器”界面。 不知道那里有一个HMMER形式尚未...

(鳞片很好 - 从简单的源码到一个真正的数据库)

另外,你可能想看看银河系服务器。 http://main.g2.bx.psu.edu/ 结果 它的第一个目标是使复杂的基因组查询,便于非计算的人,但我不知道是否有一个爆炸开箱

欢呼声, 的Yannick


更新 - 通过这个帖子的启发,我们正在开发一个简单的局部爆炸服务器作为一个易于部署的替代wwwblast 。正在进行的 http://www.sequenceserver.com 工作。一个演示服务器,您可以 BLAST蚂蚁基因组的。

其他提示

这将是矫枉过正可能,但.... NCBI有很多可用的软件。 链接

在特别地,

有一个简单的CGI前端与NCBI BLAST软件包分布为好。

:你可以从他们的FTP站点,这是在这里下载

ftp://ftp.ncbi.nih.gov/

这不是任你正在谈论的语言的,但有bioperl的,这是专门针对DNA和RNA等酸和蛋白质基制成的功能的集合“编程”

寻找它CPAN.org

我强烈建议在生物信息学领域接触。最重要的是设计数据库,并决定其用途。您在文本标题,但rRNA基因DNA提 - 这是完全不同的事情。如果它只是一个错字,罚款 - 但如果你不理解的差异然后与社区群众说话

由于我参与社区你可能想联系MyExperiment社区(的http:// en.wikipedia.org/wiki/MyExperiment ),并提到我的名字,如果你需要。你会发现很多友好的人民和帮助。

更新我刚刚注意到你是从曼彻斯特,这就是MyExperiment的枢纽所以它真的是明显的地方开始!

关于GMOD:我比较肯定的GMOD是应用程序的完整矫枉过正。 GMOD不是服务器,它是一个工具集合,数据库模式(CHADO)是其中之一,而Chado是不是真正的人谁大多都会有序列和IDS。 BioMart不是一个服务器或者,它是一个工具,允许模型数据库去规范化,以能够运行全基因组的查询速度不够快。其中BioMart客户端(MartView)自带的Web界面。你肯定不希望在目前使用Biomart,但我可以通过电子邮件详细解释一下。 我的印象中,你最好一个基于Web的客户端BLAST得到第一次开始。

银河:银河不是一个数据库,它与工具将网站与(主要是DNA)从基因组不同的序列工作。银河紧密地与UCSC基因组浏览器的序列,工具和fileformats联系。所以,如果你想创建全新的序列数据库,星系是不适合你。它不包括任何BLAST服务器无论是。如果你想创建序列数据库,CHADO作为GMOD的一部分接近,但我宁愿开始使用文本文件上手,见上面我的帖子。

也许你可以看看 Plone4Bio

Plone的是用Python编写的扩展的内容管理引擎,有很多的功能和易于使用的应用程序,让您可以通过使用像论坛模块的集合建立自己的网站,产品,新闻,等...(我知道你已经知道这一点,但它只是给一点背景知识)。

Plone4Bio 是旨在为生物信息学一些Plone的应用...我不知道多少该项目推进,我还没有使用它,但似乎至少你有一个序列对象和一些应用程序的可视化它,可能是一些应用软件,搜索他们。 (P.S.他们使用它在UNIPROT - 看任何膜蛋白的“第三方数据”部分)

我不知道针对生物信息学任何其他CMS应用程序,但也许你也可以很容易地实现与Django的东西没有太多的精力。

有没有什么格式的信息的想法将被存储在,或如何显示的DNA序列(它只是一个长字符串?),你可能能够简单地将每个DNA序列插入到MySQL数据库脱身和然后执行一个简单的查询,如:

SELECT * FROM `dna_table` WHERE `sequence` = $sequence;

请确保您使用转义字符串或参数化查询(防止SQL注入),但除此之外,这听起来像一个非常简单的DB计划,不应该比约100行代码等等。

我同意:你应该张贴您的问题bbb@bioinformatics.org或bioperl的邮件列表

问题“轻松创建一个网站的搜索形式的通用序列数据库”,似乎过于笼统。序列数据库(ID,序列)的列表,并通过本身并不需要任何工具支持。至少我看不出有任何理由,你为什么会需要一个工具。

我觉得你的问题是:有没有一个BLAST客户端作为一个可以安装在本地的网页表单?有一些:计划可能值得一试,虽然我从来没有运行它。的BioPerl有独立的BLAST执行对象(的http:// doc.bioperl.org/releases/bioperl-1.0/Bio/Tools/Run/StandAloneBlast.html ),并且可以以图形方式显示结果。于Debian / Ubuntu地中海具有NCBI-工具-bin和NCBI-rRNA的数据,其安装所需的工具和数据库在几秒钟。

而不是琢磨工具的支持,我宁愿砍一起与输入序列上,你有,然后看用户是不是已经高兴的是,FASTA文件执行爆炸10行CGI脚本。

关注编程语言:如果你喜欢,你可以用一个shell脚本(*)做到这一点。这甚至可能把你比发帖时间少计算器... ;-)

(*)注意偏执计算机科学的同事:这将是生物学家的内部应用程序,谁也不知道操作系统和操作符重载之间的区别,所以SQL注入是非常非常不可能的......

我觉得这是一个例子过早的优化是邪恶的是,在那你可以失去大量的时间与设计太复杂,一个简单的任务系统中的意义。在敏捷编程的精神,如果你喜欢的软件工程专业术语,你可能只是黑客的东西在一起,然后思考架构之前尝试在你的用户。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top