是否有与网站前端创建一个通用的DNA序列数据库中的任何现有的解决方案？

https://stackoverflow.com/questions/1890285

19-09-2019
|

题

我想创建与web前方的rRNA序列数据库结束对我在工作实验室，似乎在生物学中常见到要搜索大量使用比对算法如BLAST和HMMER序列的，所以我想知道是否有任何现有的PHP / Python的/导轨，使容易与网站的搜索表单创建一个通用序列数据库的项目？

<强>更新： GMOD 是服务器的我正在寻找的类型。我还建议看 BioMart 太看起来有类似的功能。

解决方案

东西少一些准系统是 http://gmod.org/ - 最简单的安装应该给你一个爆炸形式与“序列浏览器”界面。不知道那里有一个HMMER形式尚未...

（鳞片很好 - 从简单的源码到一个真正的数据库）

另外，你可能想看看银河系服务器。 http://main.g2.bx.psu.edu/ 结果它的第一个目标是使复杂的基因组查询，便于非计算的人，但我不知道是否有一个爆炸开箱

欢呼声，的Yannick

更新 - 通过这个帖子的启发，我们正在开发一个简单的局部爆炸服务器作为一个易于部署的替代wwwblast 。正在进行的 http://www.sequenceserver.com 工作。一个演示服务器，您可以 BLAST蚂蚁基因组的。

其他提示

这将是矫枉过正可能，但.... NCBI有很多可用的软件。链接。

在特别地，此。

有一个简单的CGI前端与NCBI BLAST软件包分布为好。

：你可以从他们的FTP站点，这是在这里下载

ftp://ftp.ncbi.nih.gov/

这不是任你正在谈论的语言的，但有bioperl的，这是专门针对DNA和RNA等酸和蛋白质基制成的功能的集合“编程”

寻找它CPAN.org

我强烈建议在生物信息学领域接触。最重要的是设计数据库，并决定其用途。您在文本标题，但rRNA基因DNA提 - 这是完全不同的事情。如果它只是一个错字，罚款 - 但如果你不理解的差异然后与社区群众说话

由于我参与社区你可能想联系MyExperiment社区（的http：// en.wikipedia.org/wiki/MyExperiment ），并提到我的名字，如果你需要。你会发现很多友好的人民和帮助。

更新我刚刚注意到你是从曼彻斯特，这就是MyExperiment的枢纽所以它真的是明显的地方开始！

关于GMOD：我比较肯定的GMOD是应用程序的完整矫枉过正。 GMOD不是服务器，它是一个工具集合，数据库模式（CHADO）是其中之一，而Chado是不是真正的人谁大多都会有序列和IDS。 BioMart不是一个服务器或者，它是一个工具，允许模型数据库去规范化，以能够运行全基因组的查询速度不够快。其中BioMart客户端（MartView）自带的Web界面。你肯定不希望在目前使用Biomart，但我可以通过电子邮件详细解释一下。我的印象中，你最好一个基于Web的客户端BLAST得到第一次开始。

银河：银河不是一个数据库，它与工具将网站与（主要是DNA）从基因组不同的序列工作。银河紧密地与UCSC基因组浏览器的序列，工具和fileformats联系。所以，如果你想创建全新的序列数据库，星系是不适合你。它不包括任何BLAST服务器无论是。如果你想创建序列数据库，CHADO作为GMOD的一部分接近，但我宁愿开始使用文本文件上手，见上面我的帖子。

也许你可以看看 Plone4Bio 。

Plone的是用Python编写的扩展的内容管理引擎，有很多的功能和易于使用的应用程序，让您可以通过使用像论坛模块的集合建立自己的网站，产品，新闻，等...（我知道你已经知道这一点，但它只是给一点背景知识）。

Plone4Bio 是旨在为生物信息学一些Plone的应用...我不知道多少该项目推进，我还没有使用它，但似乎至少你有一个序列对象和一些应用程序的可视化它，可能是一些应用软件，搜索他们。（P.S.他们使用它在UNIPROT - 看任何膜蛋白的“第三方数据”部分）

我不知道针对生物信息学任何其他CMS应用程序，但也许你也可以很容易地实现与Django的东西没有太多的精力。

有没有什么格式的信息的想法将被存储在，或如何显示的DNA序列（它只是一个长字符串？），你可能能够简单地将每个DNA序列插入到MySQL数据库脱身和然后执行一个简单的查询，如：

SELECT * FROM `dna_table` WHERE `sequence` = $sequence;

请确保您使用转义字符串或参数化查询（防止SQL注入），但除此之外，这听起来像一个非常简单的DB计划，不应该比约100行代码等等。

我同意：你应该张贴您的问题bbb@bioinformatics.org或bioperl的邮件列表

。

问题“轻松创建一个网站的搜索形式的通用序列数据库”，似乎过于笼统。序列数据库（ID，序列）的列表，并通过本身并不需要任何工具支持。至少我看不出有任何理由，你为什么会需要一个工具。

我觉得你的问题是：有没有一个BLAST客户端作为一个可以安装在本地的网页表单？有一些：计划可能值得一试，虽然我从来没有运行它。的BioPerl有独立的BLAST执行对象（的http：// doc.bioperl.org/releases/bioperl-1.0/Bio/Tools/Run/StandAloneBlast.html ），并且可以以图形方式显示结果。于Debian / Ubuntu地中海具有NCBI-工具-bin和NCBI-rRNA的数据，其安装所需的工具和数据库在几秒钟。

而不是琢磨工具的支持，我宁愿砍一起与输入序列上，你有，然后看用户是不是已经高兴的是，FASTA文件执行爆炸10行CGI脚本。

关注编程语言：如果你喜欢，你可以用一个shell脚本（*）做到这一点。这甚至可能把你比发帖时间少计算器... ;-)

（*）注意偏执计算机科学的同事：这将是生物学家的内部应用程序，谁也不知道操作系统和操作符重载之间的区别，所以SQL注入是非常非常不可能的......

我觉得这是一个例子过早的优化是邪恶的是，在那你可以失去大量的时间与设计太复杂，一个简单的任务系统中的意义。在敏捷编程的精神，如果你喜欢的软件工程专业术语，你可能只是黑客的东西在一起，然后思考架构之前尝试在你的用户。

许可以下： CC-BY-SA 和归因

不隶属于 StackOverflow