是否有与网站前端创建一个通用的DNA序列数据库中的任何现有的解决方案?
-
19-09-2019 - |
解决方案
东西少一些准系统是 http://gmod.org/ - 最简单的安装应该给你一个爆炸形式与“序列浏览器”界面。 不知道那里有一个HMMER形式尚未...
(鳞片很好 - 从简单的源码到一个真正的数据库)
另外,你可能想看看银河系服务器。 http://main.g2.bx.psu.edu/ 结果 它的第一个目标是使复杂的基因组查询,便于非计算的人,但我不知道是否有一个爆炸开箱
欢呼声, 的Yannick
更新 - 通过这个帖子的启发,我们正在开发一个简单的局部爆炸服务器作为一个易于部署的替代wwwblast 。正在进行的 http://www.sequenceserver.com 工作。一个演示服务器,您可以 BLAST蚂蚁基因组的。
其他提示
有一个简单的CGI前端与NCBI BLAST软件包分布为好。
:你可以从他们的FTP站点,这是在这里下载这不是任你正在谈论的语言的,但有bioperl的,这是专门针对DNA和RNA等酸和蛋白质基制成的功能的集合“编程”
寻找它CPAN.org
我强烈建议在生物信息学领域接触。最重要的是设计数据库,并决定其用途。您在文本标题,但rRNA基因DNA提 - 这是完全不同的事情。如果它只是一个错字,罚款 - 但如果你不理解的差异然后与社区群众说话
由于我参与社区你可能想联系MyExperiment社区(的http:// en.wikipedia.org/wiki/MyExperiment ),并提到我的名字,如果你需要。你会发现很多友好的人民和帮助。
更新我刚刚注意到你是从曼彻斯特,这就是MyExperiment的枢纽所以它真的是明显的地方开始!
关于GMOD:我比较肯定的GMOD是应用程序的完整矫枉过正。 GMOD不是服务器,它是一个工具集合,数据库模式(CHADO)是其中之一,而Chado是不是真正的人谁大多都会有序列和IDS。 BioMart不是一个服务器或者,它是一个工具,允许模型数据库去规范化,以能够运行全基因组的查询速度不够快。其中BioMart客户端(MartView)自带的Web界面。你肯定不希望在目前使用Biomart,但我可以通过电子邮件详细解释一下。 我的印象中,你最好一个基于Web的客户端BLAST得到第一次开始。
银河:银河不是一个数据库,它与工具将网站与(主要是DNA)从基因组不同的序列工作。银河紧密地与UCSC基因组浏览器的序列,工具和fileformats联系。所以,如果你想创建全新的序列数据库,星系是不适合你。它不包括任何BLAST服务器无论是。如果你想创建序列数据库,CHADO作为GMOD的一部分接近,但我宁愿开始使用文本文件上手,见上面我的帖子。
也许你可以看看 Plone4Bio 。
Plone的是用Python编写的扩展的内容管理引擎,有很多的功能和易于使用的应用程序,让您可以通过使用像论坛模块的集合建立自己的网站,产品,新闻,等...(我知道你已经知道这一点,但它只是给一点背景知识)。
Plone4Bio 是旨在为生物信息学一些Plone的应用...我不知道多少该项目推进,我还没有使用它,但似乎至少你有一个序列对象和一些应用程序的可视化它,可能是一些应用软件,搜索他们。 (P.S.他们使用它在UNIPROT - 看任何膜蛋白的“第三方数据”部分)
我不知道针对生物信息学任何其他CMS应用程序,但也许你也可以很容易地实现与Django的东西没有太多的精力。
有没有什么格式的信息的想法将被存储在,或如何显示的DNA序列(它只是一个长字符串?),你可能能够简单地将每个DNA序列插入到MySQL数据库脱身和然后执行一个简单的查询,如:
SELECT * FROM `dna_table` WHERE `sequence` = $sequence;
请确保您使用转义字符串或参数化查询(防止SQL注入),但除此之外,这听起来像一个非常简单的DB计划,不应该比约100行代码等等。
我同意:你应该张贴您的问题bbb@bioinformatics.org或bioperl的邮件列表
。问题“轻松创建一个网站的搜索形式的通用序列数据库”,似乎过于笼统。序列数据库(ID,序列)的列表,并通过本身并不需要任何工具支持。至少我看不出有任何理由,你为什么会需要一个工具。
我觉得你的问题是:有没有一个BLAST客户端作为一个可以安装在本地的网页表单?有一些:计划可能值得一试,虽然我从来没有运行它。的BioPerl有独立的BLAST执行对象(的http:// doc.bioperl.org/releases/bioperl-1.0/Bio/Tools/Run/StandAloneBlast.html ),并且可以以图形方式显示结果。于Debian / Ubuntu地中海具有NCBI-工具-bin和NCBI-rRNA的数据,其安装所需的工具和数据库在几秒钟。
而不是琢磨工具的支持,我宁愿砍一起与输入序列上,你有,然后看用户是不是已经高兴的是,FASTA文件执行爆炸10行CGI脚本。
关注编程语言:如果你喜欢,你可以用一个shell脚本(*)做到这一点。这甚至可能把你比发帖时间少计算器... ;-)
(*)注意偏执计算机科学的同事:这将是生物学家的内部应用程序,谁也不知道操作系统和操作符重载之间的区别,所以SQL注入是非常非常不可能的......
我觉得这是一个例子过早的优化是邪恶的是,在那你可以失去大量的时间与设计太复杂,一个简单的任务系统中的意义。在敏捷编程的精神,如果你喜欢的软件工程专业术语,你可能只是黑客的东西在一起,然后思考架构之前尝试在你的用户。