Gibt es irgendwelche bestehenden Lösungen für eine generische DNA-Sequenzdatenbank mit einer Website Frontend zu schaffen?

StackOverflow https://stackoverflow.com/questions/1890285

Frage

würde Ich mag eine rRNA-Sequenz-Datenbank mit einer Web-Front schaffen für das Labor beende ich in Arbeit. Es scheint in der Biologie häufig eine große Anzahl von Sequenzen mit Alignment-Algorithmen wie BLAST und HMMER suchen zu wollen, so dass ich fragte sich, ob es eine bestehende pHP / python / Schienen-Projekte, die die einfache Erstellung einer generischen Sequenz-Datenbank mit einer Website ein Suchformular lassen?

UPDATE : GMOD ist die Art des Servers ich suchte . Ich war auch unter BioMart zu, die eine ähnliche Funktionalität haben aussieht.

War es hilfreich?

Lösung

etwas weniger Barebone ist http://gmod.org/ - die einfachste Installation Sie geben sollten Explosion Form und ein „Sequenz-Browser“ -Schnittstelle. Sie wissen nicht, ob eine hmmer Form Theres noch ...

(skaliert ziemlich gut - von einem einfachen SQLite zu einer echten Datenbank)

Alternativ können Sie in der Galaxie-Server suchen. http://main.g2.bx.psu.edu/
Es ist erstes Ziel ist, komplexe genomische Abfragen einfach für Nicht-Rechen Menschen machen, aber ich weiß nicht, ob es eine Explosion aus dem Kasten

hat

prost, yannick


UPDATE - inspiriert teilweise durch diesen Beitrag, entwickeln wir eine einfacher lokale Explosion Server als eine einfach zu implementierende Alternative zu wwwblast . Unfertige unter http://www.sequenceserver.com . Ein Demo-Server können Sie BLAST ant Genome .

Andere Tipps

Dies wird wahrscheinlich viel des Guten, aber .... hat ncbi eine Menge Software zur Verfügung. Link-.

Insbesondere diese .

Es gibt eine einfache CGI-Front-End mit dem NCBI BLAST-Paket verteilt als auch. Sie können es auf der FTP-Site herunterladen, die hier:

ftp://ftp.ncbi.nih.gov/

Es ist auch nicht von der Sprache über Sie sprechen, aber es gibt bioperl, die speziell für DNA und RNA und andere Säuren und Protein-Basis ‚Programmierung‘

gemacht eine Sammlung von Funktionen ist

Geben Sie für es in CPAN.org

Ich würde dringend empfehlen die Bioinformatik-Community in Kontakt. Das Wichtigste ist, um die Datenbank zu entwerfen und ihren Zweck entscheiden. Sie erwähnen DNA im Titel aber rRNA im Text - das sind ganz verschiedene Dinge. Wenn es nur ein Tippfehler, fein -. Aber wenn Sie nicht verstehen den Unterschied dann mit Menschen in der Gemeinde sprechen

Da ich in der Gemeinde beteiligt bin könnten Sie auch die MyExperiment Gemeinschaft kontaktieren ( http: // en.wikipedia.org/wiki/MyExperiment ) und meinen Namen erwähnen, wenn Sie benötigen. Hier finden Sie viele freundliche Menschen und Hilfe finden.

UPDATE Ich habe gerade bemerkt, dass Sie von Manchester sind und das ist die Drehscheibe des MyExperiment so ist es wirklich der offensichtliche Ort zu starten!

In Bezug auf GMOD: Ich bin relativ sicher, dass GMOD kompletter Overkill für Ihre Anwendung ist. GMOD ist kein Server, es ist eine Sammlung von Tools, das Datenbankschema (Chado) ist einer von ihnen, und Chado ist wirklich nicht für jemanden, der meist Sequenzen und ids haben. BioMart ist kein Server entweder, es ist ein Werkzeug, das de-Normalisierung der Modelldatenbanken ermöglicht, in der Lage sein Gesamtgenom-Abfragen schnell genug zu laufen. Einer der BioMart Kunden (Martview) kommt als ein Web-Interface. Sie definitiv nicht wollen, Biomart im Moment verwenden, aber ich kann das per E-Mail im Detail erklären. Ich habe den Eindruck, dass Sie eher ein webbasiertes BLAST-Client müssen zuerst beginnen.

Galaxy: Galaxy ist keine Datenbank, es ist eine Website mit Werkzeugen ist mit (meist DNA) Sequenzen aus verschiedenen Genomen zu arbeiten. Galaxy ist eng mit den UCSC Genom-Browser-Sequenzen, die Werkzeuge und Dateiformate verknüpft. Also, wenn Sie eine Datenbank mit völlig neuen Sequenzen zu schaffen, ist Galaxie nicht für Sie. Es enthält keinen BLAST-Server entweder. Wenn Sie eine Datenbank von Sequenzen erstellen möchten, Chado als Teil GMOD nahe kommt, aber ich würde beginnen eher eine Textdatei verwenden, um zu beginnen, siehe meinen Beitrag oben.

Vielleicht können Sie sich unter Plone4Bio .

Plone ist ein erweiterter Content-Management-Engine in Python geschrieben, mit vielen Funktionen und einfachen Anwendungen zu verwenden, so dass Sie Ihre Website unter Verwendung einer Sammlung von Modulen wie Foren, Produkte für Nachrichten erstellen, etc ... (I wissen Sie das schon wissen, aber es ist nur ein wenig Hintergrund zu geben).

Plone4Bio ist auf die Bereitstellung einige plone Anwendungen für Bioinformatik richtet ... Ich weiß nicht, wie viel das Projekt vorangetrieben und ich habe es noch nicht benutzt, aber es scheint, dass Sie zumindest eine Sequenz Objekt und einige Anwendungen zur Visualisierung von ihm haben, und wahrscheinlich einige Anwendungen, sie zu suchen. (P. S. sie nutzen es bei Uniprot - Blick auf den ‚Externen Daten‘ Abschnitt für jedes Membranprotein)

Ich weiß nicht, von anderen CMS-Anwendungen in der Bioinformatik richteten, aber vielleicht können Sie auch leicht etwas mit django ohne allzu großen Aufwand implementieren.

Da sie keine Vorstellung davon, was formatiert die Informationen wird in gespeichert werden, oder wie DNA-Sequenzen angezeigt (es ist nur eine lange Schnur?), Können Sie in der Lage sein, um wegzukommen mit einfach jede DNA-Sequenz in eine MySQL-Datenbank einfügen und dann eine einfache Abfrage wie ausführen:

SELECT * FROM `dna_table` WHERE `sequence` = $sequence;

Achten Sie darauf, eine Escape-Zeichenfolge oder eine parametrisierte Abfrage verwenden (SQL-Injection zu verhindern), aber anders als das, das klingt wie ein wirklich einfaches DB-Programm, das nicht mehr als etwa 100 Zeilen Code sein sollte.

Ich bin damit einverstanden: Sie Ihre Frage schreiben sollen oder die bioperl Mailingliste bbb@bioinformatics.org

.

Die Frage „einfache Erstellung einer generischen Sequenz-Datenbank mit einer Website eines Suchformular“ scheint zu allgemein. Eine Sequenz-Datenbank ist eine Liste von (id, Sequenz) und selbst braucht keine Werkzeugunterstützung. Wenigstens sehe ich keinen Grund, warum Sie ein Werkzeug dafür brauchen würde.

Ich glaube, Ihre Frage ist: Gibt es ein BLAST-Client als Web-Formular, die ein lokal installieren können? Es gibt einige: Plan könnte einen Versuch wert, obwohl ich nie laufen sie hatte. BioPerl hat Objekte für Standalone-BLAST Ausführung ( http: // doc.bioperl.org/releases/bioperl-1.0/Bio/Tools/Run/StandAloneBlast.html ) und können die Ergebnisse graphisch angezeigt werden soll. Debian / Ubuntu Med hat ncbi-tools-sind und NCBI-rRNA-Daten, die die notwendigen Werkzeuge und Datenbanken in wenigen Sekunden installiert werden.

Statt nachzudenken Tool-Unterstützung würde ich lieber hacken zusammen eine 10 CGI-Skript Zeile, die Explosion mit einer Eingangssequenz auf die Fasta Dateien ausführt, die Sie haben, und dann sehen, ob die Benutzer mit, dass nicht bereits zufrieden sind.

Besorgt über die Programmiersprache: Wenn Sie möchten, können Sie dies mit einem Shell-Skript (*). Das könnte sogar nehmen Sie weniger Zeit als die Entsendung auf Stackoverflow ... ;-)

(*) Hinweis an den paranoiden Informatik collegues: es wird eine interne Anwendung für Biologen sein, die nicht wissen, den Unterschied zwischen einem Betriebssystem und Überladen von Operatoren, so SQL-Injektionen sind sehr, sehr unwahrscheinlich ...

Ich denke, dies ist ein Beispiel, wo vorzeitige Optimierung böse genug ist, in dem Sinne, dass Sie viel Zeit mit der Gestaltung eines Systems zu komplex für eine einfache Aufgabe lösen kann. Im Geiste der agilen Programmierung, wenn Sie Software-Engineering buzzwords mögen, können Sie einfach etwas zusammen hacken und es dann auf Ihre Benutzer versuchen, bevor über die Architektur zu denken.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top