DNAからRNAへのDNAおよびPerlでタンパク質を獲得します
-
28-10-2019 - |
質問
私はプロジェクトに取り組んでいます(私はPerlでそれを実装する必要がありますが、私はそれが得意ではありません)。それはDNAを読み、そのRNAを見つけます。そのRNAをトリプレットに分割して、同等のタンパク質名を取得します。手順を説明します:
1)次のDNAをRNAに転写し、遺伝コードを使用してアミノ酸の配列に翻訳します
例:
TCATAATACGTTTTGTATTCGCCAGCGCTTCGGTGT
2)DNAを転写するには、最初に各DNAを対応物に置き換えます(すなわち、cの場合はg、g、aはt、t for a):
TCATAATACGTTTTGTATTCGCCAGCGCTTCGGTGT
AGTATTATGCAAAACATAAGCGGTCGCGAAGCCACA
次に、チミン(T)塩基がウラシル(U)になることを忘れないでください。したがって、私たちのシーケンスは次のようになります。
AGUAUUAUGCAAAACAUAAGCGGUCGCGAAGCCACA
遺伝コードを使用することはそのようなものです
AGU AUU AUG CAA AAC AUA AGC GGU CGC GAA GCC ACA
次に、遺伝コードテーブルで各トリプレット(コドン)を調べます。したがって、Aguはセリンになります。これはSerとして書くことができます。
SIMQNISGREAT
タンパク質のテーブルを渡します:
それでは、どうすればそのコードをPerlで書くことができますか?質問を編集し、私がしたことをコードを書きます。
解決
以下のスクリプトを試してみてください。Stdinの入力(またはパラメーターとして指定されたファイル)を受け入れ、Lineで読み取ります。また、添付された画像の「停止」は停止状態になると思います。その写真からそれをすべてよく読んだことを願っています。
#!/usr/bin/perl
use strict;
use warnings;
my %proteins = qw/
UUU F UUC F UUA L UUG L UCU S UCC S UCA S UCG S UAU Y UAC Y UGU C UGC C UGG W
CUU L CUC L CUA L CUG L CCU P CCC P CCA P CCG P CAU H CAC H CAA Q CAG Q CGU R CGC R CGA R CGG R
AUU I AUC I AUA I AUG M ACU T ACC T ACA T ACG T AAU N AAC N AAA K AAG K AGU S AGC S AGA R AGG R
GUU V GUC V GUA V GUG V GCU A GCC A GCA A GCG A GAU D GAC D GAA E GAG E GGU G GGC G GGA G GGG G
/;
LINE: while (<>) {
chomp;
y/GCTA/CGAU/; # translate (point 1&2 mixed)
foreach my $protein (/(...)/g) {
if (defined $proteins{$protein}) {
print $proteins{$protein};
}
else {
print "Whoops, stop state?\n";
next LINE;
}
}
print "\n"
}
所属していません StackOverflow