ER, Fri Jan  7 16:22:45 EST 2011

cd ~/src/tornado

Files used for Training:
=======================

Tr1:
===
data/Mathews/sto/rRNAdom.sto (115)
data/CG/sto/S-151Rfam.sto    (151)

cat data/Mathews/sto/rRNAdom.sto data/CG/sto/S-151Rfam.sto > data/TORNADO/sto/TORNADO_Tr1.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr1.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 266
Total # residues:    66281
Smallest:            23
Largest:             734
Average length:      249.2

== Unique: remove > 0.95 sim over > 0.95 of length, removes: 0 seq ==
scripts/remove_similar_sequences.pl -f 0.95 -l 0.95 data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_Unique.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr1_Unique.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 266
Total # residues:    66281
Smallest:            23
Largest:             734
Average length:      249.2

Tr2:
===
data/CG/sto/S-Processed-TRA.sto (3439)

cat data/CG/sto/S-Processed-TRA.sto > data/TORNADO/sto/TORNADO_Tr2.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr2.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 3439
Total # residues:    612414
Smallest:            10
Largest:             695
Average length:      178.1

== Unique: remove > 0.95 sim over > 0.95 of length,  removes: 260 seq ==
scripts/remove_similar_sequences.pl -f 0.95 -l 0.95 data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_Unique.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr2_Unique.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 3179
Total # residues:    561480
Smallest:            10
Largest:             695
Average length:      176.6

Tr3:
===
data/Andronescu_RNA2010/sto/S-Full-Train.sto (2586)

cat data/Andronescu_RNA2010/sto/S-Full-Train.sto > data/TORNADO/sto/TORNADO_Tr3.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 2586
Total # residues:    691343
Smallest:            10
Largest:             699
Average length:      267.3

== Unique: remove > 0.95 sim over > 0.95 of length,  removes: 178  seq ==
scripts/remove_similar_sequences.pl -f 0.95 -l 0.95 data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_Unique.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr3_Unique.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 2408
Total # residues:    636422
Smallest:            10
Largest:             699
Average length:      264.3


cat data/TORNADO/sto/TORNADO_Tr1.sto        data/TORNADO/sto/TORNADO_Tr2.sto        data/TORNADO/sto/TORNADO_Tr3.sto        > data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto
cat data/TORNADO/sto/TORNADO_Tr1_Unique.sto data/TORNADO/sto/TORNADO_Tr2_Unique.sto data/TORNADO/sto/TORNADO_Tr3_Unique.sto > data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Unique.sto


Tr4:
====
data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_TRAIN_80ID/Rfam10_0_3D_TORNADO_TRAIN_80ID.sto [1553 sequences]

scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_TRAIN_80ID/Rfam10_0_3D_TORNADO_TRAIN_80ID.sto data/TORNADO/sto/TORNADO_Tr4.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Tr4.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1381
Total # residues:    244279
Smallest:            61
Largest:             488
Average length:      176.9


Files used for Testing:
======================

data/tRNAs/tRNA1415/tornado/trna1415_annote_Unique_random200.sto      (200)
data/conus/rnabench_srp_Unique.stk                                     (81)                
data/conus/rnabench_tmRNA_Unique.stk                                   (97)
data/conus/rnabench_RNaseP_Unique.stk                                 (225)
data/Mathews/sto/5s_Unique.sto                                        (270)
data/Mathews/sto/telomerase_Unique.sto                                 (37)
data/Mathews/sto/grp1_Unique.sto                                       (16)
data/Mathews/sto/grp2w_Unique.sto                                       (3)

cp data/tRNAs/tRNA1415/tornado/trna1415_annote_Unique_random200.sto      data/TORNADO/sto/TORNADO_Test_tRNA.sto
cp data/conus/rnabench_srp_Unique.stk                                    data/TORNADO/sto/TORNADO_Test_srp.sto
cp data/conus/rnabench_tmRNA_Unique.stk                                  data/TORNADO/sto/TORNADO_Test_tmRNA.sto
cp data/conus/rnabench_RNaseP_Unique.stk                                 data/TORNADO/sto/TORNADO_Test_RNaseP.sto
cp data/Mathews/sto/5s_Unique.sto                                        data/TORNADO/sto/TORNADO_Test_5s.sto
cp data/Mathews/sto/telomerase_Unique.sto                                data/TORNADO/sto/TORNADO_Test_telomerase.sto 
cp data/Mathews/sto/grp1_Unique.sto                                      data/TORNADO/sto/TORNADO_Test_grp1.sto
cp data/Mathews/sto/grp2w_Unique.sto                                     data/TORNADO/sto/TORNADO_Test_grp2w.sto

data/TORNADO/sto/TORNADO_Test_8Fam.sto (929)
---------------------------------------------
cat data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto > data/TORNADO/sto/TORNADO_Test_8Fam.sto

~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_8Fam.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 929
Total # residues:    197357
Smallest:            63
Largest:             768
Average length:      212.4

data/CG/sto/S-Processed-TES_Unique.sto: Remove overlap with data/TORNADO/sto/TORNADO_Test_8Fam.sto 
--------------------------------------------------------------------------------------------------
scripts/remove_sto1_from_sto2.pl -f 0.95 -l 0.95 data/TORNADO/sto/TORNADO_Test_8Fam.sto data/CG/sto/S-Processed-TES_Unique.sto data/CG/sto/S-Processed-TES_Unique_noI-8Fam.sto
~/src/easel/miniapps/esl-seqstat data/CG/sto/S-Processed-TES_Unique_noI-8Fam.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 840
Total # residues:    169179
Smallest:            10
Largest:             689
Average length:      201.4

scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_8Fam.sto data/CG/sto/S-Processed-TES_Unique.sto data/CG/sto/S-Processed-TES_Unique_no-8Fam.sto
~/src/easel/miniapps/esl-seqstat data/CG/sto/S-Processed-TES_Unique_no-8Fam.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 742
Total # residues:    155949
Smallest:            10
Largest:             689
Average length:      210.2

scripts/remove_sto1_from_sto2.pl         -e 0.0001  data/TORNADO/sto/TORNADO_Test_8Fam.sto data/CG/sto/S-Processed-TES_Unique.sto data/CG/sto/S-Processed-TES_Unique_No-8Fam.sto
~/src/easel/miniapps/esl-seqstat data/CG/sto/S-Processed-TES_Unique_No-8Fam.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 694
Total # residues:    149965
Smallest:            10
Largest:             689
Average length:      216.1


data/TORNADO/sto/TORNADO_Tes_S-Processed-TES.sto      (742)
data/TORNADO/sto/TORNADO_Tes_S-Processed-TES_indi.sto (694)
----------------------------------------------------
data/CG/sto/S-Processed-TES_Unique.sto          (959)
data/CG/sto/S-Processed-TES_Unique_noI-8Fam.sto (840)
data/CG/sto/S-Processed-TES_Unique_no-8Fam.sto  (742)
data/CG/sto/S-Processed-TES_Unique_No-8Fam.sto  (694)

cp data/CG/sto/S-Processed-TES_Unique_no-8Fam.sto  data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto  
 ~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 742
Total # residues:    155949
Smallest:            10
Largest:             689
Average length:      210.2

cp data/CG/sto/S-Processed-TES_Unique_No-8Fam.sto  data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto  
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 694
Total # residues:    149965
Smallest:            10
Largest:             689
Average length:      216.1


= S-Full-Test_Unique_no-S-Processed-TES: Remove overlap with data/TORNADO/sto/TORNADO_Test_8Fam.sto =
-----------------------------------------------------------------------------------------------------
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_8Fam.sto data/Andronescu_RNA2010/sto/S-Full-Test_Unique_no-S-Processed-TES.sto data/Andronescu_RNA2010/sto/S-Full-Test_Unique_no-S-Processed-TES_no-8Fam.sto
~/src/easel/miniapps/esl-seqstat data/Andronescu_RNA2010/sto/S-Full-Test_Unique_no-S-Processed-TES_no-8Fam.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 375
Total # residues:    102995
Smallest:            12
Largest:             700
Average length:      274.7

scripts/remove_sto1_from_sto2.pl -e 0.0001  data/TORNADO/sto/TORNADO_Test_8Fam.sto data/Andronescu_RNA2010/sto/S-Full-Test_Unique_No-S-Processed-TES.sto data/Andronescu_RNA2010/sto/S-Full-Test_Unique_No-S-Processed-TES_No-8Fam.sto
~/src/easel/miniapps/esl-seqstat data/Andronescu_RNA2010/sto/S-Full-Test_Unique_No-S-Processed-TES_No-8Fam.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 153
Total # residues:    20417
Smallest:            12
Largest:             551
Average length:      133.4


data/TORNADO/sto/TORNADO_Tes_S-Full-Test.sto      (375)
data/TORNADO/sto/TORNADO_Tes_S-Full-Test_indi.sto (153)
----------------------------------------------------
data/Andronescu_RNA2010/sto/S-Full-Test_Unique_no-S-Processed-TES.sto         (500)
data/Andronescu_RNA2010/sto/S-Full-Test_Unique_no-S-Processed-TES_No-8Fam.sto (375)

data/Andronescu_RNA2010/sto/S-Full-Test_Unique_No-S-Processed-TES.sto         (249)
data/Andronescu_RNA2010/sto/S-Full-Test_Unique_No-S-Processed-TES_No-8Fam.sto (153)


cp data/Andronescu_RNA2010/sto/S-Full-Test_Unique_no-S-Processed-TES_no-8Fam.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 375
Total # residues:    102995
Smallest:            12
Largest:             700
Average length:      274.7

cp data/Andronescu_RNA2010/sto/S-Full-Test_Unique_No-S-Processed-TES_No-8Fam.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 153
Total # residues:    20417
Smallest:            12
Largest:             551
Average length:      133.4


data/TORNADO/sto/TORNADO_Test.sto      (2046)
data/TORNADO/sto/TORNADO_Test_indi.sto (1776)
========================================
cat data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto  > data/TORNADO/sto/TORNADO_Test.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 2046
Total # residues:    456301
Smallest:            10
Largest:             768
Average length:      223.0

cat data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto  > data/TORNADO/sto/TORNADO_Test_indi.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_indi.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1776
Total # residues:    367739
Smallest:            10
Largest:             768
Average length:      207.1


Remove things similar to Tr1, Tr2, Tr3
======================================

data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto:      (2046) --> (697)
data/TORNADO/sto/TORNADO_Test_No-Tr1Tr2Tr3.sto:      (2046) --> (297)

data/TORNADO/sto/TORNADO_Test_indi_no-Tr1Tr2Tr3.sto: (1776) --> (613)
data/TORNADO/sto/TORNADO_Test_indi_No-Tr1Tr2Tr3.sto: (1776) --> (292)
-----------------------------------------------------------------
==tRNA: 117/200
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1Tr2Tr3.sto 
==tRNA: 64/200
scripts/remove_sto1_from_sto2.pl         -e 0.0001 data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr1Tr2Tr3.sto 

==SRP: 13/81
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001   data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr1Tr2Tr3.sto 
==SRP: 0/81
scripts/remove_sto1_from_sto2.pl         -e 0.0001   data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr1Tr2Tr3.sto 

==tmRNA: 45/97
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr1Tr2Tr3.sto 
==tmRNA: 5/97
scripts/remove_sto1_from_sto2.pl         -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr1Tr2Tr3.sto 

==RNaseP: 26/225
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1Tr2Tr3.sto 
==RNaseP: 0/225
scripts/remove_sto1_from_sto2.pl         -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr1Tr2Tr3.sto 

==5s: 43/270
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr1Tr2Tr3.sto 
==5s: 3/270
scripts/remove_sto1_from_sto2.pl         -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr1Tr2Tr3.sto 

==telomerase: 30/37
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr1Tr2Tr3.sto 
==telomerase: 4/37
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr1Tr2Tr3.sto 

==grp1: 14/16
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1Tr2Tr3.sto 
==grp1: 7/16
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr1Tr2Tr3.sto 

==grp2w: 2/3
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1Tr2Tr3.sto 
==grp2w: 0/3
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr1Tr2Tr3.sto 

==S-Processed-TES: 265/742
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.sto 
==S-Processed-TES: 171/742
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_No-Tr1Tr2Tr3.sto 

==S-Processed-TES_indi: 255/694
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_no-Tr1Tr2Tr3.sto 
==S-Processed-TES_indi: 170/694
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_No-Tr1Tr2Tr3.sto 

==S-Full-Test: 142/375
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.sto 
==S-Full-Test: 43/375
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_No-Tr1Tr2Tr3.sto 

==S-Full-Test_indi: 68/153
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_no-Tr1Tr2Tr3.sto 
==S-Full-Test_indi: 39/153
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_No-Tr1Tr2Tr3.sto 

data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto (697)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.sto  > data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 697
Total # residues:    135939
Smallest:            10
Largest:             768
Average length:      195.0

data/TORNADO/sto/TORNADO_Test_indi_no-Tr1Tr2Tr3.sto (613)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_no-Tr1Tr2Tr3.sto  > data/TORNADO/sto/TORNADO_Test_indi_no-Tr1Tr2Tr3.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_indi_no-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 613
Total # residues:    106633
Smallest:            10
Largest:             768
Average length:      174.0

data/TORNADO/sto/TORNADO_Test_No-Tr1Tr2Tr3.sto (297)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_No-Tr1Tr2Tr3.sto  > data/TORNADO/sto/TORNADO_Test_No-Tr1Tr2Tr3.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_No-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 297
Total # residues:    18920
Smallest:            10
Largest:             508
Average length:      63.7

data/TORNADO/sto/TORNADO_Test_indi_No-Tr1Tr2Tr3.sto (292)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_No-Tr1Tr2Tr3.sto  > data/TORNADO/sto/TORNADO_Test_indi_No-Tr1Tr2Tr3.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_indi_No-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 292
Total # residues:    17786
Smallest:            10
Largest:             491
Average length:      60.9

data/TORNADO/sto/TORNADO_Test_no-Tr1.sto:      (2046) --> (1842)
data/TORNADO/sto/TORNADO_Test_No-Tr1.sto:      (2046) --> (1272)

data/TORNADO/sto/TORNADO_Test_indi_no-Tr1.sto: (1776) --> (1591)
data/TORNADO/sto/TORNADO_Test_indi_No-Tr1.sto: (1776) --> (1150)
-----------------------------------------------------------
==tRNA: 200/200
scripts/remove_sto1_from_sto2.pl  -l 0.40  -e 0.0001 data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1.sto 
==tRNA: 197/200
scripts/remove_sto1_from_sto2.pl           -e 0.0001 data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr1.sto 

==SRP: 79/81
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr1.sto 
==SRP: 66/81
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr1.sto 

==tmRNA: 96/97
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr1.sto 
==tmRNA: 63/97
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr1.sto 

==RNaseP: 222/225
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1.sto 
==RNaseP: 133/225
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr1.sto 

==5s: 263/270
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr1.sto 
==5s: 231/270
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr1.sto 

==telomerase: 30/37
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr1.sto 
==telomerase: 4/37
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr1.sto 

==grp1: 15/16
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1.sto 
==grp1: 15/16
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr1.sto 

==grp2w: 3/3
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1.sto 
==grp2w: 3/3
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr1.sto 

==S-Processed-TES: 593/742
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr1.sto 
==S-Processed-TES: 354/742
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_No-Tr1.sto 

==S-Processed-TES_indi: 545/694
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_no-Tr1.sto 
==S-Processed-TES_indi: 312/694
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_No-Tr1.sto 

==S-Full-Test: 341/375
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr1.sto 
==S-Full-Test: 206/375
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_No-Tr1.sto 

==S-Full-Test_indi: 138/153
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_no-Tr1.sto 
==S-Full-Test_indi: 126/153
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_No-Tr1.sto 

data/TORNADO/sto/TORNADO_Test_no-Tr1.sto (1842)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr1.sto  > data/TORNADO/sto/TORNADO_Test_no-Tr1.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_no-Tr1.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1842
Total # residues:    401171
Smallest:            10
Largest:             768
Average length:      217.8

data/TORNADO/sto/TORNADO_Test_indi_no-Tr1.sto (1591)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_no-Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_no-Tr1.sto  > data/TORNADO/sto/TORNADO_Test_indi_no-Tr1.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_indi_no-Tr1.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1591
Total # residues:    321522
Smallest:            10
Largest:             768
Average length:      202.1

data/TORNADO/sto/TORNADO_Test_No-Tr1.sto (1272)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_No-Tr1.sto  > data/TORNADO/sto/TORNADO_Test_No-Tr1.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_No-Tr1.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1272
Total # residues:    182494
Smallest:            10
Largest:             768
Average length:      143.5

data/TORNADO/sto/TORNADO_Test_indi_No-Tr1.sto (1150)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_No-Tr1.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_No-Tr1.sto  > data/TORNADO/sto/TORNADO_Test_indi_No-Tr1.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_indi_No-Tr1.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1150
Total # residues:    161138
Smallest:            10
Largest:             768
Average length:      140.1

data/TORNADO/sto/TORNADO_Test_no-Tr2.sto:      (2046) --> (1130)
data/TORNADO/sto/TORNADO_Test_No-Tr2.sto:      (2046) --> (530)
data/TORNADO/sto/TORNADO_Test_indi_no-Tr2.sto: (1776) --> (972)
data/TORNADO/sto/TORNADO_Test_indi_No-Tr2.sto: (1776) --> (506)
------------------------------------------------------------
 ==tRNA: 135/200
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr2.sto 
==tRNA: 84/200
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr2.sto 

==SRP: 63/81
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr2.sto 
==SRP: 30/81
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr2.sto 

==tmRNA: 97/97
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr2.sto 
==tmRNA: 26/97
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr2.sto 

==RNaseP: 91/225
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr2.sto 
==RNaseP: 0/225
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr2.sto 

==5s: 61/270
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr2.sto 
==5s: 11/270
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr2.sto 

==telomerase: 37/37
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr2.sto 
==telomerase: 11/37
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr2.sto 

==grp1: 15/16
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr2.sto 
==grp1: 12/16
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr2.sto 

==grp2w: 2/3
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr2.sto 
==grp2w: 0/3
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr2.sto 

==S-Processed-TES: 378/742
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr2.sto 
==S-Processed-TES: 233/742
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_No-Tr2.sto 

==S-Processed-TES_indi: 355/694
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_no-Tr2.sto 
==S-Processed-TES_indi: 230/694
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_No-Tr2.sto 

==S-Full-Test: 251/375
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr2.sto 
==S-Full-Test: 123/375
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_No-Tr2.sto 

==S-Full-Test_indi: 116/153
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_no-Tr2.sto 
==S-Full-Test_indi: 102/153
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_No-Tr2.sto 

data/TORNADO/sto/TORNADO_Test_no-Tr2.sto (1130)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr2.sto  > data/TORNADO/sto/TORNADO_Test_no-Tr2.sto

~/srcFormat:              Stockholm
Alphabet type:       RNA
Number of sequences: 1130
Total # residues:    246856
Smallest:            10
Largest:             768
Average length:      218.5
/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_no-Tr2.sto 

data/TORNADO/sto/TORNADO_Test_indi_no-Tr2.sto (972)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_no-Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_no-Tr2.sto  > data/TORNADO/sto/TORNADO_Test_indi_no-Tr2.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_indi_no-Tr2.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 972
Total # residues:    192094
Smallest:            10
Largest:             768
Average length:      197.6

data/TORNADO/sto/TORNADO_Test_No-Tr2.sto (530)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_No-Tr2.sto  > data/TORNADO/sto/TORNADO_Test_No-Tr2.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_No-Tr2.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 530
Total # residues:    62320
Smallest:            10
Largest:             651
Average length:      117.6

data/TORNADO/sto/TORNADO_Test_indi_No-Tr2.sto (506)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_No-Tr2.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_No-Tr2.sto  > data/TORNADO/sto/TORNADO_Test_indi_No-Tr2.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_indi_No-Tr2.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 506
Total # residues:    56191
Smallest:            10
Largest:             651
Average length:      111.0


data/TORNADO/sto/TORNADO_Test_no-Tr3.sto:      (2046) --> (1031)
data/TORNADO/sto/TORNADO_Test_No-Tr3.sto:      (2046) --> (471)
data/TORNADO/sto/TORNADO_Test_indi_no-Tr3.sto: (1776) --> (896)
data/TORNADO/sto/TORNADO_Test_indi_No-Tr3.sto: (1776) --> (458)
---------------------------------------------------------------
 ==tRNA: 119/200
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr3.sto 
 ==tRNA: 68/200
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr3.sto 

==SRP: 14/81
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr3.sto 
==SRP: 0/81
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr3.sto 

==tmRNA: 45/97
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr3.sto 
==tmRNA: 6/97
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr3.sto 

==RNaseP: 49/225
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr3.sto 
==RNaseP: 9/225
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr3.sto 

==5s: 114/270
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr3.sto 
==5s: 24/270
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr3.sto 

==telomerase: 37/37
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr3.sto 
==telomerase: 11/37
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr3.sto 

==grp1: 14/16
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr3.sto 
==grp1: 7/16
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr3.sto 

==grp2w: 3/3
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr3.sto 
==grp2w: 1/3
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr3.sto 

==S-Processed-TES: 428/742
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr3.sto 
==S-Processed-TES: 280/742
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_No-Tr3.sto 

==S-Processed-TES_indi: 412/694
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_no-Tr3.sto 
==S-Processed-TES_indi: 276/694
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_No-Tr3.sto 

==S-Full-Test: 208/375
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr3.sto 
==S-Full-Test: 65/375
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_No-Tr3.sto 

==S-Full-Test_indi: 89/153
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_no-Tr3.sto 
==S-Full-Test_indi: 56/153
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_No-Tr3.sto 

data/TORNADO/sto/TORNADO_Test_no-Tr3.sto (1031)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr3.sto  > data/TORNADO/sto/TORNADO_Test_no-Tr3.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_no-Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1031
Total # residues:    215939
Smallest:            10
Largest:             768
Average length:      209.4

data/TORNADO/sto/TORNADO_Test_indi_no-Tr3.sto (896)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_no-Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_no-Tr3.sto  > data/TORNADO/sto/TORNADO_Test_indi_no-Tr3.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_indi_no-Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 896
Total # residues:    171906
Smallest:            10
Largest:             768
Average length:      191.9

data/TORNADO/sto/TORNADO_Test_No-Tr3.sto ()
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_No-Tr3.sto  > data/TORNADO/sto/TORNADO_Test_No-Tr3.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_No-Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 471
Total # residues:    49273
Smallest:            10
Largest:             612
Average length:      104.6

data/TORNADO/sto/TORNADO_Test_indi_No-Tr3.sto (458)
=====================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_srp_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_5s_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_grp2w_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Processed-TES_indi_No-Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_indi_No-Tr3.sto  > data/TORNADO/sto/TORNADO_Test_indi_No-Tr3.sto

~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Test_indi_No-Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 458
Total # residues:    47045
Smallest:            10
Largest:             612
Average length:      102.7

=====================================================================================================================================================================================================

data/TORNADO/sto/TORNADO_Tr1_no-y.sto
data/TORNADO/sto/TORNADO_Tr1_No-y.sto
====================================================
==tRNA: 266/266
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-tRNA.sto 
==tRNA: 265/266
scripts/remove_sto1_from_sto2.pl         -e 0.0001  data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-tRNA.sto 

==srp: 264/266
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-srp.sto 
==srp: 264/266
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-srp.sto 

==tmRNA: 265/266
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-tmRNA.sto 
==tmRNA: 265/266
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-tmRNA.sto 

==RNaseP: 262/266
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-RNaseP.sto 
==RNaseP: 262/266
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-RNaseP.sto 

==5s: 265/266
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-5s.sto 
==5s: 265/266
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-5s.sto 

==telomerase: 265/266
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-telomerase.sto 
==telomerase: 265/266
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-telomerase.sto 

==grp1: 265/266
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-grp1.sto 
==grp1: 265/266
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-grp1.sto 

==grp2w: 266/266
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-grp2w.sto 
==grp2w: 266/266
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-grp2w.sto 

==S-Processed-TES: 225/266
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-S-Processed-TES.sto 
==S-Processed-TES: 147/266
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-S-Processed-TES.sto 

==S-Full-Test: 237/266
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_no-S-Full-Test.sto 
==S-Full-Test: 147/266
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Tr1.sto data/TORNADO/sto/TORNADO_Tr1_No-S-Full-Test.sto 

data/TORNADO/sto/TORNADO_Tr2_no-y.sto
data/TORNADO/sto/TORNADO_Tr2_No-y.sto
=====================================================
==tRNA: 3366/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-tRNA.sto 
==tRNA: 3300/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-tRNA.sto 

==srp: 3408/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-srp.sto 
==srp: 3402/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-srp.sto 

==tmRNA: 3433/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-tmRNA.sto 
==tmRNA: 3429/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-tmRNA.sto 

==RNaseP: 3046/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-RNaseP.sto 
==RNaseP: 3006/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-RNaseP.sto 

==5s:  3241/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-5s.sto 
==5s:  3188/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-5s.sto 

==telomerase: 3438/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-telomerase.sto 
==telomerase: 3438/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-telomerase.sto 

==grp1: 3437/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-grp1.sto 
==grp1: 3435/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-grp1.sto 

==grp2w: 3435/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-grp2w.sto 
==grp2w: 3435/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-grp2w.sto 

==S-Processed-TES: 2549/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-S-Processed-TES.sto 
=S-Processed-TES: 2482/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-S-Processed-TES.sto 

==S-Full-Test: 3061/3439
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-S-Full-Test.sto 
==S-Full-Test: 2044/3439
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-S-Full-Test.sto 

data/TORNADO/sto/TORNADO_Tr3_no-y.sto
data/TORNADO/sto/TORNADO_Tr3_No-y.sto
=====================================================
==tRNA: 2469/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-tRNA.sto 
==tRNA: 2379/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-tRNA.sto 

==srp: 2432/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-srp.sto 
==srp: 2359/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-srp.sto 

==tmRNA: 2412/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-tmRNA.sto 
==tmRNA: 2286/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-tmRNA.sto 

==RNaseP: 2303/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-RNaseP.sto 
==RNaseP: 2258/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-RNaseP.sto 

==5s: 2489/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-5s.sto 
==5s: 2473/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-5s.sto 

==telomerase: 2585/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-telomerase.sto 
==telomerase: 2585/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-telomerase.sto 

==grp1: 2579/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-grp1.sto 
==grp1: 2569/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-grp1.sto 

==grp2w: 2583/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-grp2w.sto 
==grp2w: 2583/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-grp2w.sto 

==S-Processed-TES: 2170/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-S-Processed-TES.sto 
==S-Processed-TES: 1408/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-S-Processed-TES.sto 

==S-Full-Test: 2142/2586
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-S-Full-Test.sto 
==S-Full-Test: 958/2586
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-S-Full-Test.sto 

data/TORNADO/sto/TORNADO_Test_no-y.sto
data/TORNADO/sto/TORNADO_Test_No-y.sto
=====================================================
==tRNA: 1846/2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-tRNA.sto 
==tRNA: 1800/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_tRNA.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-tRNA.sto 

==srp: 1967/2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-srp.sto 
=srp: 1941/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_srp.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-srp.sto 

==tmRNA: 1950/2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-tmRNA.sto 
==tmRNA: 1920/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_tmRNA.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-tmRNA.sto 

==RNaseP: 1822/2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-RNaseP.sto 
==RNaseP: 1807/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_RNaseP.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-RNaseP.sto 

==5s: 1776/2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-5s.sto 
==5s: 1760/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_5s.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-5s.sto 

==telomerase: 2012/2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-telomerase.sto 
==telomerase: 2009/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_telomerase.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-telomerase.sto 

==grp1: 2031/2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-grp1.sto 
==grp1: 2029/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp1.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-grp1.sto 

==grp2w: 2044//2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-grp2w.sto 
==grp2w: 2043/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_grp2w.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-grp2w.sto 

==S-Processed-TES:  1387/2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-S-Processed-TES.sto 
==S-Processed-TES:  974/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Processed-TES.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-S-Processed-TES.sto 

==S-Full-Test: 1624/2046
scripts/remove_sto1_from_sto2.pl  -l 0.40 -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_no-S-Full-Test.sto 
==S-Full-Test: 1058/2046
scripts/remove_sto1_from_sto2.pl          -e 0.0001  data/TORNADO/sto/TORNADO_Test_S-Full-Test.sto data/TORNADO/sto/TORNADO_Test.sto data/TORNADO/sto/TORNADO_Test_No-S-Full-Test.sto 



NOTE: some sequences (grp1.sto and grp2w.sto in particular) have X instead of Ns, and programs like contrafold_v1_10 fail because of that.
To change Xs for Ns:

cp TORNADO_Test_grp1_no-Tr1Tr2Tr3.sto TORNADO_Test_grp1_no-Tr1Tr2Tr3_withX.sto
cp TORNADO_Test_grp2w_no-Tr1Tr2Tr3.sto TORNADO_Test_grp2w_no-Tr1Tr2Tr3_withX.sto

~/src/easel/miniapps/esl-reformat -x stockholm ~/src/tornado/data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1Tr2Tr3_withX.sto  > ~/src/tornado/data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1Tr2Tr3.sto
~/src/easel/miniapps/esl-reformat -x stockholm ~/src/tornado/data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1Tr2Tr3_withX.sto > ~/src/tornado/data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1Tr2Tr3.sto



==================================================================
compaRNA dataset (most likely useless) only 38 sequences left!
==================================================================
data/compaRNA/sto/222RNA_Unique.sto [181 seqs]

scripts/prune_sto.pl -l 30 -L 2000 data/compaRNA/sto/222RNA_Unique.sto data/TORNADO/sto/TORNADO_Test_compaRNA.sto

~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_compaRNA.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 85
Total # residues:    11922
Smallest:            30
Largest:             1758
Average length:      140.3

remove things similar to Tr1, Tr2, Tr3
======================================

data/TORNADO/sto/TORNADO_Test_compaRNA_no-Tr1Tr2Tr3.sto:      (85) --> (38)
data/TORNADO/sto/TORNADO_Test_compaRNA_No-Tr1Tr2Tr3.sto:      (85) --> (18)

-----------------------------------------------------------------
==compaRNA: 38/85
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_compaRNA.sto data/TORNADO/sto/TORNADO_Test_compaRNA_no-Tr1Tr2Tr3.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_compaRNA_no-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 38
Total # residues:    8235
Smallest:            30
Largest:             1758
Average length:      216.7

scripts/histogram_length.pl -N 2000 1 data/TORNADO/sto/TORNADO_Test_compaRNA_no-Tr1Tr2Tr3.sto data/TORNADO/
len = 216.7 +/- 411.0 MEDIAN = 92 file:data/TORNADO/sto/TORNADO_Test_compaRNA_no-Tr1Tr2Tr3.sto


==compaRNA: 18/85
scripts/remove_sto1_from_sto2.pl         -e 0.0001 data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_compaRNA.sto data/TORNADO/sto/TORNADO_Test_compaRNA_No-Tr1Tr2Tr3.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_compaRNA_No-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 18
Total # residues:    1537
Smallest:            30
Largest:             389
Average length:      85.4

scripts/histogram_length.pl -N 400 1 data/TORNADO/sto/TORNADO_Test_compaRNA_No-Tr1Tr2Tr3.sto data/TORNADO/
len = 85.4 +/- 86.4 MEDIAN = 58 file:data/TORNADO/sto/TORNADO_Test_compaRNA_No-Tr1Tr2Tr3.sto



=============================================================================================================
Rfam10_0_3D_TORNADO (32 families with three-dimensional structures)
                     NOT: tRNA, 5S rRNA, RNaseP, SRP, telomerase RNA, tmRNA, group I intron, group II intron
=============================================================================================================
data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_70ID/Rfam10_0_3D_TORNADO_70ID.sto [468 seqs]

scripts/histogram_length.pl -N 400 1 data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_70ID/Rfam10_0_3D_TORNADO_70ID.sto data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_70ID/
len = 119.6 +/- 40.4 MEDIAN = 108 file:data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_70ID/Rfam10_0_3D_TORNADO_70ID.sto

#this just removes the #GC RF line from the file
#
scripts/prune_sto.pl data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_70ID/Rfam10_0_3D_TORNADO_70ID.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed.sto

~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 468
Total # residues:    55989
Smallest:            27
Largest:             362
Average length:      119.6

#this also trims the ends so that it leaves an overhang of at most 3 nts at the end of the structured stuff
#
scripts/prune_sto.pl -t 4 data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_70ID/Rfam10_0_3D_TORNADO_70ID.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed.sto

~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 468
Total # residues:    49848
Smallest:            27
Largest:             264
Average length:      106.5


remove things similar to Tr1, Tr2, Tr3
======================================

data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed_no-Tr1Tr2Tr3.sto:        (468) --> (430)
data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed_No-Tr1Tr2Tr3.sto:        (468) --> (360)

data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed_no-Tr1Tr2Tr3.sto:      (468) --> (430)
data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed_No-Tr1Tr2Tr3.sto:      (468) --> (359)

==Rfam3D_trimmed: 430/468
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed_no-Tr1Tr2Tr3.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed_no-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 430
Total # residues:    46336
Smallest:            27
Largest:             244
Average length:      107.8


==Rfam3D_untrimmed: 430/468
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed_no-Tr1Tr2Tr3.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed_no-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 430
Total # residues:    52097
Smallest:            27
Largest:             244
Average length:      121.2

                                                          left
===================================================================
REMOVE[1]: 5_8S_rRNA/X03680.1/3159-3308             --> 14  5_8S_rRNA
REMOVE[2]: U1/X06809.1/232-392                      --> 18  U1
REMOVE[3]: Hammerhead_3/AJ295018.1/1-58             -->  0  Hammerhead_3
REMOVE[4]: Hammerhead_3/AJ536620.1/1-40
REMOVE[5]: Hammerhead_3/AJ536620.1/152-206
REMOVE[6]: Hammerhead_3/M83545.1/3-56
REMOVE[7]: Hammerhead_3/AJ247116.1/53-133
REMOVE[8]: Hammerhead_3/M33001.1/56-111
REMOVE[9]: Hammerhead_3/D00685.1/1-46
REMOVE[10]: IRE/AF338763.1/11-40                    -->  4 IRE
REMOVE[11]: IRES_HCV/D37839.1/1-362                 -->  0 IRE_HCV
REMOVE[12]: HDV_ribozyme/AB037947.1/685-775         -->  2 HDV_ribozyme
REMOVE[13]: Hammerhead_1/X15619.1/121-168           -->  3 Hammerhead_1
REMOVE[14]: Hammerhead_1/D87492.1/2147-2192
REMOVE[15]: Hammerhead_1/FN357486.1/345249-345293
REMOVE[16]: s2m/Y15936.2/6871-6913                  -->  0 s2m
REMOVE[17]: s2m/AY338174.1/29515-29557
REMOVE[18]: Purine/X83878.1/168-267                 --> 70 Purine
REMOVE[19]: Purine/AB008757.1/16-115
REMOVE[20]: Purine/ABCQ01000013.1/101307-101406
REMOVE[21]: Lysine/AE008691.1/719320-719498         --> 17 Lysine
REMOVE[22]: HIV-1_DIS/AF443080.1/69-110             -->  1 HIV-1_DIS
REMOVE[23]: K10_TLS/AC104149.6/78129-78172          -->  0 K10_TLS
REMOVE[24]: Rhino_CRE/L05355.1/2330-2415            -->  0 Rhino_CRE
REMOVE[25]: glmS/AE001437.1/179915-180075           -->  7 glmS
REMOVE[26]: Alfamo_CPB/AF294433.1/721-902           -->  0 Alfamo_CPB
REMOVE[27]: IRES_L-myc/AAYZ01189975.1/737-961       -->  0 IRES_L-myc
REMOVE[28]: Gammaretro_CES/X01616.1/1340-1440       -->  0 Gammaretro_CES
REMOVE[29]: ykoK/BA000004.3/2041941-2042105         --> 23 ykoK
REMOVE[30]: Entero_5_CRE/X67706.1/1-90              -->  1 Entero_5_CRE
REMOVE[31]: UnaL2/AB179626.1/214-267                -->  0 UnaL2
REMOVE[32]: UnaL2/AB179624.1/3561-3614
REMOVE[33]: UnaL2/AB001853.1/99-152
REMOVE[34]: UnaL2/AY543891.1/936-989
REMOVE[35]: IRES_Cripavirus/AF183905.1/5647-5848    -->  5 IRES_Cripavirus
REMOVE[36]: HIV_FE/AF119820.1/2110-2161             -->  1 HIV_FE
REMOVE[37]: R2_retro_el/U81814.1/504-719            -->  3 R2_retro_el
REMOVE[38]: R2_retro_el/U81811.1/530-751
LEFT: 430/468 sequences

Rfam[1] = RF00002        nss    14       5_8S_rRNA       Published; PMID:11125083
Rfam[2] = RF00003        nss    18       U1      Published; PMID:2405391
Rfam[3] = RF00008        nss     0       Hammerhead_3    Published; PMID:7969422
Rfam[4] = RF00015        nss    45       U4      Published; PMID:2339054; Griffiths-Jones SR
Rfam[5] = RF00037        nss     4       IRE     Published; PMID:8710843
Rfam[6] = RF00044        nss     1       Phage_pRNA      Predicted; ILM
Rfam[7] = RF00050        nss    21       FMN     Published; PMID:12456892
Rfam[8] = RF00059        nss    73       TPP     Published; PMID:12376536; Moxon SJ
Rfam[9] = RF00061        nss     0       IRES_HCV        Published; PMID:12212848
Rfam[10] = RF00094       nss     2       HDV_ribozyme    Published; PMID:9783582
Rfam[11] = RF00114       nss    23       S15     Published; PMID:8955900
Rfam[12] = RF00162       nss    36       SAM     Published; PMID:10094622
Rfam[13] = RF00163       nss     1       Hammerhead_1    Published; PMID:9632772
Rfam[14] = RF00164       nss     0       s2m     Published; PMID:15630477
Rfam[15] = RF00167       nss    70       Purine  Published; PMID:12787499
Rfam[16] = RF00168       nss    17       Lysine  Published; PMID:12787499
Rfam[17] = RF00175       nss     1       HIV-1_DIS       Published; PMID:8627772
Rfam[18] = RF00207       nss     0       K10_TLS         Published; PMID:8582290
Rfam[19] = RF00220       nss     0       Rhino_CRE       Published; PMID:9848654
Rfam[20] = RF00234       nss     7       glmS    Published; PMID:15029187
Rfam[21] = RF00252       nss     0       Alfamo_CPB      Published; PMID:14718638
Rfam[22] = RF00261       nss     0       IRES_L-myc      Published; PMID:14730027
Rfam[23] = RF00374       nss     0       Gammaretro_CES  Published; PMID:15003457
Rfam[24] = RF00380       nss    23       ykoK    Predicted; Barrick JE, Breaker RR
Rfam[25] = RF00386       nss     1       Entero_5_CRE    Published; PMID:11250909
Rfam[26] = RF00436       nss     0       UnaL2   Published; PMID:15273327
Rfam[27] = RF00458       nss     5       IRES_Cripavirus         Published; PMID:11233983
Rfam[28] = RF00480       nss     1       HIV_FE  Published; PMID:14747573
Rfam[29] = RF00522       nss     9       PreQ1   Predicted; Barrick JE
Rfam[30] = RF00524       nss     3       R2_retro_el     Published; PMID:15146081
Rfam[31] = RF01051       nss    55       GEMM_RNA_motif  Published; PMID:17621584
====================================================================================
                               430


==Rfam3D_trimmed: 360/468
scripts/remove_sto1_from_sto2.pl         -e 0.0001 data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed_No-Tr1Tr2Tr3.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed_No-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 360
Total # residues:    37894
Smallest:            27
Largest:             244
Average length:      105.3


==Rfam3D_untrimmed: 359/468
scripts/remove_sto1_from_sto2.pl         -e 0.0001 data/TORNADO/sto/TORNADO_Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed_No-Tr1Tr2Tr3.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed_No-Tr1Tr2Tr3.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 359
Total # residues:    42755
Smallest:            27
Largest:             244
Average length:      119.1


which one you are using?
===========================
cp  data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed.sto              data/TORNADO/sto/TORNADO_Test_Rfam3D.sto
cp  data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto 
cp  data/TORNADO/sto/TORNADO_Test_Rfam3D_trimmed_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_No-Tr1Tr2Tr3.sto

or

cp  data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed.sto              data/TORNADO/sto/TORNADO_Test_Rfam3D.sto
cp  data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto 
cp  data/TORNADO/sto/TORNADO_Test_Rfam3D_untrimmed_No-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_Rfam3D_No-Tr1Tr2Tr3.sto



====================================================================================================================================
TestB == data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto
====================================================================================================================================
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 430
Total # residues:    52097
Smallest:            27
Largest:             244
Average length:      121.2

====================================================================================================================================
TestA+TestB == data/TORNADO/sto/TORNADO_Test_ALL_no-Tr1Tr2Tr3.sto
data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto  + data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto
====================================================================================================================================
cat data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto  data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto > data/TORNADO/sto/TORNADO_Test_ALL_no-Tr1Tr2Tr3.sto
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_ALL_no-Tr1Tr2Tr3.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1127
Total # residues:    188036
Smallest:            10
Largest:             768
Average length:      166.8

====================================================================================================================================
Tr5
====================================================================================================================================
cp data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_ALL/Rfam10_0_3D_TORNADO_ALL.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_ALL.sto [2206 seqs]
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/Rfam10_0_3D_TORNADO_ALL.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 2206
Total # residues:    247998
Smallest:            27
Largest:             365
Average length:      112.4

scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_ALL.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3.sto
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/Rfam10_0_3D_TORNADO_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 2202
Total # residues:    247439
Smallest:            27
Largest:             365
Average length:      112.4


scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3_no-TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/Rfam10_0_3D_TORNADO_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3_no-TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1394
Total # residues:    149086
Smallest:            27
Largest:             365
Average length:      106.9

cp data/TORNADO/sto/Rfam10_0_3D_TORNADO_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3_no-TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Tr5.sto
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Tr5.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1394
Total # residues:    149086
Smallest:            27
Largest:             365
Average length:      106.9


====================================================================================================================================
Tr6
====================================================================================================================================
scripts/fileinfo.pl data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto > data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.list
NAC 22
acc[1] RF00002[15] 5_8S_rRNA 
acc[2] RF00003[18] U1 
acc[3] RF00015[45] U4 
acc[4] RF00037[4] IRE 
acc[5] RF00044[1] Phage_pRNA 
acc[6] RF00050[21] FMN 
acc[7] RF00059[73] TPP 
acc[8] RF00094[1] HDV_ribozyme 
acc[9] RF00114[23] S15 
acc[10] RF00162[36] SAM 
acc[11] RF00163[1] Hammerhead_1 
acc[12] RF00167[71] Purine 
acc[13] RF00168[17] Lysine 
acc[14] RF00175[1] HIV-1_DIS 
acc[15] RF00234[7] glmS 
acc[16] RF00380[23] ykoK 
acc[17] RF00386[1] Entero_5_CRE 
acc[18] RF00458[5] IRES_Cripavirus 
acc[19] RF00480[1] HIV_FE 
acc[20] RF00522[9] PreQ1 
acc[21] RF00524[3] R2_retro_el 
acc[22] RF01051[55] GEMM_RNA_motif 


~/src/tornado/scripts/rfam_training_set.pl -A  data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.list -f 1.0 ~/src/tornado/data/Rfam/Rfam10.0/archive/Rfam.seed ~/src/tornado/data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_22_ALL

cp data/Rfam/Rfam10.0/Rfam10_0_3D_TORNADO_22_ALL/Rfam10_0_3D_TORNADO_22_ALL.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_22_ALL.sto [1906 seqs]
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/Rfam10_0_3D_TORNADO_22_ALL.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1906
Total # residues:    211310
Smallest:            27
Largest:             244
Average length:      110.9

scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_22_ALL.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_22_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3.sto
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/Rfam10_0_3D_TORNADO_22_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1902
Total # residues:    210751
Smallest:            27
Largest:             244
Average length:      110.8

scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_22_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3.sto data/TORNADO/sto/Rfam10_0_3D_TORNADO_22_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3_no-TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/Rfam10_0_3D_TORNADO_22_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3_no-TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1094
Total # residues:    112398
Smallest:            27
Largest:             237
Average length:      102.7

cp data/TORNADO/sto/Rfam10_0_3D_TORNADO_22_ALL_no-TORNADO_Test_no-Tr1Tr2Tr3_no-TORNADO_Test_Rfam3D_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Tr6.sto
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Tr6.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1094
Total # residues:    112398
Smallest:            27
Largest:             237
Average length:      102.7


====================================================================================================================================
Tr7
====================================================================================================================================
Overlap between Tr2 and Tr3
            TORNADO_Tr3_no-Tr2.sto  LEFT: 1389/2586 sequences
            TORNADO_Tr3_No-Tr2.sto  LEFT: 685/2586 sequences
            TORNADO_Tr2_no-Tr3.sto  LEFT: 1658/3439 sequences
            TORNADO_Tr2_No-Tr3.sto  LEFT: 1156/3439 sequences
==================================================================
scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_no-Tr2.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Tr3_no-Tr2.sto  
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1389
Total # residues:    361220
Smallest:            10
Largest:             699
Average length:      260.1

scripts/remove_sto1_from_sto2.pl         -e 0.0001 data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr3_No-Tr2.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Tr3_No-Tr2.sto  
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 685
Total # residues:    114954
Smallest:            10
Largest:             697
Average length:      167.8

scripts/remove_sto1_from_sto2.pl -l 0.40 -e 0.0001 data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_no-Tr3.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Tr2_no-Tr3.sto  
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1658
Total # residues:    242232
Smallest:            10
Largest:             695
Average length:      146.1

scripts/remove_sto1_from_sto2.pl         -e 0.0001 data/TORNADO/sto/TORNADO_Tr3.sto data/TORNADO/sto/TORNADO_Tr2.sto data/TORNADO/sto/TORNADO_Tr2_No-Tr3.sto 
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Tr2_No-Tr3.sto  
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1156
Total # residues:    82057
Smallest:            10
Largest:             684
Average length:      71.0

== Unique: remove > 0.95 sim over > 0.95 of length, removes:  LEFT: 1297/1389 sequences
scripts/remove_similar_sequences.pl -f 0.95 -l 0.95 data/TORNADO/sto/TORNADO_Tr3_no-Tr2.sto data/TORNADO/sto/TORNADO_Tr3_no-Tr2_Unique.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr3_no-Tr2_Unique.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1297
Total # residues:    335873
Smallest:            10
Largest:             699
Average length:      259.0

== Unique: remove > 0.95 sim over > 0.95 of length, removes: LEFT: 1603/1658 sequences 
scripts/remove_similar_sequences.pl -f 0.95 -l 0.95 data/TORNADO/sto/TORNADO_Tr2_no-Tr3.sto data/TORNADO/sto/TORNADO_Tr2_no-Tr3_Unique.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr2_no-Tr3_Unique.sto 
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 1603
Total # residues:    228125
Smallest:            10
Largest:             695
Average length:      142.3

cat data/TORNADO/sto/TORNADO_Tr2_no-Tr3_Unique.sto data/TORNADO/sto/TORNADO_Tr3_no-Tr2_Unique.sto > data/TORNADO/sto/TORNADO_Tr2_no-Tr3_Tr3_no-Tr2_Unique.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr2_no-Tr3_Tr3_no-Tr2_Unique.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 2900
Total # residues:    563998
Smallest:            10
Largest:             699
Average length:      194.5

cp data/TORNADO/sto/TORNADO_Tr2_no-Tr3_Tr3_no-Tr2_Unique.sto data/TORNADO/sto/TORNADO_Tr2Tr3.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr2Tr3.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 2900
Total # residues:    563998
Smallest:            10
Largest:             699
Average length:      194.5


=======================================================================
Tr1Tr2Tr3_Independent == TORNADO_Tr1 + TORNADO_Tr2Tr3 (created above)
=======================================================================
cat data/TORNADO/sto/TORNADO_Tr1.sto  data/TORNADO/sto/TORNADO_Tr2_no-Tr3_Tr3_no-Tr2_Unique.sto > data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent.sto
~/src/easel/miniapps/esl-seqstat  data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 3166
Total # residues:    630279
Smallest:            10
Largest:             734
Average length:      199.1

============================
Tr1Tr2Tr3_Independent + Tr6
============================
cat data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent.sto data/TORNADO/sto/TORNADO_Tr6.sto > data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent_Tr6.sto
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent_Tr6.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 4260
Total # residues:    742677
Smallest:            10
Largest:             734
Average length:      174.3

============================
Tr1Tr2Tr3_Independent + 2*Tr6
============================
cat data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent.sto data/TORNADO/sto/TORNADO_Tr6.sto data/TORNADO/sto/TORNADO_Tr6.sto > data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent_Tr6_Tr6.sto
~/src/easel/miniapps/esl-seqstat -c data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent_Tr6_Tr6.sto
 Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 5354
Total # residues:    855075
Smallest:            10
Largest:             734
Average length:      159.7

Residue composition:
residue: A       222818  0.2606
residue: C       193664  0.2265
residue: G       239036  0.2795
residue: U       199383  0.2332
residue: R           58  0.0001
residue: Y           38  0.0000
residue: M            2  0.0000
residue: K            2  0.0000
residue: S            4  0.0000
residue: W           12  0.0000
residue: N           58  0.0001


===========================================
random sequences from test sets
===========================================
scripts/sto_extract_random.pl 1 data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1Tr2Tr3.sto > data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1Tr2Tr3_random1.sto
scripts/sto_extract_random.pl 1 data/TORNADO/sto/TORNADO_Test_srp_no-Tr1Tr2Tr3.sto > data/TORNADO/sto/TORNADO_Test_srp_no-Tr1Tr2Tr3_random1.sto
scripts/sto_extract_random.pl 1 data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1Tr2Tr3.sto > data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1Tr2Tr3_random1.sto
scripts/sto_extract_random.pl 1 data/TORNADO/sto/TORNADO_Test_5s_no-Tr1Tr2Tr3.sto > data/TORNADO/sto/TORNADO_Test_5s_no-Tr1Tr2Tr3_random1.sto


=====================================================================
TestSetA = data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto (697)
=====================================================================
cat data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_srp_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_5s_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1Tr2Tr3.sto   data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1Tr2Tr3.sto  data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.sto data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.sto > data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto
~/src/easel/miniapps/esl-seqstat data/TORNADO/sto/TORNADO_Test_no-Tr1Tr2Tr3.sto
Format:              Stockholm
Alphabet type:       RNA
Number of sequences: 697
Total # residues:    135939
Smallest:            10
Largest:             768
Average length:      195.0

data/TORNADO/sto/TORNADO_Test_tRNA_no-Tr1Tr2Tr3.sto            (117) tRNAs
data/TORNADO/sto/TORNADO_Test_srp_no-Tr1Tr2Tr3.sto             ( 13) SRP
data/TORNADO/sto/TORNADO_Test_tmRNA_no-Tr1Tr2Tr3.sto           ( 45) tmRNA
data/TORNADO/sto/TORNADO_Test_RNaseP_no-Tr1Tr2Tr3.sto          ( 26) RNaseP
data/TORNADO/sto/TORNADO_Test_5s_no-Tr1Tr2Tr3.sto              ( 43) 5s
data/TORNADO/sto/TORNADO_Test_telomerase_no-Tr1Tr2Tr3.sto      ( 30) telomerase
data/TORNADO/sto/TORNADO_Test_grp1_no-Tr1Tr2Tr3.sto            ( 14) group I
data/TORNADO/sto/TORNADO_Test_grp2w_no-Tr1Tr2Tr3.sto           (  2) group II

data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.sto (265)
data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.sto     (142)

# that is inside "S-Processed-TES_no-Tr1Tr2Tr3" ?
#
~/src/easel/miniapps/esl-reformat fasta data/TORNADO/sto/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.sto > data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.fa
~/src/easel/miniapps/esl-reformat fasta data/TORNADO/sto/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.sto > data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.fa

/usr/local/infernal/bin/cmsearch --tabfile data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.tab /groups/eddy/home/nawrockie/db/rfam_10.1/Rfam10.1.cm data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.rfam

grep -c ASE  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.fa
18
grep ASE_  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.tab
 1  RNaseP             RNaseP_bact_b  ASE_00195            55         381      1    365    138.62  4.62e-49   31
17  small fragments
  
grep -c RFA  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.fa
7
grep RFA_  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.tab
7 5S   5S_rRNA     RFA_00031             1         117      1    119     72.11  7.17e-17   51
       5S_rRNA     RFA_00034             1         120      1    119     72.66  5.17e-17   52
       5S_rRNA     RFA_00043             1         120      1    119     72.29  6.46e-17   45
       5S_rRNA     RFA_00133             1         114      1    119     69.65  3.08e-16   66
       5S_rRNA     RFA_00176             1         100      1    119     53.53  4.28e-12   37
       5S_rRNA     RFA_00279             1         114      1    119     64.87  5.21e-15   63
       5S_rRNA     RFA_00375             1         122      1    119     75.84  7.87e-18   53
  
grep -c SRP  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.fa
0

grep -c SPR  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.fa
20
grep SPR_  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.tab
6 tRNAs  tRNA        SPR_00074             2          73      1     71     65.88  1.24e-16   49
         tRNA        SPR_00219             1          84      1     71     52.09  1.01e-12   60
         tRNA        SPR_00292             1          65      1     71     53.36  4.39e-13   71
         tRNA        SPR_00393             1          85      1     71     54.13  2.65e-13   60
         tRNA        SPR_00478             1          72      1     71     64.32  3.44e-16   50
         tRNA        SPR_00524             1          57      1     71     34.14  1.22e-07   61
14 tRNA fragments
 
grep -c TMR  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.fa
3
grep TMR_  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.tab
3 fragments

grep -c PDB  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.fa
8
grep PDB_  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.tab
8 fragments

grep -c ASE  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.fa
18
grep ASE_ data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.tab
 1 RNaseP             RNaseP_bact_b  ASE_00195            55         381      1    365    138.62  4.62e-49   31
17 small hairpins  

grep -c CRW  data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.fa
209
grep CRW_ data/TORNADO/fasta/TORNADO_Test_S-Processed-TES_no-Tr1Tr2Tr3.tab
  5_8S_rRNA   CRW_00528             1         162      1    154     89.89  3.11e-25   37
  5_8S_rRNA   CRW_00529_1           2          76      1    154     20.73  3.49e-05   47



# that is inside "Test_S-Full-Test_no-Tr1Tr2Tr3" ?
#
/usr/local/infernal/bin/cmsearch --tabfile data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.tab     /groups/eddy/home/nawrockie/db/rfam_10.1/Rfam10.1.cm data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.rfam
grep -c ASE  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.fa
2
grep ASE_  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.tab
  2  RNAseP   RNaseP_bact_a  ASE_00291             1         312      1    367     71.03  3.08e-24   24
              RNaseP_bact_b  ASE_00195            55         381      1    365    138.62  4.74e-49   31
  
111 fragments < 50 nts
 96 SSU/LSU

grep -c CRW  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.fa
56
grep CRW_  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.tab
2 2 5.8S RNA    5_8S_rRNA   CRW_00470             1         140      1    154     30.59  4.95e-08   71
                5_8S_rRNA   CRW_00497             3         153      1    154     29.43  1.08e-07   49
 

14 grpI        Intron_gpI  CRW_00007           120         425      1    214     43.32  4.81e-13   55
               Intron_gpI  CRW_00010             7         309      1    214     73.15  1.48e-22   56
               Intron_gpI  CRW_00012            70         379      1    214     57.52  1.42e-17   54
               Intron_gpI  CRW_00608            48         215      1    214     64.11  1.13e-19   52
               Intron_gpI  CRW_00632            50         328      1    214     84.70  3.08e-26   55
               Intron_gpI  CRW_00641            75         151     52    137      8.28  7.13e-02   56
               Intron_gpI  CRW_00650            67         342      1    214     94.96  1.65e-29   52
               Intron_gpI  CRW_00653            41         350      1    214     75.19  3.31e-23   53
               Intron_gpI  CRW_00654            21         317      1    214    101.88  1.03e-31   48
               Intron_gpI  CRW_00657           101         382      1    214     85.28  2.00e-26   60
               Intron_gpI  CRW_00673            65         355      1    214     85.94  1.24e-26   58
               Intron_gpI  CRW_00699            68         383      1    214     81.99  2.25e-25   49
               Intron_gpI  CRW_00703            10         231      1    214     48.84  8.36e-15   24
               Intron_gpI  CRW_00815           143         452      1    214     38.90  1.23e-11   57

 2 grpII       Intron_gpII  CRW_00820           261         363      1     78     13.89  5.80e-02   50
               group-II-D1D4-1  CRW_01134_2         339         411      1     84     16.23  6.14e-03   42

38             SSU/LSU
    
grep -c RFA  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.fa
4
grep RFA_  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.tab
  RNase_MRP   RFA_00624             1         246     14    250    150.24  1.04e-45   56
  Vimentin3   RFA_00642             1          77      1     66     40.35  3.21e-08   32
  Hammerhead_1  RFA_00708             1          46      1     45     35.00  2.54e-08   52
  R2_retro_el  RFA_00818             1         202      1    216    155.52  2.63e-40   43
  
grep -c SPR  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.fa
17
grep SPR_  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.tab
  tRNA        SPR_00021             1          72      1     71     59.97  6.05e-15   54
  tRNA        SPR_00130             1          71      1     71     61.09  2.91e-15   59
  tRNA        SPR_00148             2          73      1     71     58.65  1.43e-14   57
  tRNA        SPR_00210             1          84      1     71     52.11  1.02e-12   61
  tRNA        SPR_00310             1          73      1     71     46.10  5.13e-11   64
  tRNA        SPR_00359             1          74      1     71     63.29  6.96e-16   43
  tRNA        SPR_00412             1          83      1     71     50.85  2.32e-12   55
  tRNA        SPR_00430             1          73      1     71     69.79  1.00e-17   58
  tRNA        SPR_00481             1          72      1     71     59.69  7.24e-15   53
  tRNA        SPR_00598             1          75      1     71     57.87  2.38e-14   67
  tRNA        SPR_00721             1          74      1     71     62.01  1.60e-15   57
  tRNA        SPR_00957             1          75      1     71     58.43  1.65e-14   72
  tRNA        SPR_01012             1          82      1     71     44.29  1.68e-10   60
  tRNA        SPR_01051             1          72      1     71     64.24  3.74e-16   61
  tRNA        SPR_01143             1          72      1     71     58.72  1.37e-14   60
  
grep -c SRP  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.fa
18

grep -c TMR  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.fa
18

grep -c PDB  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.fa
27
grep PDB_  data/TORNADO/fasta/TORNADO_Test_S-Full-Test_no-Tr1Tr2Tr3.tab
 1 SSU SSU_rRNA_archaea  PDB_00409           337         420   1348   1437     26.78  3.09e-08   70
26 small  

TOTALS for TestSetA
================================================
trna        117 +               6 +  17    = 140
srp:         13 +               0 +  18    =  31
tmRNA:       45 +               0 +  18    =  63
RNaseP:      26 +               1 +   2    =  29
5S:          43 +               7 +   0    =  50
telom:       30 +               0 +   0    =  30
grp1:        14 +               0 +  14    =  28
grp2:         2 +               0 +   2    =   4
others:       0 +               2 +  (2+4) =   8
rRNA:         0 +              96 +  39    = 135
small/frag    0 + (17+14+3+8+111) +  26    = 179
=================================================
total       290 +             265 + 142    = 697

=====================================================================
TrainSetA = data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent.sto (3166)
=====================================================================
~/src/easel/miniapps/esl-reformat fasta data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent.sto > data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa


qsub -N cmscan -cwd -b y -V -j y  -o /groups/eddy/home/rivase/src/tornado/data/TORNADO/fasta '/groups/eddy/home/nawrockie/notebook/11_0731_inf_dev_for_elena/wd-infernal/src/cmscan --tblout data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.tab /groups/eddy/home/nawrockie/notebook/11_0731_inf_dev_for_elena/wd-infernal/src/Rfam10.1-1p1a.cm data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa > data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.rfam'

grep -c ".d" data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa
115

grep -c RF00 data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa
151

grep -c ASE data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa
278

grep -c SPR data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa
180

grep -c SRP data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa
213

grep -c TMR data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa
273

grep -c CRW data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa
1524

grep -c PDB data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa
192

grep -c RFA data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent.fa
240

scripts/prune_sto.pl -l 50 data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent.sto data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent_50.sto


~/src/easel/miniapps/esl-reformat fasta data/TORNADO/sto/TORNADO_Tr1Tr2Tr3_Independent_50.sto > data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
LEFT: 2204/3166 sequences

qsub -N cmscan -cwd -b y -V -j y  -o /groups/eddy/home/rivase/src/tornado/data/TORNADO/fasta '/groups/eddy/home/nawrockie/notebook/11_0731_inf_dev_for_elena/wd-infernal/src/cmscan -E 1e-4 --tblout data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.tab /groups/eddy/home/nawrockie/notebook/11_0731_inf_dev_for_elena/wd-infernal/src/Rfam10.1-1p1a.cm data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa > data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.rfam'

962 fragments < 50 nts

grep -c ".d" data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
115/115

  3 58_S
112 SSU/LSU

grep -c RF00 data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
137/151
  1           5S
  1           58S     5_8S_rRNA            RF00002   RF00002_B            -               1     154        1      146      +   1.2e-25   93.4 5.8S ribosomal RNA
  1          tRNA    tRNA                 RF00005   RF00005_A            -               1      71        1       72      +   4.8e-17   68.3 tRNA
  2    telomearse
  1 groupI intron
  3 RNaseP
128 others 

grep -c ASE data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
145/278
grep -c ASE_ data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.tab
129

grep -c SPR data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
147/180
grep -c SPR_ data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.tab
167

grep -c SRP data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
211/213
grep -c SRP_ data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.tab
425

grep -c TMR data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
266/273
grep -c TMR_ data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.tab
245

grep -c CRW data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
976/1524
grep -c CRW_ data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.tab
101
 49  groupI
  4 groupII
 22 5s
  9 58S
892 rRNA (rest)

grep -c PDB data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
34/192
grep -c PDB_ data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.tab
31
 1  58_s 
 9  tRNA
12  riboswitches
 2  ribozymes
 2  RNaseP
 1  SRP
 2  cis
 5 other

grep -c RFA data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.fa
173/240
grep -c RFA_ data/TORNADO/fasta/TORNADO_Tr1Tr2Tr3_Independent_50.tab
169

89 5S
10 telomerase
 3 SRP
71 others


TOTALS for TrainSetA
================================================
trna          147 + 1 +  9 =  157
srp:          211 + 1 +  3 =  215
tmRNA:                        266
RNaseP:       3 + 145 +  2 =  150 
5S:           1 + 22 + 89  =  112
telom:         2 + 10      =   12
grp1:         49 + 1       =   50
grp2:                           4
others:       128 + 14(5.8s) + 12 (riboswithc) + 2 (ribozyme) + 2 (cis) + 71 + 5 = 234
rRNA:         112 + 892   = 1004
small/frag                   962
=================================================
total                       3166
