reciprocal_smallest_distance

Sagteware kiekie:
reciprocal_smallest_distance
Sagteware besonderhede:
Weergawe: 1.1.5
Upload datum: 20 Feb 15
Lisensie: Gratis
Populariteit: 42

Rating: 3.5/5 (Total Votes: 2)

reciprocal_smallest_distance is 'n paarsgewyse orthology algoritme wat gebruik globale volgorde belyning en maksimum waarskynlikheid evolusionêre afstand tussen rye akkuraat ontdek orthologs tussen genome.
Die installering Uit 'n Tarball
Aflaai en untar die nuutste weergawe van GitHub:
cd ~
krul -L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Teer xvz
Installeer reciprocal_smallest_distance, om seker te maak Python 2.7 te gebruik:
cd reciprocal_smallest_distance weergawe
python setup.py installeer
Gebruik RSD te Vind Othologs
Die volgende voorbeeld opdragte demonstreer van die belangrikste maniere rsd_search te hardloop. Elke oproep van rsd_search vereis spesifiseer die plek van 'n FASTA-formaat volgorde lêer vir twee genome, het die navraag en onderhewig genome. Hul bestelling is arbitrêr, maar as jy die --ids opsie gebruik, moet die ids kom uit die navraag genoom. Jy moet ook spesifiseer 'n lêer van die resultate van die orthologs gevind deur die RSD algoritme te skryf. Die formaat van die uitvoer lêer bevat een ortholog per lyn. Elke lyn bevat die navraag volgorde id, onderhewig volgorde id, en afstand (bereken deur codeml) tussen die rye. Jy kan opsioneel spesifiseer 'n lêer met ids die gebruik van die --ids opsie. Dan RSD sal slegs soek orthologs vir diegene ids. Met behulp van --divergence en --evalue, jy het die opsie van die gebruik van verskillende drempels van die standaard.
Kry hulp oor hoe rsd_search, rsd_blast, of rsd_format uit te voer:
rsd_search h
rsd_blast h
rsd_format h
Vind orthologs tussen al die rye in die navraag en onderhewig genome, met behulp van standaard afwyking en evalue drempels
rsd_search -q voorbeelde / genome / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoom = voorbeelde / genome / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Vind orthologs met behulp van verskeie nie-standaard afwyking en evalue drempels
rsd_search -q voorbeelde / genome / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoom = voorbeelde / genome / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0.2 1e-20 --de 0,5 0.00001 --de 0.8 0.1
Dit is nie nodig om 'n FASTA lêer vir BLAST om die formaat of bereken BLAST treffers omdat rsd_search doen dit vir jou.
Maar as jy van plan loop rsd_search verskeie kere vir dieselfde genome, veral vir groot genome, kan u tyd bespaar deur die gebruik van rsd_format die FASTA lêers en rsd_blast te preformatting te precomputing Die ontploffing treffers. Toe hardloop rsd_blast, maak seker dat 'n --evalue te gebruik so groot soos die grootste evalue drumpel jy van plan is om te gee om rsd_search.
Hier is hoe om 'n paar van die FASTA lêers formaat in plek:
rsd_format G voorbeelde / genome / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format G voorbeelde / genome / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
En hier is hoe die FASTA lêers te formateer, om die resultate in 'n ander gids (die huidige gids in hierdie geval)
rsd_format G voorbeelde / genome / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa d.
rsd_format G voorbeelde / genome / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa d.
Hier is hoe om vorentoe te bereken en reverse ontploffing treffers (met behulp van die verstek evalue):
rsd_blast v -q voorbeelde / genome / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoom = voorbeelde / genome / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-treffers q_s.hits --reverse-treffers s_q.hits
Hier is hoe om vorentoe te bereken en omgekeerde ontploffing treffers vir rsd_search, met behulp van genome wat reeds geformateer vir ontploffing en 'n nie-standaard evalue
rsd_blast v -q Mycoplasma_genitalium.aa
--subject-genoom = Mycobacterium_leprae.aa
--forward-treffers q_s.hits --reverse-treffers s_q.hits
--no-formaat --evalue 0.1
Vind orthologs tussen al die rye in die navraag en onderhewig genome met behulp van genome wat reeds geformateer vir ontploffing
rsd_search -q Mycoplasma_genitalium.aa
--subject-genoom = Mycobacterium_leprae.aa
o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-formaat
Vind orthologs tussen al die rye in die navraag en onderhewig genome met behulp van treffers wat reeds bereken. Let daarop dat --no-formaat is ingesluit, want sedert die ontploffing treffers reeds bereken die genome hoef nie te geformateer word vir die ontploffing.
rsd_search v --query-genoom Mycoplasma_genitalium.aa
--subject-genoom = Mycobacterium_leprae.aa
o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-treffers q_s.hits --reverse-treffers s_q.hits --no-formaat
Vind orthologs vir spesifieke volgordes in die navraag genoom. Vir die vind van orthologs vir slegs 'n paar rye, met behulp van --no-ontploffing-kas kan bespoedig berekening. YMMV.
rsd_search -q voorbeelde / genome / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genoom = voorbeelde / genome / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
o voorbeelde / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids voorbeelde / Mycoplasma_genitalium.aa.ids.txt --no-ontploffing-kas
uitvoer formate
Orthologs kan in verskillende formate met behulp van die --outfmt opsie rsd_search gered word. Die standaard formaat, --outfmt -1, verwys na --outfmt 3. geïnspireer deur Uniprot dat lêers, 'n stel van orthologs begin met 'n parameters lyn, dan het 0 of meer ortholog lyne, dan het 'n einde lyn. Die parametes is die navraag genoom naam, onderwerp genoom naam, divergensie drumpel, en evalue drumpel. Elke ortholog is op 'n enkele lyn die lys van die navraag volgorde id, die onderwerp volgorde id, en die maksimum skatting waarskynlikheid afstand. Hierdie formaat kan orthologs vir verskeie stelle parameters in 'n enkele lêer asook stelle parameters met geen orthologs verteenwoordig. Daarom is dit geskik vir gebruik met rsd_search wanneer spesifiseer verskeie divergensie en evalue drempels.
Hier is 'n voorbeeld wat 2 parameter kombinasies, waarvan een het geen orthologs:
PA tLACJO tYEAS7 t0.2 t1e-15
OF tQ74IU0 tA6ZM40 t1.7016
OF tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
Die oorspronklike formaat van RSD, --outfmt 1, word voorsiening gemaak vir agtertoe verenigbaarheid. Elke lyn bevat 'n ortholog, verteenwoordig as vak volgorde id, navraag volgorde id, en maksimum skatting waarskynlikheid afstand. Dit kan net 'n enkele stel orthologs verteenwoordig in 'n lêer.
Voorbeeld:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Ook vir backward compatibility is 'n formaat intern gebruik deur Roundup (http://roundup.hms.harvard.edu/) wat soos die oorspronklike RSD formaat, behalwe die navraag volgorde ID kolom voor die onderwerp volgorde id.
Voorbeeld:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Vereistes :

  • Python
  • Ncbi BLAST 2.2.24
  • PAML 4.4
  • Kalign 2,04

Soortgelyke sagteware

picme
picme

11 May 15

SyntenyMiner
SyntenyMiner

3 Jun 15

goby
goby

14 Apr 15

Kommentaar te reciprocal_smallest_distance

Kommentaar nie gevind
Kommentaar te lewer
Draai op die foto!