mira4_assembler: tools/mira4/mira4_de

author	peterjc
date	Fri, 21 Nov 2014 06:42:56 -0500
parents
children

rev	line source
0 6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	1 <tool id="mira_4_0_de_novo" name="MIRA v4.0 de novo assember" version="0.0.4">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	2 <description>Takes Sanger, Roche 454, Solexa/Illumina, Ion Torrent and PacBio reads</description>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	3 <requirements>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	4 <requirement type="binary">mira</requirement>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	5 <requirement type="binary">miraconvert</requirement>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	6 <requirement type="package" version="4.0">MIRA</requirement>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	7 <requirement type="binary">samtools</requirement>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	8 <requirement type="package" version="0.1.19">samtools</requirement>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	9 </requirements>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	10 <version_command interpreter="python">mira4.py --version</version_command>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	11 <command interpreter="python">mira4.py
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	12 --manifest "$manifest"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	13 #if str($maf_wanted)=="true":
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	14 --maf "$out_maf"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	15 #end if
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	16 #if str($bam_wanted)=="true":
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	17 --bam "$out_bam"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	18 #end if
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	19 --fasta "$out_fasta"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	20 --log "$out_log"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	21 </command>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	22 <stdio>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	23 <!-- Assume anything other than zero is an error -->
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	24 <exit_code range="1:" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	25 <exit_code range=":-1" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	26 </stdio>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	27 <inputs>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	28 <param name="job_type" type="select" label="Assembly type">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	29 <option value="genome">Genome</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	30 <option value="est">EST (transcriptome)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	31 </param>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	32 <param name="job_quality" type="select" label="Assembly quality grade">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	33 <option value="accurate">Accurate</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	34 <option value="draft">Draft</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	35 </param>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	36 <repeat name="read_group" title="Read Group" min="1">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	37 <param name="technology" type="select" label="Read technology">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	38 <option value="solexa">Solexa/Illumina</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	39 <option value="sanger">Sanger cappillary sequencing</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	40 <option value="454">Roche 454</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	41 <option value="iontor">Ion Torrent</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	42 <option value="pcbiolq">PacBio low quality (raw)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	43 <option value="pcbiohq">PacBio high quality (corrected)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	44 <option value="text">Synthetic reads (database entries, consensus sequences, artifical reads, etc)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	45 <!-- TODO reference/backbone as an entry here? -->
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	46 </param>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	47 <conditional name="segments">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	48 <param name="type" type="select" label="Are these paired reads?">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	49 <option value="paired">Paired reads</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	50 <option value="none">Single reads or not relevant (e.g. primer walking with Sanger capillary sequencing)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	51 </param>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	52 <when value="paired">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	53 <param name="placement" type="select" label="Pairing type (segment placing)">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	54 <option value="FR">---> <--- (e.g. Sanger capillary or Solexa/Illumina paired-end library)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	55 <option value="RF"><--- ---> (e.g. Solexa/Illumina mate-pair library)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	56 <option value="SB">2---> 1---> (e.g. Roche 454 paired-end libraries or IonTorrent long-mate; see note)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	57 </param>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	58 <!-- min/max validation is done via the <code> tag -->
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	59 <param name="min_size" type="integer" optional="true" min="0" value=""
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	60 label="Minimum size of 'good' DNA templates in the library preparation"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	61 help="Optional, but if used you must also supply a maximum value." />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	62 <param name="max_size" type="integer" optional="true" min="0" value=""
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	63 label="Maximum size of 'good' DNA templates in the library preparation"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	64 help="Optional, but if used you must also supply a minimum value." />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	65 <param name="naming" type="select" label="Pair naming convention">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	66 <option value="solexa">Solexa/Illumina (using '/1' and '/2' suffixes, or later Illumina colon system)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	67 <option value="FR">Forward/Reverse scheme (using '.f' and '.r' suffixes)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	68 <option value="tigr">TIGR scheme (using 'TF' and 'TR' suffixes)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	69 <option value="sanger">Sanger scheme (see notes)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	70 <option value="stlouis">St. Louis scheme (see notes)</option>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	71 </param>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	72 </when>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	73 <when value="none" /><!-- no further questions -->
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	74 </conditional>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	75 <param name="filenames" type="data" format="fastq,mira" multiple="true" required="true" label="Read file(s)"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	76 help="Multiple files allowed, for example paired reads can be given as two files (MIRA looks at read names to identify pairs)." />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	77 </repeat>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	78 <param name="maf_wanted" type="boolean" label="Output assembly in MIRA's own format?" checked="False" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	79 <param name="bam_wanted" type="boolean" label="Convert assembly into BAM format?" checked="True" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	80 </inputs>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	81 <code file="mira4_validator.py" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	82 <outputs>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	83 <data name="out_fasta" format="fasta" label="MIRA de novo contigs (FASTA)" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	84 <data name="out_bam" format="bam" label="MIRA de novo assembly (BAM)">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	85 <filter>bam_wanted is True</filter>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	86 </data>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	87 <data name="out_maf" format="mira" label="MIRA de novo assembly">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	88 <filter>maf_wanted is True</filter>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	89 </data>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	90 <!-- TODO?
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	91 <data name="out_contigstats" format="tabular" label="MIRA contig stats" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	92 -->
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	93 <data name="out_log" format="txt" label="MIRA de novo log" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	94 </outputs>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	95 <configfiles>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	96 <configfile name="manifest">
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	97 project = MIRA
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	98 job = denovo,${job_type},${job_quality}
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	99 parameters = -NW:cmrnl=no -DI:trt=/tmp -OUT:orc=no
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	100 ## -GE:not is short for -GENERAL:number_of_threads and using one (1)
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	101 ## can be useful for repeatability of assemblies and bug hunting.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	102 ## This is overriden by the command line -t switch which is easier
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	103 ## to set from within Galaxy.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	104 ##
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	105 ## -NW:cmrnl is short for -NAG_AND_WARN:check_maxreadnamelength
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	106 ## and without this MIRA aborts with read names over 40 characters
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	107 ## due to limitations of some downstream tools.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	108 ##
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	109 ## -DI:trt is short for -DIRECTORY:tmp_redirected_to and should
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	110 ## point to a local hard drive (not something like NFS on network).
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	111 ## We replace /tmp with an environment variable via mira4.py
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	112 ##
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	113 ## -OUT:orc=no is short for -OUTPUT:output_result_caf=no
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	114 ## which turns off an output file we don't want anyway.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	115
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	116 #for $rg in $read_group
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	117
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	118 ##This bar goes into the manifest as a comment line
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	119 #------------------------------------------------------------------------------
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	120
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	121 readgroup
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	122 technology = ${rg.technology}
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	123 ##Record the segment placement (if any)
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	124 #if str($rg.segments.type) == "paired"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	125 segment_placement = ${rg.segments.placement}
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	126 segment_naming = ${rg.segments.naming}
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	127 #if str($rg.segments.min_size) != "" or str($rg.segments.max_size) != ""
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	128 ##If our min/max validation failed I trust MIRA to give an error message...
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	129 template_size = $rg.segments.min_size $rg.segments.max_size
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	130 #end if
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	131 #end if
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	132 ##if str($rg.segments.type) == "none"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	133 ##MIRA4 manual says use segment_placement = unknown or ? for unpaired data
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	134 ##but this stopped working in MIRA 4.0 RC5 and 4.0 (final). See:
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	135 ##http://www.freelists.org/post/mira_talk/Unpaired-reads-and-segment-placement--or-unknown
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	136 ##segment_placement = ?
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	137 ##end if
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	138 ##MIRA will accept multiple filenames on one data line, or multiple data lines
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	139 #for $f in $rg.filenames
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	140 ##Must now map Galaxy datatypes to MIRA file types...
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	141 #if $f.ext.startswith("fastq")
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	142 ##MIRA doesn't like fastqsanger etc, just plain old fastq:
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	143 data = fastq::$f
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	144 #elif $f.ext == "mira"
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	145 ##We're calling *.maf the "mira" format in Galaxy (name space collision)
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	146 data = maf::$f
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	147 #else
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	148 ##MIRA is happy with fasta as name,
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	149 data = ${f.ext}::$f
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	150 #end if
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	151 #end for
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	152 #end for
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	153 </configfile>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	154 </configfiles>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	155 <tests>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	156 <!-- Tiger mitochondria, selected paired end Illumina reads from SRR639755
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	157 Note we're using just one repeat group, and only the filenames parameter
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	158 within it, so this should work with current test framework limitations:
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	159 TODO: Revise example and/or -NW:cac=warn and -NW:acv=80 settings
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	160 MIRA 4.0 complains as coverage is about x93 which is over 80 limit.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	161 Also MIRA 4.0 gives three contigs as output.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	162 <test>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	163 <param name="job_type" value="genome" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	164 <param name="job_quality" value="accurate" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	165 <param name="filenames" value="SRR639755_mito_pairs.fastq.gz" ftype="fastqsanger" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	166 <output name="out_fasta" file="SRR639755_mito_pairs.mira4_de_novo.fasta" ftype="fasta" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	167 </test>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	168 -->
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	169 <!-- Simple assembly based on MIRA's minidemo/demo4 example
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	170 Note we're using just one repeat group,
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	171 but several parameters with the repeat
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	172 -->
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	173 <test>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	174 <param name="job_type" value="genome" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	175 <param name="job_quality" value="accurate" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	176 <param name="technology" value="sanger" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	177 <param name="type" value="none" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	178 <param name="filenames" value="U13small_m.fastq" ftype="fastqsanger" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	179 <param name="maf_wanted" value="true"/>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	180 <param name="bam_wanted" value="true"/>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	181 <output name="out_fasta" file="U13small_m.mira4_de_novo.fasta" ftype="fasta" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	182 <output name="out_bam" file="empty_file.dat" compare="contains" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	183 <!-- TODO: Suggest startswith as a compare method? -->
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	184 <output name="out_maf" file="header.mira" compare="contains" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	185 <output name="out_log" file="empty_file.dat" compare="contains" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	186 </test>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	187 <!-- Simple assembly based on MIRA's minidemo/solexa1 example
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	188 Note we're using just one repeat group,
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	189 but two parameters within the repeat (filename, no pairing)
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	190 -->
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	191 <test>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	192 <param name="job_type" value="genome" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	193 <param name="job_quality" value="accurate" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	194 <param name="type" value="none" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	195 <param name="filenames" value="ecoli.fastq" ftype="fastqsanger" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	196 <param name="maf_wanted" value="false"/>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	197 <param name="bam_wanted" value="false"/>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	198 <output name="out_fasta" file="ecoli.mira4_de_novo.fasta" ftype="fasta" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	199 <output name="out_log" file="empty_file.dat" compare="contains" />
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	200 </test>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	201 </tests>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	202 <help>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	203
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	204 What it does
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	205
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	206 Runs MIRA v4.0 in de novo mode, collects the output, generates a sorted BAM
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	207 file, and then throws away all the temporary files.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	208
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	209 MIRA is an open source assembly tool capable of handling sequence data from
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	210 a range of platforms (Sanger capillary, Solexa/Illumina, Roche 454, Ion Torrent
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	211 and also PacBio).
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	212
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	213 It is particularly suited to small genomes such as bacteria.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	214
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	215
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	216 Notes on paired reads
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	217
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	218 .. class:: warningmark
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	219
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	220 MIRA uses read naming conventions to identify paired read partners
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	221 (and does not care about their order in the input files). In most cases,
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	222 the Solexa/Illumina setting is fine. For Sanger capillary sequencing,
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	223 you may need to rename your reads to match one of the standard conventions
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	224 supported by MIRA. For Roche 454 or Ion Torrent the appropriate settings
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	225 depend on how the FASTQ file was produced:
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	226
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	227 * If using Roche's ``sffinfo`` or older versions of ``sff_extract``
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	228 to convert SFF files to FASTQ, your reads will probably have the
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	229 ``---> <---`` orientation and use the ``.f`` and ``.r``
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	230 suffixes (FR naming).
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	231
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	232 * If using a recent version of ``sff_extract``, then the ``/1`` and ``/2``
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	233 suffixes are used (Solexa/Illumina style naming) and the original
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	234 ``2---> 1--->`` orientation is preserved.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	235
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	236 The reason for this is the raw data for Roche 454 and Ion Torrent paired-end
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	237 libraries sequences a circularised fragment such that the raw data begins
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	238 with the end of the fragment, a linker, then the start of the fragment.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	239 This means both the start and end are sequenced from the same strand, and
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	240 have the orientation ``2---> 1--->``. However, in order to use the data
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	241 with traditional tools expecting Sanger capillary style ``---> <---``
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	242 orientation it was common to reverse complement one of the pair to mimic this.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	243
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	244
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	245 Citation
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	246
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	247 If you use this Galaxy tool in work leading to a scientific publication please
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	248 cite the following papers:
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	249
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	250 Peter J.A. Cock, Björn A. Grüning, Konrad Paszkiewicz and Leighton Pritchard (2013).
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	251 Galaxy tools and workflows for sequence analysis with applications
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	252 in molecular plant pathology. PeerJ 1:e167
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	253 http://dx.doi.org/10.7717/peerj.167
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	254
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	255 Bastien Chevreux, Thomas Wetter and Sándor Suhai (1999).
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	256 Genome Sequence Assembly Using Trace Signals and Additional Sequence Information.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	257 Computer Science and Biology: Proceedings of the German Conference on Bioinformatics (GCB) 99, pp. 45-56.
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	258 http://www.bioinfo.de/isb/gcb99/talks/chevreux/main.html
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	259
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	260 This wrapper is available to install into other Galaxy Instances via the Galaxy
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	261 Tool Shed at http://toolshed.g2.bx.psu.edu/view/peterjc/mira4_assembler
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	262 </help>
6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed peterjc parents: diff changeset	263 </tool>

0

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

1 <tool id="mira_4_0_de_novo" name="MIRA v4.0 de novo assember" version="0.0.4">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

2 <description>Takes Sanger, Roche 454, Solexa/Illumina, Ion Torrent and PacBio reads</description>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

3 <requirements>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

4 <requirement type="binary">mira</requirement>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

5 <requirement type="binary">miraconvert</requirement>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

6 <requirement type="package" version="4.0">MIRA</requirement>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

7 <requirement type="binary">samtools</requirement>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

8 <requirement type="package" version="0.1.19">samtools</requirement>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

9 </requirements>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

10 <version_command interpreter="python">mira4.py --version</version_command>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

11 <command interpreter="python">mira4.py

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

12 --manifest "$manifest"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

13 #if str($maf_wanted)=="true":

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

14 --maf "$out_maf"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

15 #end if

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

16 #if str($bam_wanted)=="true":

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

17 --bam "$out_bam"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

18 #end if

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

19 --fasta "$out_fasta"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

20 --log "$out_log"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

21 </command>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

22 <stdio>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

23

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

24 <exit_code range="1:" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

25 <exit_code range=":-1" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

26 </stdio>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

27 <inputs>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

28 <param name="job_type" type="select" label="Assembly type">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

29 <option value="genome">Genome</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

30 <option value="est">EST (transcriptome)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

31 </param>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

32 <param name="job_quality" type="select" label="Assembly quality grade">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

33 <option value="accurate">Accurate</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

34 <option value="draft">Draft</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

35 </param>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

36 <repeat name="read_group" title="Read Group" min="1">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

37 <param name="technology" type="select" label="Read technology">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

38 <option value="solexa">Solexa/Illumina</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

39 <option value="sanger">Sanger cappillary sequencing</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

40 <option value="454">Roche 454</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

41 <option value="iontor">Ion Torrent</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

42 <option value="pcbiolq">PacBio low quality (raw)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

43 <option value="pcbiohq">PacBio high quality (corrected)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

44 <option value="text">Synthetic reads (database entries, consensus sequences, artifical reads, etc)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

45

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

46 </param>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

47 <conditional name="segments">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

48 <param name="type" type="select" label="Are these paired reads?">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

49 <option value="paired">Paired reads</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

50 <option value="none">Single reads or not relevant (e.g. primer walking with Sanger capillary sequencing)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

51 </param>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

52 <when value="paired">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

53 <param name="placement" type="select" label="Pairing type (segment placing)">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

54 <option value="FR">---> <--- (e.g. Sanger capillary or Solexa/Illumina paired-end library)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

55 <option value="RF"><--- ---> (e.g. Solexa/Illumina mate-pair library)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

56 <option value="SB">2---> 1---> (e.g. Roche 454 paired-end libraries or IonTorrent long-mate; see note)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

57 </param>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

58

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

59 <param name="min_size" type="integer" optional="true" min="0" value=""

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

60 label="Minimum size of 'good' DNA templates in the library preparation"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

61 help="Optional, but if used you must also supply a maximum value." />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

62 <param name="max_size" type="integer" optional="true" min="0" value=""

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

63 label="Maximum size of 'good' DNA templates in the library preparation"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

64 help="Optional, but if used you must also supply a minimum value." />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

65 <param name="naming" type="select" label="Pair naming convention">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

66 <option value="solexa">Solexa/Illumina (using '/1' and '/2' suffixes, or later Illumina colon system)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

67 <option value="FR">Forward/Reverse scheme (using '.f*' and '.r*' suffixes)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

68 <option value="tigr">TIGR scheme (using 'TF*' and 'TR*' suffixes)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

69 <option value="sanger">Sanger scheme (see notes)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

70 <option value="stlouis">St. Louis scheme (see notes)</option>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

71 </param>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

72 </when>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

73 <when value="none" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

74 </conditional>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

75 <param name="filenames" type="data" format="fastq,mira" multiple="true" required="true" label="Read file(s)"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

76 help="Multiple files allowed, for example paired reads can be given as two files (MIRA looks at read names to identify pairs)." />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

77 </repeat>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

78 <param name="maf_wanted" type="boolean" label="Output assembly in MIRA's own format?" checked="False" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

79 <param name="bam_wanted" type="boolean" label="Convert assembly into BAM format?" checked="True" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

80 </inputs>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

81 <code file="mira4_validator.py" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

82 <outputs>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

83 <data name="out_fasta" format="fasta" label="MIRA de novo contigs (FASTA)" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

84 <data name="out_bam" format="bam" label="MIRA de novo assembly (BAM)">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

85 <filter>bam_wanted is True</filter>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

86 </data>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

87 <data name="out_maf" format="mira" label="MIRA de novo assembly">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

88 <filter>maf_wanted is True</filter>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

89 </data>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

90 <!-- TODO?

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

91 <data name="out_contigstats" format="tabular" label="MIRA contig stats" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

92 -->

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

93 <data name="out_log" format="txt" label="MIRA de novo log" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

94 </outputs>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

95 <configfiles>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

96 <configfile name="manifest">

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

97 project = MIRA

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

98 job = denovo,${job_type},${job_quality}

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

99 parameters = -NW:cmrnl=no -DI:trt=/tmp -OUT:orc=no

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

100 ## -GE:not is short for -GENERAL:number_of_threads and using one (1)

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

101 ## can be useful for repeatability of assemblies and bug hunting.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

102 ## This is overriden by the command line -t switch which is easier

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

103 ## to set from within Galaxy.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

104 ##

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

105 ## -NW:cmrnl is short for -NAG_AND_WARN:check_maxreadnamelength

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

106 ## and without this MIRA aborts with read names over 40 characters

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

107 ## due to limitations of some downstream tools.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

108 ##

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

109 ## -DI:trt is short for -DIRECTORY:tmp_redirected_to and should

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

110 ## point to a local hard drive (not something like NFS on network).

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

111 ## We replace /tmp with an environment variable via mira4.py

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

112 ##

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

113 ## -OUT:orc=no is short for -OUTPUT:output_result_caf=no

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

114 ## which turns off an output file we don't want anyway.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

115

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

116 #for $rg in $read_group

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

117

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

118 ##This bar goes into the manifest as a comment line

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

119 #------------------------------------------------------------------------------

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

120

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

121 readgroup

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

122 technology = ${rg.technology}

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

123 ##Record the segment placement (if any)

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

124 #if str($rg.segments.type) == "paired"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

125 segment_placement = ${rg.segments.placement}

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

126 segment_naming = ${rg.segments.naming}

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

127 #if str($rg.segments.min_size) != "" or str($rg.segments.max_size) != ""

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

128 ##If our min/max validation failed I trust MIRA to give an error message...

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

129 template_size = $rg.segments.min_size $rg.segments.max_size

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

130 #end if

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

131 #end if

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

132 ##if str($rg.segments.type) == "none"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

133 ##MIRA4 manual says use segment_placement = unknown or ? for unpaired data

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

134 ##but this stopped working in MIRA 4.0 RC5 and 4.0 (final). See:

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

135 ##http://www.freelists.org/post/mira_talk/Unpaired-reads-and-segment-placement--or-unknown

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

136 ##segment_placement = ?

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

137 ##end if

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

138 ##MIRA will accept multiple filenames on one data line, or multiple data lines

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

139 #for $f in $rg.filenames

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

140 ##Must now map Galaxy datatypes to MIRA file types...

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

141 #if $f.ext.startswith("fastq")

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

142 ##MIRA doesn't like fastqsanger etc, just plain old fastq:

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

143 data = fastq::$f

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

144 #elif $f.ext == "mira"

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

145 ##We're calling *.maf the "mira" format in Galaxy (name space collision)

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

146 data = maf::$f

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

147 #else

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

148 ##MIRA is happy with fasta as name,

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

149 data = ${f.ext}::$f

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

150 #end if

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

151 #end for

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

152 #end for

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

153 </configfile>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

154 </configfiles>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

155 <tests>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

156 <!-- Tiger mitochondria, selected paired end Illumina reads from SRR639755

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

157 Note we're using just one repeat group, and only the filenames parameter

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

158 within it, so this should work with current test framework limitations:

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

159 TODO: Revise example and/or -NW:cac=warn and -NW:acv=80 settings

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

160 MIRA 4.0 complains as coverage is about x93 which is over 80 limit.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

161 Also MIRA 4.0 gives three contigs as output.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

162 <test>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

163 <param name="job_type" value="genome" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

164 <param name="job_quality" value="accurate" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

165 <param name="filenames" value="SRR639755_mito_pairs.fastq.gz" ftype="fastqsanger" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

166 <output name="out_fasta" file="SRR639755_mito_pairs.mira4_de_novo.fasta" ftype="fasta" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

167 </test>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

168 -->

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

169 <!-- Simple assembly based on MIRA's minidemo/demo4 example

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

170 Note we're using just one repeat group,

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

171 but several parameters with the repeat

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

172 -->

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

173 <test>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

174 <param name="job_type" value="genome" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

175 <param name="job_quality" value="accurate" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

176 <param name="technology" value="sanger" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

177 <param name="type" value="none" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

178 <param name="filenames" value="U13small_m.fastq" ftype="fastqsanger" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

179 <param name="maf_wanted" value="true"/>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

180 <param name="bam_wanted" value="true"/>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

181 <output name="out_fasta" file="U13small_m.mira4_de_novo.fasta" ftype="fasta" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

182 <output name="out_bam" file="empty_file.dat" compare="contains" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

183

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

184 <output name="out_maf" file="header.mira" compare="contains" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

185 <output name="out_log" file="empty_file.dat" compare="contains" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

186 </test>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

187 <!-- Simple assembly based on MIRA's minidemo/solexa1 example

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

188 Note we're using just one repeat group,

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

189 but two parameters within the repeat (filename, no pairing)

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

190 -->

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

191 <test>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

192 <param name="job_type" value="genome" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

193 <param name="job_quality" value="accurate" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

194 <param name="type" value="none" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

195 <param name="filenames" value="ecoli.fastq" ftype="fastqsanger" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

196 <param name="maf_wanted" value="false"/>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

197 <param name="bam_wanted" value="false"/>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

198 <output name="out_fasta" file="ecoli.mira4_de_novo.fasta" ftype="fasta" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

199 <output name="out_log" file="empty_file.dat" compare="contains" />

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

200 </test>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

201 </tests>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

202 <help>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

203

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

204 **What it does**

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

205

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

206 Runs MIRA v4.0 in de novo mode, collects the output, generates a sorted BAM

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

207 file, and then throws away all the temporary files.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

208

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

209 MIRA is an open source assembly tool capable of handling sequence data from

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

210 a range of platforms (Sanger capillary, Solexa/Illumina, Roche 454, Ion Torrent

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

211 and also PacBio).

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

212

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

213 It is particularly suited to small genomes such as bacteria.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

214

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

215

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

216 **Notes on paired reads**

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

217

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

218 .. class:: warningmark

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

219

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

220 MIRA uses read naming conventions to identify paired read partners

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

221 (and does not care about their order in the input files). In most cases,

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

222 the Solexa/Illumina setting is fine. For Sanger capillary sequencing,

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

223 you may need to rename your reads to match one of the standard conventions

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

224 supported by MIRA. For Roche 454 or Ion Torrent the appropriate settings

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

225 depend on how the FASTQ file was produced:

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

226

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

227 * If using Roche's ``sffinfo`` or older versions of ``sff_extract``

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

228 to convert SFF files to FASTQ, your reads will probably have the

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

229 ``---> <---`` orientation and use the ``.f`` and ``.r``

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

230 suffixes (FR naming).

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

231

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

232 * If using a recent version of ``sff_extract``, then the ``/1`` and ``/2``

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

233 suffixes are used (Solexa/Illumina style naming) and the original

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

234 ``2---> 1--->`` orientation is preserved.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

235

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

236 The reason for this is the raw data for Roche 454 and Ion Torrent paired-end

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

237 libraries sequences a circularised fragment such that the raw data begins

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

238 with the end of the fragment, a linker, then the start of the fragment.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

239 This means both the start and end are sequenced from the same strand, and

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

240 have the orientation ``2---> 1--->``. However, in order to use the data

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

241 with traditional tools expecting Sanger capillary style ``---> <---``

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

242 orientation it was common to reverse complement one of the pair to mimic this.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

243

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

244

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

245 **Citation**

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

246

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

247 If you use this Galaxy tool in work leading to a scientific publication please

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

248 cite the following papers:

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

249

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

250 Peter J.A. Cock, Björn A. Grüning, Konrad Paszkiewicz and Leighton Pritchard (2013).

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

251 Galaxy tools and workflows for sequence analysis with applications

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

252 in molecular plant pathology. PeerJ 1:e167

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

253 http://dx.doi.org/10.7717/peerj.167

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

254

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

255 Bastien Chevreux, Thomas Wetter and Sándor Suhai (1999).

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

256 Genome Sequence Assembly Using Trace Signals and Additional Sequence Information.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

257 Computer Science and Biology: Proceedings of the German Conference on Bioinformatics (GCB) 99, pp. 45-56.

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

258 http://www.bioinfo.de/isb/gcb99/talks/chevreux/main.html

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

259

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

260 This wrapper is available to install into other Galaxy Instances via the Galaxy

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

261 Tool Shed at http://toolshed.g2.bx.psu.edu/view/peterjc/mira4_assembler

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

262 </help>

6a88b42ce6b9 Uploaded v0.0.4, previously only on the TestToolShed

peterjc

parents:

diff changeset

263 </tool>

Mercurial > repos > peterjc > mira4_assembler

annotate tools/mira4/mira4_de_novo.xml @ 0:6a88b42ce6b9 draft