picard: picard_CollectRnaSeqMetrics.xml annotate

annotate picard_CollectRnaSeqMetrics.xml @ 5:3d4f1fa26f0e draft

Uploaded

author	devteam
date	Tue, 16 Dec 2014 19:03:21 -0500
parents
children	3a3234d7a2e8

rev	line source
5 3d4f1fa26f0e Uploaded devteam parents: diff changeset	1 <tool name="CollectRnaSeqMetrics" id="picard_CollectRnaSeqMetrics" version="1.126.0">
3d4f1fa26f0e Uploaded devteam parents: diff changeset	2 <description> collect metrics about the alignment of RNA to various functional classes of loci in the genome</description>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	3 <requirements>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	4 <requirement type="package" version="1.126.0">picard</requirement>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	5 </requirements>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	6
3d4f1fa26f0e Uploaded devteam parents: diff changeset	7 <macros>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	8 <import>picard_macros.xml</import>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	9 </macros>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	10
3d4f1fa26f0e Uploaded devteam parents: diff changeset	11
3d4f1fa26f0e Uploaded devteam parents: diff changeset	12 <command>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	13
3d4f1fa26f0e Uploaded devteam parents: diff changeset	14 ## Set up input files
3d4f1fa26f0e Uploaded devteam parents: diff changeset	15
3d4f1fa26f0e Uploaded devteam parents: diff changeset	16 ## Reference sequences
3d4f1fa26f0e Uploaded devteam parents: diff changeset	17
3d4f1fa26f0e Uploaded devteam parents: diff changeset	18 #set $reference_fasta_filename = "localref.fa"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	19
3d4f1fa26f0e Uploaded devteam parents: diff changeset	20 #if str( $reference_source.reference_source_selector ) == "history":
3d4f1fa26f0e Uploaded devteam parents: diff changeset	21 ln -s "${reference_source.ref_file}" "${reference_fasta_filename}" &&
3d4f1fa26f0e Uploaded devteam parents: diff changeset	22 #else:
3d4f1fa26f0e Uploaded devteam parents: diff changeset	23 #set $reference_fasta_filename = str( $reference_source.ref_file.fields.path )
3d4f1fa26f0e Uploaded devteam parents: diff changeset	24 #end if
3d4f1fa26f0e Uploaded devteam parents: diff changeset	25
3d4f1fa26f0e Uploaded devteam parents: diff changeset	26 ## refFlat data
3d4f1fa26f0e Uploaded devteam parents: diff changeset	27 ## The awk line below converts a file obtained from UCSC as specified in the tool help to refFlat format
3d4f1fa26f0e Uploaded devteam parents: diff changeset	28
3d4f1fa26f0e Uploaded devteam parents: diff changeset	29 grep -v '^#' ${refFlat} \| awk '{print $11"\t"$1"\t"$2"\t"$3"\t"$4"\t"$5"\t"$6"\t"$7"\t"$8"\t"$9"\t"$10}' > refFlat.tab &&
3d4f1fa26f0e Uploaded devteam parents: diff changeset	30
3d4f1fa26f0e Uploaded devteam parents: diff changeset	31 ## Start picard command
3d4f1fa26f0e Uploaded devteam parents: diff changeset	32
3d4f1fa26f0e Uploaded devteam parents: diff changeset	33 @java_options@
3d4f1fa26f0e Uploaded devteam parents: diff changeset	34 java -jar \$JAVA_JAR_PATH/picard.jar
3d4f1fa26f0e Uploaded devteam parents: diff changeset	35 CollectRnaSeqMetrics
3d4f1fa26f0e Uploaded devteam parents: diff changeset	36 REF_FLAT=refFlat.tab
3d4f1fa26f0e Uploaded devteam parents: diff changeset	37
3d4f1fa26f0e Uploaded devteam parents: diff changeset	38 #if str( $ribosomal_intervals ) != "None":
3d4f1fa26f0e Uploaded devteam parents: diff changeset	39 RIBOSOMAL_INTERVALS="${ribosomal_intervals}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	40 #end if
3d4f1fa26f0e Uploaded devteam parents: diff changeset	41
3d4f1fa26f0e Uploaded devteam parents: diff changeset	42 STRAND_SPECIFICITY="${strand_specificity}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	43 MINIMUM_LENGTH="${minimum_length}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	44 CHART_OUTPUT="${pdfFile}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	45
3d4f1fa26f0e Uploaded devteam parents: diff changeset	46 #for $sequence_to_ignore in $ignore_list:
3d4f1fa26f0e Uploaded devteam parents: diff changeset	47 IGNORE_SEQUENCE="${sequence_to_ignore.sequence}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	48 #end for
3d4f1fa26f0e Uploaded devteam parents: diff changeset	49
3d4f1fa26f0e Uploaded devteam parents: diff changeset	50 RRNA_FRAGMENT_PERCENTAGE="${rrna_fragment_percentage}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	51 METRIC_ACCUMULATION_LEVEL="${metric_accumulation_level}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	52 INPUT="${inputFile}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	53 OUTPUT="${outFile}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	54 REFERENCE_SEQUENCE="${reference_fasta_filename}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	55 ASSUME_SORTED="${assume_sorted}"
3d4f1fa26f0e Uploaded devteam parents: diff changeset	56
3d4f1fa26f0e Uploaded devteam parents: diff changeset	57 QUIET=true
3d4f1fa26f0e Uploaded devteam parents: diff changeset	58 VERBOSITY=ERROR
3d4f1fa26f0e Uploaded devteam parents: diff changeset	59 VALIDATION_STRINGENCY=${validation_stringency}
3d4f1fa26f0e Uploaded devteam parents: diff changeset	60
3d4f1fa26f0e Uploaded devteam parents: diff changeset	61 </command>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	62
3d4f1fa26f0e Uploaded devteam parents: diff changeset	63 <inputs>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	64 <param format="sam,bam" type="data" name="inputFile" label="Select SAM/BAM dataset or dataset collection" help="If empty, upload or import a SAM/BAM dataset" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	65 <conditional name="reference_source">
3d4f1fa26f0e Uploaded devteam parents: diff changeset	66 <param name="reference_source_selector" type="select" label="Load reference genome from">
3d4f1fa26f0e Uploaded devteam parents: diff changeset	67 <option value="cached">Local cache</option>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	68 <option value="history">History</option>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	69 </param>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	70 <when value="cached">
3d4f1fa26f0e Uploaded devteam parents: diff changeset	71 <param name="ref_file" type="select" label="Using reference genome" help="REFERENCE_SEQUENCE">
3d4f1fa26f0e Uploaded devteam parents: diff changeset	72 <options from_data_table="all_fasta"></options>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	73 <validator type="no_options" message="A built-in reference genome is not available for the build associated with the selected input file"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	74 </param>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	75 </when>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	76 <when value="history">
3d4f1fa26f0e Uploaded devteam parents: diff changeset	77 <param name="ref_file" type="data" format="fasta" label="Use the folloing dataset as the reference sequence" help="REFERENCE_SEQUENCE; You can upload a FASTA sequence to the history and use it as reference" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	78 </when>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	79 </conditional>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	80 <param format="tabular" name="refFlat" type="data" label="Gene annotations in refFlat form" help="See "Obtaining gene annotations in refFlat format" below for help" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	81 <param name="ribosomal_intervals" format="picard_interval_list" type="data" optional="True" label="Location of rRNA sequences in genome, in interval_list format" help="RIBOSOMAL_INTERVALS; If not specified no bases will be identified as being ribosomal. The list of intervals can be geberated from BED or Interval datasets using Galaxy BedToIntervalList tool"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	82 <param name="strand_specificity" type="select" label="What is the RNA-seq library strand specificity" help="STRAND_SPECIFICITY; For unpaired reads, use FIRST_READ_TRANSCRIPTION_STRAND if the reads are expected to be on the transcription strand.">
3d4f1fa26f0e Uploaded devteam parents: diff changeset	83 <option value="NONE" select="True">None</option>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	84 <option value="FIRST_READ_TRANSCRIPTION_STRAND">First read transcription strand</option>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	85 <option value="SECOND_READ_TRANSCRIPTION_STRAND">Second read transcription strand</option>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	86 </param>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	87 <param name="minimum_length" type="integer" value="500" label="When calculating coverage based values use only use transcripts of this length or greater" help="MINIMUM_LENGTH; default=500"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	88 <repeat name="ignore_list" title="Sequences to ignore" min="0" help="You can provide multiple sequences by clicking the button below">
3d4f1fa26f0e Uploaded devteam parents: diff changeset	89 <param name="sequence" type="text" size="80" label="Ignore reads matching this sequence"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	90 </repeat>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	91 <param name="rrna_fragment_percentage" type="float" value="0.8" label="This percentage of the length of a fragment must overlap one of the ribosomal intervals for a read or read pair to be considered rRNA." help="RRNA_FRAGMENT_PERCENTAGE; default=0.8"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	92 <param name="metric_accumulation_level" type="select" label="The level(s) at which to accumulate metrics" multiple="true" help="METRIC_ACCUMULATION_LEVEL">
3d4f1fa26f0e Uploaded devteam parents: diff changeset	93 <option value="ALL_READS" selected="True">All reads</option>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	94 <option value="SAMPLE">Sample</option>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	95 <option value="LIBRARY">Library</option>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	96 <option value="READ_GROUP">Read group</option>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	97 </param>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	98 <param name="assume_sorted" type="boolean" label="Assume the input file is already sorted" checked="true" truevalue="true" falsevalue="false" help="ASSUME_SORTED"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	99
3d4f1fa26f0e Uploaded devteam parents: diff changeset	100 <expand macro="VS" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	101
3d4f1fa26f0e Uploaded devteam parents: diff changeset	102 </inputs>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	103 <outputs>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	104 <data format="pdf" name="pdfFile" label="${tool.name} on ${on_string}: Chart PDF"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	105 <data format="tabular" name="outFile" label="${tool.name} on ${on_string}: Summary stats"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	106 </outputs>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	107
3d4f1fa26f0e Uploaded devteam parents: diff changeset	108 <stdio>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	109 <exit_code range="1:" level="fatal"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	110 </stdio>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	111 <tests>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	112 <test>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	113 <param name="reference_source_selector" value="history"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	114 <param name="ref_file" value="picard_CollectRnaSeqMetrics_ref.fa" ftype="fasta"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	115 <param name="inputFile" value="picard_CollectRnaSeqMetrics.bam" ftype="bam"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	116 <param name="assume_sorted" value="true" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	117 <param name="refFlat" value="picard_CollectRnaSeqMetrics.refFlat" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	118 <param name="metric_accumulation_level" value="ALL_READS" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	119 <param name="minimum_length" value="500" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	120 <param name="strand_specificity" value="NONE" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	121 <param name="rrna_fragment_percentage" value="0.8" />
3d4f1fa26f0e Uploaded devteam parents: diff changeset	122 <output name="outFile" file="picard_CollectRnaSeqMetrics_test1.tab" ftype="tabular" lines_diff="4"/>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	123 </test>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	124
3d4f1fa26f0e Uploaded devteam parents: diff changeset	125 </tests>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	126 <help>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	127
3d4f1fa26f0e Uploaded devteam parents: diff changeset	128 .. class:: infomark
3d4f1fa26f0e Uploaded devteam parents: diff changeset	129
3d4f1fa26f0e Uploaded devteam parents: diff changeset	130 Purpose
3d4f1fa26f0e Uploaded devteam parents: diff changeset	131
3d4f1fa26f0e Uploaded devteam parents: diff changeset	132 Collects metrics about the alignment of RNA to various functional classes of loci in the genome: coding, intronic, UTR, intergenic, ribosomal.
3d4f1fa26f0e Uploaded devteam parents: diff changeset	133
3d4f1fa26f0e Uploaded devteam parents: diff changeset	134 @dataset_collections@
3d4f1fa26f0e Uploaded devteam parents: diff changeset	135
3d4f1fa26f0e Uploaded devteam parents: diff changeset	136 -----
3d4f1fa26f0e Uploaded devteam parents: diff changeset	137
3d4f1fa26f0e Uploaded devteam parents: diff changeset	138 .. class:: warningmark
3d4f1fa26f0e Uploaded devteam parents: diff changeset	139
3d4f1fa26f0e Uploaded devteam parents: diff changeset	140 Obtaining gene annotations in refFlat format
3d4f1fa26f0e Uploaded devteam parents: diff changeset	141
3d4f1fa26f0e Uploaded devteam parents: diff changeset	142 This tool requires gene annotations in refFlat_ format. These data can be obtained from UCSC table browser directly through Galaxy by following these steps:
3d4f1fa26f0e Uploaded devteam parents: diff changeset	143
3d4f1fa26f0e Uploaded devteam parents: diff changeset	144 1. Click on Get Data in the upper part of left pane of Galaxy interface
3d4f1fa26f0e Uploaded devteam parents: diff changeset	145 2. Click on UCSC Main link
3d4f1fa26f0e Uploaded devteam parents: diff changeset	146 3. Set your genome and dataset of interest. It must be the same genome build against which you have mapped the reads contained in the BAM file you are analyzing
3d4f1fa26f0e Uploaded devteam parents: diff changeset	147 4. In the output format field choose selected fields from primary and related tables
3d4f1fa26f0e Uploaded devteam parents: diff changeset	148 5. Click get output button
3d4f1fa26f0e Uploaded devteam parents: diff changeset	149 6. In the first table presented at the top of the page select (using checkboxes) first 11 fields:
3d4f1fa26f0e Uploaded devteam parents: diff changeset	150 name
3d4f1fa26f0e Uploaded devteam parents: diff changeset	151 chrom
3d4f1fa26f0e Uploaded devteam parents: diff changeset	152 strand
3d4f1fa26f0e Uploaded devteam parents: diff changeset	153 txStart
3d4f1fa26f0e Uploaded devteam parents: diff changeset	154 txEnd
3d4f1fa26f0e Uploaded devteam parents: diff changeset	155 cdsStart
3d4f1fa26f0e Uploaded devteam parents: diff changeset	156 cdsEnd
3d4f1fa26f0e Uploaded devteam parents: diff changeset	157 exonCount
3d4f1fa26f0e Uploaded devteam parents: diff changeset	158 exonStarts
3d4f1fa26f0e Uploaded devteam parents: diff changeset	159 exonEnds
3d4f1fa26f0e Uploaded devteam parents: diff changeset	160 proteinId
3d4f1fa26f0e Uploaded devteam parents: diff changeset	161 7. Click done with selection
3d4f1fa26f0e Uploaded devteam parents: diff changeset	162 8. Click Send query to Galaxy
3d4f1fa26f0e Uploaded devteam parents: diff changeset	163 9. A new dataset will appear in the current Galaxy history
3d4f1fa26f0e Uploaded devteam parents: diff changeset	164 10. Use this dataset as the input for Gene annotations in refFlat form dropdown of this tool
3d4f1fa26f0e Uploaded devteam parents: diff changeset	165
3d4f1fa26f0e Uploaded devteam parents: diff changeset	166 .. _refFlat: http://genome.ucsc.edu/goldenPath/gbdDescriptionsOld.html#RefFlat
3d4f1fa26f0e Uploaded devteam parents: diff changeset	167
3d4f1fa26f0e Uploaded devteam parents: diff changeset	168 @description@
3d4f1fa26f0e Uploaded devteam parents: diff changeset	169
3d4f1fa26f0e Uploaded devteam parents: diff changeset	170 REF_FLAT=File Gene annotations in refFlat form. Format described here:
3d4f1fa26f0e Uploaded devteam parents: diff changeset	171 http://genome.ucsc.edu/goldenPath/gbdDescriptionsOld.html#RefFlat Required.
3d4f1fa26f0e Uploaded devteam parents: diff changeset	172
3d4f1fa26f0e Uploaded devteam parents: diff changeset	173 RIBOSOMAL_INTERVALS=File Location of rRNA sequences in genome, in interval_list format. If not specified no bases
3d4f1fa26f0e Uploaded devteam parents: diff changeset	174 will be identified as being ribosomal. Format described here:
3d4f1fa26f0e Uploaded devteam parents: diff changeset	175 http://picard.sourceforge.net/javadoc/net/sf/picard/util/IntervalList.html and can be
3d4f1fa26f0e Uploaded devteam parents: diff changeset	176 generated from BED datasetes using Galaxy's wrapper for picard_BedToIntervalList tool
3d4f1fa26f0e Uploaded devteam parents: diff changeset	177
3d4f1fa26f0e Uploaded devteam parents: diff changeset	178 STRAND_SPECIFICITY=StrandSpecificity
3d4f1fa26f0e Uploaded devteam parents: diff changeset	179 STRAND=StrandSpecificity For strand-specific library prep. For unpaired reads, use FIRST_READ_TRANSCRIPTION_STRAND
3d4f1fa26f0e Uploaded devteam parents: diff changeset	180 if the reads are expected to be on the transcription strand. Required. Possible values:
3d4f1fa26f0e Uploaded devteam parents: diff changeset	181 {NONE, FIRST_READ_TRANSCRIPTION_STRAND, SECOND_READ_TRANSCRIPTION_STRAND}
3d4f1fa26f0e Uploaded devteam parents: diff changeset	182
3d4f1fa26f0e Uploaded devteam parents: diff changeset	183 MINIMUM_LENGTH=Integer When calculating coverage based values (e.g. CV of coverage) only use transcripts of this
3d4f1fa26f0e Uploaded devteam parents: diff changeset	184 length or greater. Default value: 500.
3d4f1fa26f0e Uploaded devteam parents: diff changeset	185
3d4f1fa26f0e Uploaded devteam parents: diff changeset	186 IGNORE_SEQUENCE=String If a read maps to a sequence specified with this option, all the bases in the read are
3d4f1fa26f0e Uploaded devteam parents: diff changeset	187 counted as ignored bases.
3d4f1fa26f0e Uploaded devteam parents: diff changeset	188
3d4f1fa26f0e Uploaded devteam parents: diff changeset	189 RRNA_FRAGMENT_PERCENTAGE=Double
3d4f1fa26f0e Uploaded devteam parents: diff changeset	190 This percentage of the length of a fragment must overlap one of the ribosomal intervals
3d4f1fa26f0e Uploaded devteam parents: diff changeset	191 for a read or read pair by this must in order to be considered rRNA. Default value: 0.8.
3d4f1fa26f0e Uploaded devteam parents: diff changeset	192
3d4f1fa26f0e Uploaded devteam parents: diff changeset	193 METRIC_ACCUMULATION_LEVEL=MetricAccumulationLevel
3d4f1fa26f0e Uploaded devteam parents: diff changeset	194 LEVEL=MetricAccumulationLevel The level(s) at which to accumulate metrics. Possible values: {ALL_READS, SAMPLE,
3d4f1fa26f0e Uploaded devteam parents: diff changeset	195 LIBRARY, READ_GROUP} This option may be specified 0 or more times.
3d4f1fa26f0e Uploaded devteam parents: diff changeset	196
3d4f1fa26f0e Uploaded devteam parents: diff changeset	197 ASSUME_SORTED=Boolean
3d4f1fa26f0e Uploaded devteam parents: diff changeset	198 AS=Boolean If true (default), then the sort order in the header file will be ignored. Default
3d4f1fa26f0e Uploaded devteam parents: diff changeset	199 value: true. Possible values: {true, false}
3d4f1fa26f0e Uploaded devteam parents: diff changeset	200
3d4f1fa26f0e Uploaded devteam parents: diff changeset	201 @more_info@
3d4f1fa26f0e Uploaded devteam parents: diff changeset	202
3d4f1fa26f0e Uploaded devteam parents: diff changeset	203 </help>
3d4f1fa26f0e Uploaded devteam parents: diff changeset	204 </tool>

Mercurial > repos > devteam > picard

annotate picard_CollectRnaSeqMetrics.xml @ 5:3d4f1fa26f0e draft