s_mart: SMART/galaxy/WrappGetLetterDistribution.xml annotate

annotate SMART/galaxy/WrappGetLetterDistribution.xml @ 36:44d5973c188c

Uploaded

author	m-zytnicki
date	Tue, 30 Apr 2013 15:02:29 -0400
parents
children

rev	line source
36 44d5973c188c Uploaded m-zytnicki parents: diff changeset	1 <tool id="getLetterDistribution1" name="get letter distribution">
44d5973c188c Uploaded m-zytnicki parents: diff changeset	2 <description>Calculate distribution for each nucleotide per position for all short reads</description>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	3 <command interpreter="python">
44d5973c188c Uploaded m-zytnicki parents: diff changeset	4 WrappGetLetterDistribution.py -i $inputFileName
44d5973c188c Uploaded m-zytnicki parents: diff changeset	5 #if $formatType.FormatInputFileName == 'fasta':
44d5973c188c Uploaded m-zytnicki parents: diff changeset	6 -f fasta
44d5973c188c Uploaded m-zytnicki parents: diff changeset	7 #else :
44d5973c188c Uploaded m-zytnicki parents: diff changeset	8 -f fastq
44d5973c188c Uploaded m-zytnicki parents: diff changeset	9 #end if
44d5973c188c Uploaded m-zytnicki parents: diff changeset	10 -c $ouputFileNameCSV -a $ouputFileNamePNG1 -b $ouputFileNamePNG2
44d5973c188c Uploaded m-zytnicki parents: diff changeset	11 </command>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	12 <inputs>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	13 <conditional name="formatType">
44d5973c188c Uploaded m-zytnicki parents: diff changeset	14 <param name="FormatInputFileName" type="select" label="Input File Format">
44d5973c188c Uploaded m-zytnicki parents: diff changeset	15 <option value="fasta">fasta</option>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	16 <option value="fastq" selected="true">fastq</option>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	17 </param>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	18 <when value="fasta">
44d5973c188c Uploaded m-zytnicki parents: diff changeset	19 <param name="inputFileName" format="fasta" type="data" label="Fasta Input File"/>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	20 </when>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	21 <when value="fastq">
44d5973c188c Uploaded m-zytnicki parents: diff changeset	22 <param name="inputFileName" format="fastq" type="data" label="Fastq Input File"/>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	23 </when>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	24 </conditional>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	25 </inputs>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	26
44d5973c188c Uploaded m-zytnicki parents: diff changeset	27 <outputs>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	28 <data name="ouputFileNameCSV" format="tabular" label="[getLetterDistribution] CSV File"/>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	29 <data name="ouputFileNamePNG1" format="png" label="[getLetterDistribution] PNG File 1"/>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	30 <data name="ouputFileNamePNG2" format="png" label="[getLetterDistribution] PNG File 2"/>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	31 </outputs>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	32 <tests>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	33 <test>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	34 <param name="FormatInputFileName" value="fastq" />
44d5973c188c Uploaded m-zytnicki parents: diff changeset	35 <param name="inputFileName" value="short_fastq.fastq" />
44d5973c188c Uploaded m-zytnicki parents: diff changeset	36 <output name="outputFileNameCSV" file="exp_getletterdistribution_short_fastq.csv" />
44d5973c188c Uploaded m-zytnicki parents: diff changeset	37 </test>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	38 </tests>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	39
44d5973c188c Uploaded m-zytnicki parents: diff changeset	40 <help>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	41 The script gets the nucleotide distribution of the input sequence list. It outputs two files. The first file shows the nucleotide distribution of the data. More precisely, a point (x, y) on the curve A shows that y sequences have x % of A.
44d5973c188c Uploaded m-zytnicki parents: diff changeset	42
44d5973c188c Uploaded m-zytnicki parents: diff changeset	43 The second plot shows the average nucleotide distribution for each position of the read. You can use it to detect a bias in the first nucleotides, for instance. A point x, y on the curve A shows that at the position x, there are y% of A. A point (x, y) on the curve # tells you that y % of the sequences contain not less than x nucleotides. By definition, this latter line is a decreasing function. It usually explains why the tail of the other curves are sometimes erratic: there are few sequences.
44d5973c188c Uploaded m-zytnicki parents: diff changeset	44 </help>
44d5973c188c Uploaded m-zytnicki parents: diff changeset	45 </tool>

Mercurial > repos > yufei-luo > s_mart

annotate SMART/galaxy/WrappGetLetterDistribution.xml @ 36:44d5973c188c