seq_filter_by_mapping: tools/seq_filter_by_mapping/seq_filter_by

author	peterjc
date	Tue, 27 Jan 2015 08:31:13 -0500
parents
children	8ff0ac66f1a3

rev	line source
0 1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	1 <tool id="seq_filter_by_mapping" name="Filter sequences by mapping" version="0.0.2">
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	2 <description>from SAM/BAM file</description>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	3 <requirements>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	4 <requirement type="package" version="1.64">biopython</requirement>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	5 <requirement type="python-module">Bio</requirement>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	6 <requirement type="binary">samtools</requirement>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	7 <requirement type="package" version="0.1.19">samtools</requirement>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	8 </requirements>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	9 <version_command interpreter="python">seq_filter_by_mapping.py --version</version_command>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	10 <command interpreter="python">
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	11 seq_filter_by_mapping.py -i "$input_file" -f "$input_file.ext" -m $pair_mode
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	12 #if $output_choice_cond.output_choice=="both"
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	13 -p $output_pos -n $output_neg
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	14 #elif $output_choice_cond.output_choice=="pos"
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	15 -p $output_pos
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	16 #elif $output_choice_cond.output_choice=="neg"
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	17 -n $output_neg
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	18 #end if
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	19 ## Now loop over all the mapping files
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	20 #for i in $mapping_file#${i} #end for#
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	21 </command>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	22 <stdio>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	23 <!-- Anything other than zero is an error -->
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	24 <exit_code range="1:" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	25 <exit_code range=":-1" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	26 </stdio>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	27 <inputs>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	28 <param name="input_file" type="data" format="fasta,fastq,sff" label="Sequence file to be filtered" help="FASTA, FASTQ, or SFF format." />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	29 <param name="mapping_file" type="data" format="sam,bam" multiple="true" label="SAM/BAM mapping of those sequences" help="SAM or BAM format." />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	30 <conditional name="output_choice_cond">
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	31 <param name="output_choice" type="select" label="Output mapped reads, unmapped reads, or both?">
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	32 <option value="both">Both mapped and unmapped reads, as two files</option>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	33 <option value="pos">Just mapped reads, as a single file</option>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	34 <option value="neg">Just unmapped reads, as a single file</option>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	35 </param>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	36 <!-- Seems need these dummy entries here, compare this to indels/indel_sam2interval.xml -->
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	37 <when value="both" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	38 <when value="pos" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	39 <when value="neg" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	40 </conditional>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	41 <param name="pair_mode" type="select" label="Paired read treatment">
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	42 <option value="lax" selected="true">Treat as a pair, allow either read to be mapped</option>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	43 <option value="strict">Treat as a pair, require both reads to be mapped</option>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	44 <!-- The following would actually be more work as have to store qname/1 and qname/2 separately for filter...
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	45 <option value="solo">Treat independently (will split partners when only one maps)</option>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	46 -->
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	47 </param>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	48 </inputs>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	49 <outputs>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	50 <data name="output_pos" format="input" metadata_source="input_file" label="$input_file.name (mapped)">
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	51 <filter>output_choice_cond["output_choice"] != "neg"</filter>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	52 </data>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	53 <data name="output_neg" format="input" metadata_source="input_file" label="$input_file.name (unmapped)">
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	54 <filter>output_choice_cond["output_choice"] != "pos"</filter>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	55 </data>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	56 </outputs>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	57 <tests>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	58 <test>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	59 <param name="input_file" value="SRR639755_mito_pairs.fastq.gz" ftype="fastqsanger" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	60 <param name="mapping_file" value="SRR639755_sample_by_coord.sam" ftype="sam" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	61 <param name="pair_mode" value="lax" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	62 <param name="output_choice" value="pos" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	63 <output name="output_pos" file="SRR639755_sample_lax.fastq" ftype="fastqsanger" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	64 </test>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	65 <test>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	66 <param name="input_file" value="SRR639755_mito_pairs.fastq.gz" ftype="fastqsanger" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	67 <param name="mapping_file" value="SRR639755_sample_by_coord.sam" ftype="sam" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	68 <param name="pair_mode" value="strict" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	69 <param name="output_choice" value="pos" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	70 <output name="output_pos" file="SRR639755_sample_strict.fastq" ftype="fastqsanger" />
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	71 </test>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	72 </tests>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	73 <help>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	74 What it does
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	75
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	76 By default it divides a FASTA, FASTQ or Standard Flowgram Format (SFF) file in
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	77 two, those sequences (or read pairs) which do or don't map in the provided
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	78 SAM/BAM file. You can opt to have a single output file of just the mapping reads,
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	79 or just the non-mapping ones.
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	80
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	81 Example Usage
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	82
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	83 You might wish to perform a contamination screan by mapping your reads against
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	84 known contaminant reference sequences, then use this tool to select only the
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	85 unmapped reads for further analysis (e.g. de novo assembly).
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	86
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	87 Similarly you might wish to map your reads against a known bacterial reference,
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	88 then take the non-mapping sequences forward for analysis if looking for novel
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	89 plasmids.
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	90
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	91
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	92 References
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	93
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	94 If you use this Galaxy tool in work leading to a scientific publication please
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	95 cite:
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	96
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	97 Peter J.A. Cock (2014), Galaxy tool for filtering reads by mapping
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	98 http://toolshed.g2.bx.psu.edu/view/peterjc/seq_filter_by_mapping
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	99
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	100 This tool uses Biopython to read and write SFF files, so you may also wish to
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	101 cite the Biopython application note (and Galaxy too of course):
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	102
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	103 Cock et al (2009). Biopython: freely available Python tools for computational
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	104 molecular biology and bioinformatics. Bioinformatics 25(11) 1422-3.
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	105 http://dx.doi.org/10.1093/bioinformatics/btp163 pmid:19304878.
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	106
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	107 This tool is available to install into other Galaxy Instances via the Galaxy
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	108 Tool Shed at http://toolshed.g2.bx.psu.edu/view/peterjc/seq_filter_by_mapping
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	109 </help>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	110 <citations>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	111 <citation type="doi">10.1093/bioinformatics/btp163</citation>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	112 </citations>
1d773da0ccf0 Uploaded v0.0.2, fixed some error messages peterjc parents: diff changeset	113 </tool>

0

1d773da0ccf0 Uploaded v0.0.2, fixed some error messages

peterjc

parents:

diff changeset

1 <tool id="seq_filter_by_mapping" name="Filter sequences by mapping" version="0.0.2">

1d773da0ccf0 Uploaded v0.0.2, fixed some error messages

peterjc

parents:

diff changeset

2 <description>from SAM/BAM file</description>

1d773da0ccf0 Uploaded v0.0.2, fixed some error messages