nate_test: defuse.xml annotate

annotate defuse.xml @ 2:999746fc92ba default tip

Uploaded

author	nate
date	Thu, 10 Nov 2011 09:56:05 -0500
parents
children

rev	line source
2 999746fc92ba Uploaded nate parents: diff changeset	1 <tool id="defuse" name="DeFuse" version="1.1">
999746fc92ba Uploaded nate parents: diff changeset	2 <description>identify fusion transcripts</description>
999746fc92ba Uploaded nate parents: diff changeset	3 <requirements>
999746fc92ba Uploaded nate parents: diff changeset	4 <requirement type="binary"></requirement>
999746fc92ba Uploaded nate parents: diff changeset	5 </requirements>
999746fc92ba Uploaded nate parents: diff changeset	6 <command interpreter="perl">
999746fc92ba Uploaded nate parents: diff changeset	7 ## Find the defuse.pl in the galaxy tool path
999746fc92ba Uploaded nate parents: diff changeset	8 #import Cheetah.FileUtils
999746fc92ba Uploaded nate parents: diff changeset	9 #set $toolpath = '/'.join([$__root_dir__,'tools','defuse'])
999746fc92ba Uploaded nate parents: diff changeset	10 #set $defuse = $Cheetah.FileUtils.findFiles($toolpath,['defuse.pl'],[],['tools','external','include','em','data'])[0]
999746fc92ba Uploaded nate parents: diff changeset	11 $defuse
999746fc92ba Uploaded nate parents: diff changeset	12 -c `cp $defuse_config $config_txt; echo $defuse_config`
999746fc92ba Uploaded nate parents: diff changeset	13 -d `mkdir -p data_dir; ln -s $left_pairendreads data_dir/reads_1.fastq; ln -s $right_pairendreads data_dir/reads_2.fastq; echo data_dir`
999746fc92ba Uploaded nate parents: diff changeset	14 -o output_dir -p 8
999746fc92ba Uploaded nate parents: diff changeset	15 </command>
999746fc92ba Uploaded nate parents: diff changeset	16 <inputs>
999746fc92ba Uploaded nate parents: diff changeset	17 <param name="left_pairendreads" type="data" format="fastq" label="left part of read pairs" help="The left and right reads pairs must be in the same order, and not have any unpaired reads. (FASTQ interlacer will pair reads and remove the unpaired. FASTQ de-interlacer will separate the result into left and right reads.)"/>
999746fc92ba Uploaded nate parents: diff changeset	18 <param name="right_pairendreads" type="data" format="fastq" label="right part of read pairs" help="In the same order as the left reads"/>
999746fc92ba Uploaded nate parents: diff changeset	19 <conditional name="refGenomeSource">
999746fc92ba Uploaded nate parents: diff changeset	20 <param name="genomeSource" type="select" label="Will you select a built-in DeFuse Reference Dataset, or supply a configuration from your history" help="">
999746fc92ba Uploaded nate parents: diff changeset	21 <option value="indexed">Use a built-in DeFuse Reference Dataset</option>
999746fc92ba Uploaded nate parents: diff changeset	22 <option value="history">Use a configuration from your history that specifies the DeFuse Reference Dataset</option>
999746fc92ba Uploaded nate parents: diff changeset	23 </param>
999746fc92ba Uploaded nate parents: diff changeset	24 <when value="indexed">
999746fc92ba Uploaded nate parents: diff changeset	25 <param name="index" type="select" label="Select a Reference Dataset" help="if your genome of interest is not listed - contact Galaxy team">
999746fc92ba Uploaded nate parents: diff changeset	26 <options from_file="defuse.loc">
999746fc92ba Uploaded nate parents: diff changeset	27 <column name="name" index="1"/>
999746fc92ba Uploaded nate parents: diff changeset	28 <column name="value" index="2"/>
999746fc92ba Uploaded nate parents: diff changeset	29 <filter type="sort_by" column="0" />
999746fc92ba Uploaded nate parents: diff changeset	30 <validator type="no_options" message="No indexes are available" />
999746fc92ba Uploaded nate parents: diff changeset	31 </options>
999746fc92ba Uploaded nate parents: diff changeset	32 </param>
999746fc92ba Uploaded nate parents: diff changeset	33 <conditional name="defuse_param">
999746fc92ba Uploaded nate parents: diff changeset	34 <param name="settings" type="select" label="Defuse parameter settings" help="">
999746fc92ba Uploaded nate parents: diff changeset	35 <option value="preSet">Default settings</option>
999746fc92ba Uploaded nate parents: diff changeset	36 <option value="full">Full parameter list</option>
999746fc92ba Uploaded nate parents: diff changeset	37 </param>
999746fc92ba Uploaded nate parents: diff changeset	38 <when value="preSet" />
999746fc92ba Uploaded nate parents: diff changeset	39 <when value="full">
999746fc92ba Uploaded nate parents: diff changeset	40 <param name="max_insert_size" type="integer" value="500" optional="true" label="Bowtie max_insert_size" />
999746fc92ba Uploaded nate parents: diff changeset	41 <param name="dna_concordant_length" type="integer" value="2000" optional="true" label="Minimum gene fusion range dna_concordant_length" />
999746fc92ba Uploaded nate parents: diff changeset	42 <param name="discord_read_trim" type="integer" value="50" optional="true" label="Trim length for discordant reads discord_read_trim" help="(split reads are not trimmed)" />
999746fc92ba Uploaded nate parents: diff changeset	43 <param name="clustering_precision" type="float" value=".95" optional="true" label="Filter clustering_precision">
999746fc92ba Uploaded nate parents: diff changeset	44 <validator type="in_range" message="Choose a value between .1 and 1.0" min=".1" max="1"/>
999746fc92ba Uploaded nate parents: diff changeset	45 </param>
999746fc92ba Uploaded nate parents: diff changeset	46 <param name="span_count_threshold" type="integer" value="5" optional="true" label="Filter span_count_threshold" />
999746fc92ba Uploaded nate parents: diff changeset	47 <param name="split_count_threshold" type="integer" value="3" optional="true" label="Filter split_count_threshold" />
999746fc92ba Uploaded nate parents: diff changeset	48 <param name="percent_identity_threshold" type="float" value=".90" optional="true" label="Filter percent_identity_threshold">
999746fc92ba Uploaded nate parents: diff changeset	49 <validator type="in_range" message="Choose a value between .1 and 1.0" min=".1" max="1"/>
999746fc92ba Uploaded nate parents: diff changeset	50 </param>
999746fc92ba Uploaded nate parents: diff changeset	51 <param name="max_dist_pos" type="integer" value="600" optional="true" label="Filter max_dist_pos" />
999746fc92ba Uploaded nate parents: diff changeset	52 <param name="num_dist_genes" type="integer" value="500" optional="true" label="Filter num_dist_genes" />
999746fc92ba Uploaded nate parents: diff changeset	53 <param name="split_min_anchor" type="integer" value="4" optional="true" label="Filter split_min_anchor" />
999746fc92ba Uploaded nate parents: diff changeset	54 <param name="max_concordant_ratio" type="float" value="0.1" optional="true" label="Filter max_concordant_ratio">
999746fc92ba Uploaded nate parents: diff changeset	55 <validator type="in_range" message="Choose a value between 0.0 and 1.0" min="0" max="1"/>
999746fc92ba Uploaded nate parents: diff changeset	56 </param>
999746fc92ba Uploaded nate parents: diff changeset	57 <param name="splice_bias" type="integer" value="10" optional="true" label="Filter splice_bias" />
999746fc92ba Uploaded nate parents: diff changeset	58 <param name="probability_threshold" type="float" value="0.50" optional="true" label="Filter probability_threshold">
999746fc92ba Uploaded nate parents: diff changeset	59 <validator type="in_range" message="Choose a value between 0.0 and 1.0" min="0" max="1"/>
999746fc92ba Uploaded nate parents: diff changeset	60 </param>
999746fc92ba Uploaded nate parents: diff changeset	61 <param name="covariance_sampling_density" type="float" value="0.01" optional="true" label="covariance_sampling_density">
999746fc92ba Uploaded nate parents: diff changeset	62 <help>Position density when calculating covariance</help>
999746fc92ba Uploaded nate parents: diff changeset	63 <validator type="in_range" message="Choose a value between 0.0 and 1.0" min="0" max="1"/>
999746fc92ba Uploaded nate parents: diff changeset	64 </param>
999746fc92ba Uploaded nate parents: diff changeset	65 <param name="denovo_assembly" type="select" label="denovo_assembly" help="">
999746fc92ba Uploaded nate parents: diff changeset	66 <option value="">Use Default</option>
999746fc92ba Uploaded nate parents: diff changeset	67 <option value="no">no</option>
999746fc92ba Uploaded nate parents: diff changeset	68 <option value="yes">yes</option>
999746fc92ba Uploaded nate parents: diff changeset	69 </param>
999746fc92ba Uploaded nate parents: diff changeset	70 <!--
999746fc92ba Uploaded nate parents: diff changeset	71 <param name="positive_controls" type="data" format="txt" optional=true label="Defuse positive_controls" help=""/>
999746fc92ba Uploaded nate parents: diff changeset	72 -->
999746fc92ba Uploaded nate parents: diff changeset	73 </when> <!-- full -->
999746fc92ba Uploaded nate parents: diff changeset	74 </conditional> <!-- defuse_param -->
999746fc92ba Uploaded nate parents: diff changeset	75 </when>
999746fc92ba Uploaded nate parents: diff changeset	76 <when value="history">
999746fc92ba Uploaded nate parents: diff changeset	77 <param name="config" type="data" format="txt" label="Defuse Config file" help=""/>
999746fc92ba Uploaded nate parents: diff changeset	78 </when> <!-- history -->
999746fc92ba Uploaded nate parents: diff changeset	79 </conditional> <!-- refGenomeSource -->
999746fc92ba Uploaded nate parents: diff changeset	80 </inputs>
999746fc92ba Uploaded nate parents: diff changeset	81 <configfiles>
999746fc92ba Uploaded nate parents: diff changeset	82 <configfile name="defuse_config">
999746fc92ba Uploaded nate parents: diff changeset	83 #import ast
999746fc92ba Uploaded nate parents: diff changeset	84 #if $refGenomeSource.genomeSource == "history":
999746fc92ba Uploaded nate parents: diff changeset	85 #include raw $refGenomeSource.config.__str__
999746fc92ba Uploaded nate parents: diff changeset	86 #else
999746fc92ba Uploaded nate parents: diff changeset	87 #set $ref_dict = dict($ast.literal_eval($refGenomeSource.index.value))
999746fc92ba Uploaded nate parents: diff changeset	88 #
999746fc92ba Uploaded nate parents: diff changeset	89 # Configuration file for defuse
999746fc92ba Uploaded nate parents: diff changeset	90 #
999746fc92ba Uploaded nate parents: diff changeset	91 # At a minimum, change all values enclused by []
999746fc92ba Uploaded nate parents: diff changeset	92 #
999746fc92ba Uploaded nate parents: diff changeset	93
999746fc92ba Uploaded nate parents: diff changeset	94 # Directory where the defuse code was unpacked
999746fc92ba Uploaded nate parents: diff changeset	95 ## Default location in the tool/defuse directory
999746fc92ba Uploaded nate parents: diff changeset	96 # source_directory = ${__root_dir__}/tools/defuse
999746fc92ba Uploaded nate parents: diff changeset	97 source_directory = #slurp
999746fc92ba Uploaded nate parents: diff changeset	98 #try
999746fc92ba Uploaded nate parents: diff changeset	99 $ref_dict['source_directory']
999746fc92ba Uploaded nate parents: diff changeset	100 #except
999746fc92ba Uploaded nate parents: diff changeset	101 #try
999746fc92ba Uploaded nate parents: diff changeset	102 ## Try to find the defuse source dir in the galaxy tool path
999746fc92ba Uploaded nate parents: diff changeset	103 #import Cheetah.FileUtils
999746fc92ba Uploaded nate parents: diff changeset	104 #set $toolpath = '/'.join([$__root_dir__,'tools','defuse'])
999746fc92ba Uploaded nate parents: diff changeset	105 #set $defuse = $Cheetah.FileUtils.findFiles($toolpath,['defuse.pl'],[],['tools','external','include','em','data'])[0]
999746fc92ba Uploaded nate parents: diff changeset	106 $defuse.replace('/scripts/defuse.pl','')
999746fc92ba Uploaded nate parents: diff changeset	107 #except
999746fc92ba Uploaded nate parents: diff changeset	108 ${__root_dir__}/tools/defuse/defuse
999746fc92ba Uploaded nate parents: diff changeset	109 #end try
999746fc92ba Uploaded nate parents: diff changeset	110 #end try
999746fc92ba Uploaded nate parents: diff changeset	111
999746fc92ba Uploaded nate parents: diff changeset	112 # Directory where you want your dataset
999746fc92ba Uploaded nate parents: diff changeset	113 dataset_directory = #slurp
999746fc92ba Uploaded nate parents: diff changeset	114 #try
999746fc92ba Uploaded nate parents: diff changeset	115 $ref_dict['dataset_directory']
999746fc92ba Uploaded nate parents: diff changeset	116 #except
999746fc92ba Uploaded nate parents: diff changeset	117 /project/db/genomes/Hsapiens/hg19/defuse
999746fc92ba Uploaded nate parents: diff changeset	118 #end try
999746fc92ba Uploaded nate parents: diff changeset	119
999746fc92ba Uploaded nate parents: diff changeset	120 # Input genome and gene models
999746fc92ba Uploaded nate parents: diff changeset	121 gene_models = #slurp
999746fc92ba Uploaded nate parents: diff changeset	122 #try
999746fc92ba Uploaded nate parents: diff changeset	123 $ref_dict['gene_models']
999746fc92ba Uploaded nate parents: diff changeset	124 #except
999746fc92ba Uploaded nate parents: diff changeset	125 \$(dataset_directory)/Homo_sapiens.GRCh37.62.gtf
999746fc92ba Uploaded nate parents: diff changeset	126 #end try
999746fc92ba Uploaded nate parents: diff changeset	127 genome_fasta = #slurp
999746fc92ba Uploaded nate parents: diff changeset	128 #try
999746fc92ba Uploaded nate parents: diff changeset	129 $ref_dict['genome_fasta']
999746fc92ba Uploaded nate parents: diff changeset	130 #except
999746fc92ba Uploaded nate parents: diff changeset	131 \$(dataset_directory)/Homo_sapiens.GRCh37.62.dna.chromosome.fa
999746fc92ba Uploaded nate parents: diff changeset	132 #end try
999746fc92ba Uploaded nate parents: diff changeset	133
999746fc92ba Uploaded nate parents: diff changeset	134 # Repeat table from ucsc genome browser
999746fc92ba Uploaded nate parents: diff changeset	135 repeats_filename = #slurp
999746fc92ba Uploaded nate parents: diff changeset	136 #try
999746fc92ba Uploaded nate parents: diff changeset	137 $ref_dict['repeats_filename']
999746fc92ba Uploaded nate parents: diff changeset	138 #except
999746fc92ba Uploaded nate parents: diff changeset	139 \$(dataset_directory)/rmsk.txt
999746fc92ba Uploaded nate parents: diff changeset	140 #end try
999746fc92ba Uploaded nate parents: diff changeset	141
999746fc92ba Uploaded nate parents: diff changeset	142 # EST info downloaded from ucsc genome browser
999746fc92ba Uploaded nate parents: diff changeset	143 est_fasta = #slurp
999746fc92ba Uploaded nate parents: diff changeset	144 #try
999746fc92ba Uploaded nate parents: diff changeset	145 $ref_dict['est_fasta']
999746fc92ba Uploaded nate parents: diff changeset	146 #except
999746fc92ba Uploaded nate parents: diff changeset	147 \$(dataset_directory)/est.fa
999746fc92ba Uploaded nate parents: diff changeset	148 #end try
999746fc92ba Uploaded nate parents: diff changeset	149 est_alignments = #slurp
999746fc92ba Uploaded nate parents: diff changeset	150 #try
999746fc92ba Uploaded nate parents: diff changeset	151 $ref_dict['est_alignments']
999746fc92ba Uploaded nate parents: diff changeset	152 #except
999746fc92ba Uploaded nate parents: diff changeset	153 \$(dataset_directory)/intronEst.txt
999746fc92ba Uploaded nate parents: diff changeset	154 #end try
999746fc92ba Uploaded nate parents: diff changeset	155
999746fc92ba Uploaded nate parents: diff changeset	156 # Unigene clusters downloaded from ncbi
999746fc92ba Uploaded nate parents: diff changeset	157 unigene_fasta = #slurp
999746fc92ba Uploaded nate parents: diff changeset	158 #try
999746fc92ba Uploaded nate parents: diff changeset	159 $ref_dict['unigene_fasta']
999746fc92ba Uploaded nate parents: diff changeset	160 #except
999746fc92ba Uploaded nate parents: diff changeset	161 \$(dataset_directory)/Hs.seq.uniq
999746fc92ba Uploaded nate parents: diff changeset	162 #end try
999746fc92ba Uploaded nate parents: diff changeset	163
999746fc92ba Uploaded nate parents: diff changeset	164 # Paths to external tools
999746fc92ba Uploaded nate parents: diff changeset	165 bowtie_bin = #slurp
999746fc92ba Uploaded nate parents: diff changeset	166 #try
999746fc92ba Uploaded nate parents: diff changeset	167 $ref_dict['bowtie_bin']
999746fc92ba Uploaded nate parents: diff changeset	168 #except
999746fc92ba Uploaded nate parents: diff changeset	169 /soft/bowtie/0.12.7/bowtie
999746fc92ba Uploaded nate parents: diff changeset	170 #end try
999746fc92ba Uploaded nate parents: diff changeset	171 bowtie_build_bin = #slurp
999746fc92ba Uploaded nate parents: diff changeset	172 #try
999746fc92ba Uploaded nate parents: diff changeset	173 $ref_dict['bowtie_build_bin']
999746fc92ba Uploaded nate parents: diff changeset	174 #except
999746fc92ba Uploaded nate parents: diff changeset	175 /soft/bowtie/0.12.7/bowtie-build
999746fc92ba Uploaded nate parents: diff changeset	176 #end try
999746fc92ba Uploaded nate parents: diff changeset	177 blat_bin = #slurp
999746fc92ba Uploaded nate parents: diff changeset	178 #try
999746fc92ba Uploaded nate parents: diff changeset	179 $ref_dict['blat_bin']
999746fc92ba Uploaded nate parents: diff changeset	180 #except
999746fc92ba Uploaded nate parents: diff changeset	181 /soft/blat/34/bin/blat
999746fc92ba Uploaded nate parents: diff changeset	182 #end try
999746fc92ba Uploaded nate parents: diff changeset	183 fatotwobit_bin = #slurp
999746fc92ba Uploaded nate parents: diff changeset	184 #try
999746fc92ba Uploaded nate parents: diff changeset	185 $ref_dict['fatotwobit_bin']
999746fc92ba Uploaded nate parents: diff changeset	186 #except
999746fc92ba Uploaded nate parents: diff changeset	187 /soft/blat/34/bin/faToTwoBit
999746fc92ba Uploaded nate parents: diff changeset	188 #end try
999746fc92ba Uploaded nate parents: diff changeset	189 r_bin = #slurp
999746fc92ba Uploaded nate parents: diff changeset	190 #try
999746fc92ba Uploaded nate parents: diff changeset	191 $ref_dict['r_bin']
999746fc92ba Uploaded nate parents: diff changeset	192 #except
999746fc92ba Uploaded nate parents: diff changeset	193 /project/sdml-sles11-weblocal/R-2.12.1/bin/R
999746fc92ba Uploaded nate parents: diff changeset	194 #end try
999746fc92ba Uploaded nate parents: diff changeset	195 rscript_bin = #slurp
999746fc92ba Uploaded nate parents: diff changeset	196 #try
999746fc92ba Uploaded nate parents: diff changeset	197 $ref_dict['rscript_bin']
999746fc92ba Uploaded nate parents: diff changeset	198 #except
999746fc92ba Uploaded nate parents: diff changeset	199 /project/sdml-sles11-weblocal/R-2.12.1/bin/Rscript
999746fc92ba Uploaded nate parents: diff changeset	200 #end try
999746fc92ba Uploaded nate parents: diff changeset	201
999746fc92ba Uploaded nate parents: diff changeset	202 #raw
999746fc92ba Uploaded nate parents: diff changeset	203 # Dataset files
999746fc92ba Uploaded nate parents: diff changeset	204 dataset_prefix = $(dataset_directory)/defuse
999746fc92ba Uploaded nate parents: diff changeset	205 chromosome_prefix = $(dataset_prefix).dna.chromosomes
999746fc92ba Uploaded nate parents: diff changeset	206 exons_fasta = $(dataset_prefix).exons.fa
999746fc92ba Uploaded nate parents: diff changeset	207 cds_fasta = $(dataset_prefix).cds.fa
999746fc92ba Uploaded nate parents: diff changeset	208 cdna_regions = $(dataset_prefix).cdna.regions
999746fc92ba Uploaded nate parents: diff changeset	209 cdna_fasta = $(dataset_prefix).cdna.fa
999746fc92ba Uploaded nate parents: diff changeset	210 reference_fasta = $(dataset_prefix).reference.fa
999746fc92ba Uploaded nate parents: diff changeset	211 rrna_fasta = $(dataset_prefix).rrna.fa
999746fc92ba Uploaded nate parents: diff changeset	212 ig_gene_list = $(dataset_prefix).ig.gene.list
999746fc92ba Uploaded nate parents: diff changeset	213 repeats_regions = $(dataset_directory)/repeats.regions
999746fc92ba Uploaded nate parents: diff changeset	214 est_split_fasta1 = $(dataset_directory)/est.1.fa
999746fc92ba Uploaded nate parents: diff changeset	215 est_split_fasta2 = $(dataset_directory)/est.2.fa
999746fc92ba Uploaded nate parents: diff changeset	216 est_split_fasta3 = $(dataset_directory)/est.3.fa
999746fc92ba Uploaded nate parents: diff changeset	217 est_split_fasta4 = $(dataset_directory)/est.4.fa
999746fc92ba Uploaded nate parents: diff changeset	218 est_split_fasta5 = $(dataset_directory)/est.5.fa
999746fc92ba Uploaded nate parents: diff changeset	219 est_split_fasta6 = $(dataset_directory)/est.6.fa
999746fc92ba Uploaded nate parents: diff changeset	220 est_split_fasta7 = $(dataset_directory)/est.7.fa
999746fc92ba Uploaded nate parents: diff changeset	221 est_split_fasta8 = $(dataset_directory)/est.8.fa
999746fc92ba Uploaded nate parents: diff changeset	222 est_split_fasta9 = $(dataset_directory)/est.9.fa
999746fc92ba Uploaded nate parents: diff changeset	223
999746fc92ba Uploaded nate parents: diff changeset	224 # Fasta files with bowtie indices for prefiltering reads for concordantly mapping pairs
999746fc92ba Uploaded nate parents: diff changeset	225 prefilter1 = $(unigene_fasta)
999746fc92ba Uploaded nate parents: diff changeset	226
999746fc92ba Uploaded nate parents: diff changeset	227 # deFuse scripts and tools
999746fc92ba Uploaded nate parents: diff changeset	228 scripts_directory = $(source_directory)/scripts
999746fc92ba Uploaded nate parents: diff changeset	229 tools_directory = $(source_directory)/tools
999746fc92ba Uploaded nate parents: diff changeset	230 data_directory = $(source_directory)/data
999746fc92ba Uploaded nate parents: diff changeset	231 #end raw
999746fc92ba Uploaded nate parents: diff changeset	232
999746fc92ba Uploaded nate parents: diff changeset	233 # Path to samtools, 0.1.8 is compiled for you, use other versions at your own risk
999746fc92ba Uploaded nate parents: diff changeset	234 samtools_bin = #slurp
999746fc92ba Uploaded nate parents: diff changeset	235 #try
999746fc92ba Uploaded nate parents: diff changeset	236 $ref_dict['samtools_bin']
999746fc92ba Uploaded nate parents: diff changeset	237 #except
999746fc92ba Uploaded nate parents: diff changeset	238 \$(source_directory)/external/samtools-0.1.8/samtools
999746fc92ba Uploaded nate parents: diff changeset	239 #end try
999746fc92ba Uploaded nate parents: diff changeset	240
999746fc92ba Uploaded nate parents: diff changeset	241 # Bowtie parameters
999746fc92ba Uploaded nate parents: diff changeset	242 bowtie_threads = #slurp
999746fc92ba Uploaded nate parents: diff changeset	243 #try
999746fc92ba Uploaded nate parents: diff changeset	244 $ref_dict['bowtie_threads']
999746fc92ba Uploaded nate parents: diff changeset	245 #except
999746fc92ba Uploaded nate parents: diff changeset	246 1
999746fc92ba Uploaded nate parents: diff changeset	247 #end try
999746fc92ba Uploaded nate parents: diff changeset	248 bowtie_quals = #slurp
999746fc92ba Uploaded nate parents: diff changeset	249 #try
999746fc92ba Uploaded nate parents: diff changeset	250 $ref_dict['bowtie_quals']
999746fc92ba Uploaded nate parents: diff changeset	251 #except
999746fc92ba Uploaded nate parents: diff changeset	252 --phred33-quals
999746fc92ba Uploaded nate parents: diff changeset	253 #end try
999746fc92ba Uploaded nate parents: diff changeset	254 max_insert_size = #slurp
999746fc92ba Uploaded nate parents: diff changeset	255 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.max_insert_size.__str__ != "":
999746fc92ba Uploaded nate parents: diff changeset	256 $refGenomeSource.defuse_param.max_insert_size
999746fc92ba Uploaded nate parents: diff changeset	257 #else
999746fc92ba Uploaded nate parents: diff changeset	258 #try
999746fc92ba Uploaded nate parents: diff changeset	259 $ref_dict['max_insert_size']
999746fc92ba Uploaded nate parents: diff changeset	260 #except
999746fc92ba Uploaded nate parents: diff changeset	261 500
999746fc92ba Uploaded nate parents: diff changeset	262 #end try
999746fc92ba Uploaded nate parents: diff changeset	263 #end if
999746fc92ba Uploaded nate parents: diff changeset	264
999746fc92ba Uploaded nate parents: diff changeset	265 # Parameters for building the dataset
999746fc92ba Uploaded nate parents: diff changeset	266 chromosomes = #slurp
999746fc92ba Uploaded nate parents: diff changeset	267 #try
999746fc92ba Uploaded nate parents: diff changeset	268 $ref_dict.chromosomes
999746fc92ba Uploaded nate parents: diff changeset	269 #except
999746fc92ba Uploaded nate parents: diff changeset	270 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,X,Y,MT
999746fc92ba Uploaded nate parents: diff changeset	271 #end try
999746fc92ba Uploaded nate parents: diff changeset	272 mt_chromosome = #slurp
999746fc92ba Uploaded nate parents: diff changeset	273 #try
999746fc92ba Uploaded nate parents: diff changeset	274 $ref_dict['mt_chromosome']
999746fc92ba Uploaded nate parents: diff changeset	275 #except
999746fc92ba Uploaded nate parents: diff changeset	276 MT
999746fc92ba Uploaded nate parents: diff changeset	277 #end try
999746fc92ba Uploaded nate parents: diff changeset	278 gene_sources = #slurp
999746fc92ba Uploaded nate parents: diff changeset	279 #try
999746fc92ba Uploaded nate parents: diff changeset	280 $ref_dict['gene_sources']
999746fc92ba Uploaded nate parents: diff changeset	281 #except
999746fc92ba Uploaded nate parents: diff changeset	282 IG_C_gene,IG_D_gene,IG_J_gene,IG_V_gene,processed_transcript,protein_coding
999746fc92ba Uploaded nate parents: diff changeset	283 #end try
999746fc92ba Uploaded nate parents: diff changeset	284 ig_gene_sources = #slurp
999746fc92ba Uploaded nate parents: diff changeset	285 #try
999746fc92ba Uploaded nate parents: diff changeset	286 $ref_dict['ig_gene_sources']
999746fc92ba Uploaded nate parents: diff changeset	287 #except
999746fc92ba Uploaded nate parents: diff changeset	288 IG_C_gene,IG_D_gene,IG_J_gene,IG_V_gene,IG_pseudogene
999746fc92ba Uploaded nate parents: diff changeset	289 #end try
999746fc92ba Uploaded nate parents: diff changeset	290 rrna_gene_sources = #slurp
999746fc92ba Uploaded nate parents: diff changeset	291 #try
999746fc92ba Uploaded nate parents: diff changeset	292 $ref_dict['rrna_gene_sources']
999746fc92ba Uploaded nate parents: diff changeset	293 #except
999746fc92ba Uploaded nate parents: diff changeset	294 Mt_rRNA,rRNA,rRNA_pseudogene
999746fc92ba Uploaded nate parents: diff changeset	295 #end try
999746fc92ba Uploaded nate parents: diff changeset	296
999746fc92ba Uploaded nate parents: diff changeset	297 # Blat sequences per job
999746fc92ba Uploaded nate parents: diff changeset	298 num_blat_sequences = #slurp
999746fc92ba Uploaded nate parents: diff changeset	299 #try
999746fc92ba Uploaded nate parents: diff changeset	300 $ref_dict['num_blat_sequences']
999746fc92ba Uploaded nate parents: diff changeset	301 #except
999746fc92ba Uploaded nate parents: diff changeset	302 10000
999746fc92ba Uploaded nate parents: diff changeset	303 #end try
999746fc92ba Uploaded nate parents: diff changeset	304
999746fc92ba Uploaded nate parents: diff changeset	305 # Minimum gene fusion range
999746fc92ba Uploaded nate parents: diff changeset	306 dna_concordant_length = #slurp
999746fc92ba Uploaded nate parents: diff changeset	307 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.dna_concordant_length.__str__ != "":
999746fc92ba Uploaded nate parents: diff changeset	308 $refGenomeSource.defuse_param.dna_concordant_length
999746fc92ba Uploaded nate parents: diff changeset	309 #else
999746fc92ba Uploaded nate parents: diff changeset	310 #try
999746fc92ba Uploaded nate parents: diff changeset	311 $ref_dict['dna_concordant_length']
999746fc92ba Uploaded nate parents: diff changeset	312 #except
999746fc92ba Uploaded nate parents: diff changeset	313 2000
999746fc92ba Uploaded nate parents: diff changeset	314 #end try
999746fc92ba Uploaded nate parents: diff changeset	315 #end if
999746fc92ba Uploaded nate parents: diff changeset	316
999746fc92ba Uploaded nate parents: diff changeset	317 # Trim length for discordant reads (split reads are not trimmed)
999746fc92ba Uploaded nate parents: diff changeset	318 discord_read_trim = #slurp
999746fc92ba Uploaded nate parents: diff changeset	319 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.discord_read_trim.__str__ != "":
999746fc92ba Uploaded nate parents: diff changeset	320 $refGenomeSource.defuse_param.discord_read_trim
999746fc92ba Uploaded nate parents: diff changeset	321 #else
999746fc92ba Uploaded nate parents: diff changeset	322 #try
999746fc92ba Uploaded nate parents: diff changeset	323 $ref_dict['discord_read_trim']
999746fc92ba Uploaded nate parents: diff changeset	324 #except
999746fc92ba Uploaded nate parents: diff changeset	325 50
999746fc92ba Uploaded nate parents: diff changeset	326 #end try
999746fc92ba Uploaded nate parents: diff changeset	327 #end if
999746fc92ba Uploaded nate parents: diff changeset	328
999746fc92ba Uploaded nate parents: diff changeset	329 # Filtering parameters
999746fc92ba Uploaded nate parents: diff changeset	330 clustering_precision = #slurp
999746fc92ba Uploaded nate parents: diff changeset	331 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.clustering_precision.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	332 $refGenomeSource.defuse_param.clustering_precision
999746fc92ba Uploaded nate parents: diff changeset	333 #else
999746fc92ba Uploaded nate parents: diff changeset	334 #try
999746fc92ba Uploaded nate parents: diff changeset	335 $ref_dict['clustering_precision']
999746fc92ba Uploaded nate parents: diff changeset	336 #except
999746fc92ba Uploaded nate parents: diff changeset	337 0.95
999746fc92ba Uploaded nate parents: diff changeset	338 #end try
999746fc92ba Uploaded nate parents: diff changeset	339 #end if
999746fc92ba Uploaded nate parents: diff changeset	340 span_count_threshold = #slurp
999746fc92ba Uploaded nate parents: diff changeset	341 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.span_count_threshold.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	342 $refGenomeSource.defuse_param.span_count_threshold
999746fc92ba Uploaded nate parents: diff changeset	343 #else
999746fc92ba Uploaded nate parents: diff changeset	344 #try
999746fc92ba Uploaded nate parents: diff changeset	345 $ref_dict['span_count_threshold']
999746fc92ba Uploaded nate parents: diff changeset	346 #except
999746fc92ba Uploaded nate parents: diff changeset	347 5
999746fc92ba Uploaded nate parents: diff changeset	348 #end try
999746fc92ba Uploaded nate parents: diff changeset	349 #end if
999746fc92ba Uploaded nate parents: diff changeset	350 split_count_threshold = #slurp
999746fc92ba Uploaded nate parents: diff changeset	351 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.split_count_threshold.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	352 $refGenomeSource.defuse_param.split_count_threshold
999746fc92ba Uploaded nate parents: diff changeset	353 #else
999746fc92ba Uploaded nate parents: diff changeset	354 #try
999746fc92ba Uploaded nate parents: diff changeset	355 $ref_dict['split_count_threshold']
999746fc92ba Uploaded nate parents: diff changeset	356 #except
999746fc92ba Uploaded nate parents: diff changeset	357 3
999746fc92ba Uploaded nate parents: diff changeset	358 #end try
999746fc92ba Uploaded nate parents: diff changeset	359 #end if
999746fc92ba Uploaded nate parents: diff changeset	360 percent_identity_threshold = #slurp
999746fc92ba Uploaded nate parents: diff changeset	361 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.percent_identity_threshold.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	362 $refGenomeSource.defuse_param.percent_identity_threshold
999746fc92ba Uploaded nate parents: diff changeset	363 #else
999746fc92ba Uploaded nate parents: diff changeset	364 #try
999746fc92ba Uploaded nate parents: diff changeset	365 $ref_dict['percent_identity_threshold']
999746fc92ba Uploaded nate parents: diff changeset	366 #except
999746fc92ba Uploaded nate parents: diff changeset	367 0.90
999746fc92ba Uploaded nate parents: diff changeset	368 #end try
999746fc92ba Uploaded nate parents: diff changeset	369 #end if
999746fc92ba Uploaded nate parents: diff changeset	370 max_dist_pos = #slurp
999746fc92ba Uploaded nate parents: diff changeset	371 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.max_dist_pos.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	372 $refGenomeSource.defuse_param.max_dist_pos
999746fc92ba Uploaded nate parents: diff changeset	373 #else
999746fc92ba Uploaded nate parents: diff changeset	374 #try
999746fc92ba Uploaded nate parents: diff changeset	375 $ref_dict['max_dist_pos']
999746fc92ba Uploaded nate parents: diff changeset	376 #except
999746fc92ba Uploaded nate parents: diff changeset	377 600
999746fc92ba Uploaded nate parents: diff changeset	378 #end try
999746fc92ba Uploaded nate parents: diff changeset	379 #end if
999746fc92ba Uploaded nate parents: diff changeset	380 num_dist_genes = #slurp
999746fc92ba Uploaded nate parents: diff changeset	381 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.num_dist_genes.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	382 $refGenomeSource.defuse_param.num_dist_genes
999746fc92ba Uploaded nate parents: diff changeset	383 #else
999746fc92ba Uploaded nate parents: diff changeset	384 #try
999746fc92ba Uploaded nate parents: diff changeset	385 $ref_dict['num_dist_genes']
999746fc92ba Uploaded nate parents: diff changeset	386 #except
999746fc92ba Uploaded nate parents: diff changeset	387 500
999746fc92ba Uploaded nate parents: diff changeset	388 #end try
999746fc92ba Uploaded nate parents: diff changeset	389 #end if
999746fc92ba Uploaded nate parents: diff changeset	390 split_min_anchor = #slurp
999746fc92ba Uploaded nate parents: diff changeset	391 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.split_min_anchor.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	392 $refGenomeSource.defuse_param.split_min_anchor
999746fc92ba Uploaded nate parents: diff changeset	393 #else
999746fc92ba Uploaded nate parents: diff changeset	394 #try
999746fc92ba Uploaded nate parents: diff changeset	395 $ref_dict['split_min_anchor']
999746fc92ba Uploaded nate parents: diff changeset	396 #except
999746fc92ba Uploaded nate parents: diff changeset	397 4
999746fc92ba Uploaded nate parents: diff changeset	398 #end try
999746fc92ba Uploaded nate parents: diff changeset	399 #end if
999746fc92ba Uploaded nate parents: diff changeset	400 max_concordant_ratio = #slurp
999746fc92ba Uploaded nate parents: diff changeset	401 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.max_concordant_ratio.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	402 $refGenomeSource.defuse_param.max_concordant_ratio
999746fc92ba Uploaded nate parents: diff changeset	403 #else
999746fc92ba Uploaded nate parents: diff changeset	404 #try
999746fc92ba Uploaded nate parents: diff changeset	405 $ref_dict['max_concordant_ratio']
999746fc92ba Uploaded nate parents: diff changeset	406 #except
999746fc92ba Uploaded nate parents: diff changeset	407 0.1
999746fc92ba Uploaded nate parents: diff changeset	408 #end try
999746fc92ba Uploaded nate parents: diff changeset	409 #end if
999746fc92ba Uploaded nate parents: diff changeset	410 splice_bias = #slurp
999746fc92ba Uploaded nate parents: diff changeset	411 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.splice_bias.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	412 $refGenomeSource.defuse_param.splice_bias
999746fc92ba Uploaded nate parents: diff changeset	413 #else
999746fc92ba Uploaded nate parents: diff changeset	414 #try
999746fc92ba Uploaded nate parents: diff changeset	415 $ref_dict['splice_bias']
999746fc92ba Uploaded nate parents: diff changeset	416 #except
999746fc92ba Uploaded nate parents: diff changeset	417 10
999746fc92ba Uploaded nate parents: diff changeset	418 #end try
999746fc92ba Uploaded nate parents: diff changeset	419 #end if
999746fc92ba Uploaded nate parents: diff changeset	420 denovo_assembly = #slurp
999746fc92ba Uploaded nate parents: diff changeset	421 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.denovo_assembly.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	422 $refGenomeSource.defuse_param.denovo_assembly
999746fc92ba Uploaded nate parents: diff changeset	423 #else
999746fc92ba Uploaded nate parents: diff changeset	424 #try
999746fc92ba Uploaded nate parents: diff changeset	425 $ref_dict['denovo_assembly']
999746fc92ba Uploaded nate parents: diff changeset	426 #except
999746fc92ba Uploaded nate parents: diff changeset	427 no
999746fc92ba Uploaded nate parents: diff changeset	428 #end try
999746fc92ba Uploaded nate parents: diff changeset	429 #end if
999746fc92ba Uploaded nate parents: diff changeset	430 probability_threshold = #slurp
999746fc92ba Uploaded nate parents: diff changeset	431 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.probability_threshold.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	432 $refGenomeSource.defuse_param.probability_threshold
999746fc92ba Uploaded nate parents: diff changeset	433 #else
999746fc92ba Uploaded nate parents: diff changeset	434 #try
999746fc92ba Uploaded nate parents: diff changeset	435 $ref_dict['probability_threshold']
999746fc92ba Uploaded nate parents: diff changeset	436 #except
999746fc92ba Uploaded nate parents: diff changeset	437 0.50
999746fc92ba Uploaded nate parents: diff changeset	438 #end try
999746fc92ba Uploaded nate parents: diff changeset	439 #end if
999746fc92ba Uploaded nate parents: diff changeset	440 positive_controls = \$(data_directory)/controls.txt
999746fc92ba Uploaded nate parents: diff changeset	441
999746fc92ba Uploaded nate parents: diff changeset	442 # Position density when calculating covariance
999746fc92ba Uploaded nate parents: diff changeset	443 covariance_sampling_density = #slurp
999746fc92ba Uploaded nate parents: diff changeset	444 #if $refGenomeSource.defuse_param.settings == "full" and $refGenomeSource.defuse_param.covariance_sampling_density.__str__ != ""
999746fc92ba Uploaded nate parents: diff changeset	445 $refGenomeSource.defuse_param.covariance_sampling_density
999746fc92ba Uploaded nate parents: diff changeset	446 #else
999746fc92ba Uploaded nate parents: diff changeset	447 #try
999746fc92ba Uploaded nate parents: diff changeset	448 $ref_dict['covariance_sampling_density']
999746fc92ba Uploaded nate parents: diff changeset	449 #except
999746fc92ba Uploaded nate parents: diff changeset	450 0.01
999746fc92ba Uploaded nate parents: diff changeset	451 #end try
999746fc92ba Uploaded nate parents: diff changeset	452 #end if
999746fc92ba Uploaded nate parents: diff changeset	453
999746fc92ba Uploaded nate parents: diff changeset	454
999746fc92ba Uploaded nate parents: diff changeset	455 # Number of reads for each job in split
999746fc92ba Uploaded nate parents: diff changeset	456 reads_per_job = 1000000
999746fc92ba Uploaded nate parents: diff changeset	457
999746fc92ba Uploaded nate parents: diff changeset	458 # Number of regions for each breakpoint sequence job in split
999746fc92ba Uploaded nate parents: diff changeset	459 regions_per_job = 20
999746fc92ba Uploaded nate parents: diff changeset	460
999746fc92ba Uploaded nate parents: diff changeset	461 #raw
999746fc92ba Uploaded nate parents: diff changeset	462 # If you have command line 'mail' and wish to be notified
999746fc92ba Uploaded nate parents: diff changeset	463 # mailto = andrew.mcpherson@gmail.com
999746fc92ba Uploaded nate parents: diff changeset	464
999746fc92ba Uploaded nate parents: diff changeset	465 # Remove temp files
999746fc92ba Uploaded nate parents: diff changeset	466 remove_job_files = yes
999746fc92ba Uploaded nate parents: diff changeset	467 remove_job_temp_files = yes
999746fc92ba Uploaded nate parents: diff changeset	468
999746fc92ba Uploaded nate parents: diff changeset	469 # Converting to fastq
999746fc92ba Uploaded nate parents: diff changeset	470 # Fastq converter config format 1 for reads stored in separate files for each end
999746fc92ba Uploaded nate parents: diff changeset	471 # data_lane_rexex_N is a perl regex which stores the lane id in $1
999746fc92ba Uploaded nate parents: diff changeset	472 # data_end_regex_N is a perl regex which stores the end, 1 or 2, in $1
999746fc92ba Uploaded nate parents: diff changeset	473 # data_compress_regex_N is a perl regex which stores the compression extension in $1
999746fc92ba Uploaded nate parents: diff changeset	474 # data_convert_N is the associated conversion utility that takes data at stdin and outputs fastq at stdout
999746fc92ba Uploaded nate parents: diff changeset	475 # Fastq converter config format 2 for reads stored in separate files for each end
999746fc92ba Uploaded nate parents: diff changeset	476 # data_lane_regex_N is a perl regex which stores the lane id in $1
999746fc92ba Uploaded nate parents: diff changeset	477 # data_compress_regex_N is a perl regex which stores the compression extension in $1
999746fc92ba Uploaded nate parents: diff changeset	478 # data_end1_converter_N is the associated conversion utility that takes data at stdin and outputs fastq for end 1 at stdout
999746fc92ba Uploaded nate parents: diff changeset	479 # data_end2_converter_N is the associated conversion utility that takes data at stdin and outputs fastq for end 2 at stdout
999746fc92ba Uploaded nate parents: diff changeset	480
999746fc92ba Uploaded nate parents: diff changeset	481 data_lane_regex_1 = ^(.+)_[12]_export\.txt.*$
999746fc92ba Uploaded nate parents: diff changeset	482 data_end_regex_1 = ^.+_([12])_export\.txt.*$
999746fc92ba Uploaded nate parents: diff changeset	483 data_compress_regex_1 = ^.+_[12]_export\.txt(.*)$
999746fc92ba Uploaded nate parents: diff changeset	484 data_converter_1 = $(scripts_directory)/fq_all2std.pl export2std
999746fc92ba Uploaded nate parents: diff changeset	485
999746fc92ba Uploaded nate parents: diff changeset	486 data_lane_regex_2 = ^(.+)_[12]_concat_qseq\.txt.*$
999746fc92ba Uploaded nate parents: diff changeset	487 data_end_regex_2 = ^.+_([12])_concat_qseq\.txt.*$
999746fc92ba Uploaded nate parents: diff changeset	488 data_compress_regex_2 = ^.+_[12]_concat_qseq\.txt(.*)$
999746fc92ba Uploaded nate parents: diff changeset	489 data_converter_2 = $(scripts_directory)/qseq2fastq.pl
999746fc92ba Uploaded nate parents: diff changeset	490
999746fc92ba Uploaded nate parents: diff changeset	491 data_lane_regex_3 = ^(.+)\.bam.*$
999746fc92ba Uploaded nate parents: diff changeset	492 data_compress_regex_3 = ^.+\.bam(.*)$
999746fc92ba Uploaded nate parents: diff changeset	493 data_end1_converter_3 = samtools view - \| filter_sam_mate.pl 1 \| sam_to_fastq.pl
999746fc92ba Uploaded nate parents: diff changeset	494 data_end2_converter_3 = samtools view - \| filter_sam_mate.pl 2 \| sam_to_fastq.pl
999746fc92ba Uploaded nate parents: diff changeset	495
999746fc92ba Uploaded nate parents: diff changeset	496 data_lane_regex_4 = ^(.+).[12].fastq.*$
999746fc92ba Uploaded nate parents: diff changeset	497 data_end_regex_4 = ^.+.([12]).fastq.*$
999746fc92ba Uploaded nate parents: diff changeset	498 data_compress_regex_4 = ^.+.[12].fastq(.*)$
999746fc92ba Uploaded nate parents: diff changeset	499 data_converter_4 = cat
999746fc92ba Uploaded nate parents: diff changeset	500 #end raw
999746fc92ba Uploaded nate parents: diff changeset	501
999746fc92ba Uploaded nate parents: diff changeset	502 #end if
999746fc92ba Uploaded nate parents: diff changeset	503
999746fc92ba Uploaded nate parents: diff changeset	504 </configfile>
999746fc92ba Uploaded nate parents: diff changeset	505 </configfiles>
999746fc92ba Uploaded nate parents: diff changeset	506 <outputs>
999746fc92ba Uploaded nate parents: diff changeset	507 <data format="txt" name="config_txt" label="${tool.name} on ${on_string}: config.txt"/>
999746fc92ba Uploaded nate parents: diff changeset	508 <data format="txt" name="defuse_log" label="${tool.name} on ${on_string}: defuse.log" from_work_dir="output_dir/log/defuse.log"/>
999746fc92ba Uploaded nate parents: diff changeset	509 <data format="tabular" name="results_tsv" label="${tool.name} on ${on_string}: results.tsv" from_work_dir="output_dir/results.tsv"/>
999746fc92ba Uploaded nate parents: diff changeset	510 <data format="tabular" name="results_filtered_tsv" label="${tool.name} on ${on_string}: results.filtered.tsv" from_work_dir="output_dir/results.filtered.tsv"/>
999746fc92ba Uploaded nate parents: diff changeset	511 <data format="tabular" name="results_classify_tsv" label="${tool.name} on ${on_string}: results.classify.tsv" from_work_dir="output_dir/results.classify.tsv"/>
999746fc92ba Uploaded nate parents: diff changeset	512 </outputs>
999746fc92ba Uploaded nate parents: diff changeset	513 <tests>
999746fc92ba Uploaded nate parents: diff changeset	514 </tests>
999746fc92ba Uploaded nate parents: diff changeset	515 <help>
999746fc92ba Uploaded nate parents: diff changeset	516 DeFuse
999746fc92ba Uploaded nate parents: diff changeset	517
999746fc92ba Uploaded nate parents: diff changeset	518 DeFuse_ is a software package for gene fusion discovery using RNA-Seq data. The software uses clusters of discordant paired end alignments to inform a split read alignment analysis for finding fusion boundaries. The software also employs a number of heuristic filters in an attempt to reduce the number of false positives and produces a fully annotated output for each predicted fusion.
999746fc92ba Uploaded nate parents: diff changeset	519
999746fc92ba Uploaded nate parents: diff changeset	520 Journal reference: http://www.ploscompbiol.org/article/info%3Adoi%2F10.1371%2Fjournal.pcbi.1001138
999746fc92ba Uploaded nate parents: diff changeset	521
999746fc92ba Uploaded nate parents: diff changeset	522 .. _DeFuse: http://sourceforge.net/apps/mediawiki/defuse/index.php?title=Main_Page
999746fc92ba Uploaded nate parents: diff changeset	523
999746fc92ba Uploaded nate parents: diff changeset	524 ------
999746fc92ba Uploaded nate parents: diff changeset	525
999746fc92ba Uploaded nate parents: diff changeset	526 Inputs
999746fc92ba Uploaded nate parents: diff changeset	527
999746fc92ba Uploaded nate parents: diff changeset	528 DeFuse requires 2 fastq files for paried reads, one with the left mate of the paired reads, and a second fastq with the the right mate of the paired reads (with reads in the same order as in the first fastq dataset).
999746fc92ba Uploaded nate parents: diff changeset	529
999746fc92ba Uploaded nate parents: diff changeset	530 If your fastq files have reads in different orders or include unpaired reads, you can preprocess them with FASTQ interlacer to create a single interlaced fastq dataset with only the paired reads and input that to FASTQ de-interlacer to separate the reads into a left fastq and right fastq.
999746fc92ba Uploaded nate parents: diff changeset	531
999746fc92ba Uploaded nate parents: diff changeset	532 DeFuse uses a Reference Dataset to search for gene fusions. The Reference Dataset is generated from the following sources in DeFuse_Version_0.4_:
999746fc92ba Uploaded nate parents: diff changeset	533 - genome_fasta from Ensembl
999746fc92ba Uploaded nate parents: diff changeset	534 - gene_models from Ensembl
999746fc92ba Uploaded nate parents: diff changeset	535 - repeats_filename from UCSC RepeatMasker rmsk.txt
999746fc92ba Uploaded nate parents: diff changeset	536 - est_fasta from UCSC
999746fc92ba Uploaded nate parents: diff changeset	537 - est_alignments from UCSC intronEst.txt
999746fc92ba Uploaded nate parents: diff changeset	538 - unigene_fasta from NCBI
999746fc92ba Uploaded nate parents: diff changeset	539
999746fc92ba Uploaded nate parents: diff changeset	540 .. _DeFuse_Version_0.4: http://sourceforge.net/apps/mediawiki/defuse/index.php?title=DeFuse_Version_0.4.2
999746fc92ba Uploaded nate parents: diff changeset	541
999746fc92ba Uploaded nate parents: diff changeset	542 ------
999746fc92ba Uploaded nate parents: diff changeset	543
999746fc92ba Uploaded nate parents: diff changeset	544 Outputs
999746fc92ba Uploaded nate parents: diff changeset	545
999746fc92ba Uploaded nate parents: diff changeset	546 The galaxy history will contain 5 outputs: the config.txt file that provides DeFuse with its parameters, the defuse.log which details what DeFuse has done and can be useful in determining any errors, and the 3 results files that defuse generates.
999746fc92ba Uploaded nate parents: diff changeset	547
999746fc92ba Uploaded nate parents: diff changeset	548 DeFuse generates 3 results files: results.txt, results.filtered.txt, and results.classify.txt. All three files have the same format, though results.classify.txt has a probability column from the application of the classifier to results.txt, and results.filtered.txt has been filtered according to the threshold probability as set in config.txt.
999746fc92ba Uploaded nate parents: diff changeset	549
999746fc92ba Uploaded nate parents: diff changeset	550 The file format is tab delimited with one prediction per line, and the following fields per prediction (not necessarily in this order):
999746fc92ba Uploaded nate parents: diff changeset	551
999746fc92ba Uploaded nate parents: diff changeset	552 - Identification
999746fc92ba Uploaded nate parents: diff changeset	553 - cluster_id : random identifier assigned to each prediction
999746fc92ba Uploaded nate parents: diff changeset	554 - library_name : library name given on the command line of defuse
999746fc92ba Uploaded nate parents: diff changeset	555 - gene1 : ensembl id of gene 1
999746fc92ba Uploaded nate parents: diff changeset	556 - gene2 : ensembl id of gene 2
999746fc92ba Uploaded nate parents: diff changeset	557 - gene_name1 : name of gene 1
999746fc92ba Uploaded nate parents: diff changeset	558 - gene_name2 : name of gene 2
999746fc92ba Uploaded nate parents: diff changeset	559 - Evidence
999746fc92ba Uploaded nate parents: diff changeset	560 - break_predict : breakpoint prediction method, denovo or splitr, that is considered most reliable
999746fc92ba Uploaded nate parents: diff changeset	561 - concordant_ratio : proportion of spanning reads considered concordant by blat
999746fc92ba Uploaded nate parents: diff changeset	562 - denovo_min_count : minimum kmer count across denovo assembled sequence
999746fc92ba Uploaded nate parents: diff changeset	563 - denovo_sequence : fusion sequence predicted by debruijn based denovo sequence assembly
999746fc92ba Uploaded nate parents: diff changeset	564 - denovo_span_pvalue : p-value, lower values are evidence the prediction is a false positive
999746fc92ba Uploaded nate parents: diff changeset	565 - gene_align_strand1 : alignment strand for spanning read alignments to gene 1
999746fc92ba Uploaded nate parents: diff changeset	566 - gene_align_strand2 : alignment strand for spanning read alignments to gene 2
999746fc92ba Uploaded nate parents: diff changeset	567 - min_map_count : minimum of the number of genomic mappings for each spanning read
999746fc92ba Uploaded nate parents: diff changeset	568 - max_map_count : maximum of the number of genomic mappings for each spanning read
999746fc92ba Uploaded nate parents: diff changeset	569 - mean_map_count : average of the number of genomic mappings for each spanning read
999746fc92ba Uploaded nate parents: diff changeset	570 - num_multi_map : number of spanning reads that map to more than one genomic location
999746fc92ba Uploaded nate parents: diff changeset	571 - span_count : number of spanning reads supporting the fusion
999746fc92ba Uploaded nate parents: diff changeset	572 - span_coverage1 : coverage of spanning reads aligned to gene 1 as a proportion of expected coverage
999746fc92ba Uploaded nate parents: diff changeset	573 - span_coverage2 : coverage of spanning reads aligned to gene 2 as a proportion of expected coverage
999746fc92ba Uploaded nate parents: diff changeset	574 - span_coverage_min : minimum of span_coverage1 and span_coverage2
999746fc92ba Uploaded nate parents: diff changeset	575 - span_coverage_max : maximum of span_coverage1 and span_coverage2
999746fc92ba Uploaded nate parents: diff changeset	576 - splitr_count : number of split reads supporting the prediction
999746fc92ba Uploaded nate parents: diff changeset	577 - splitr_min_pvalue : p-value, lower values are evidence the prediction is a false positive
999746fc92ba Uploaded nate parents: diff changeset	578 - splitr_pos_pvalue : p-value, lower values are evidence the prediction is a false positive
999746fc92ba Uploaded nate parents: diff changeset	579 - splitr_sequence : fusion sequence predicted by split reads
999746fc92ba Uploaded nate parents: diff changeset	580 - splitr_span_pvalue : p-value, lower values are evidence the prediction is a false positive
999746fc92ba Uploaded nate parents: diff changeset	581 - Annotation
999746fc92ba Uploaded nate parents: diff changeset	582 - adjacent : fusion between adjacent genes
999746fc92ba Uploaded nate parents: diff changeset	583 - altsplice : fusion likely the product of alternative splicing between adjacent genes
999746fc92ba Uploaded nate parents: diff changeset	584 - break_adj_entropy1 : di-nucleotide entropy of the 40 nucleotides adjacent to the fusion splice in gene 1
999746fc92ba Uploaded nate parents: diff changeset	585 - break_adj_entropy2 : di-nucleotide entropy of the 40 nucleotides adjacent to the fusion splice in gene 2
999746fc92ba Uploaded nate parents: diff changeset	586 - break_adj_entropy_min : minimum of break_adj_entropy1 and break_adj_entropy2
999746fc92ba Uploaded nate parents: diff changeset	587 - breakpoint_homology : number of nucleotides at the fusion splice that align equally well to gene 1 or gene 2
999746fc92ba Uploaded nate parents: diff changeset	588 - breakseqs_estislands_percident : maximum percent identity of fusion sequence alignments to est islands
999746fc92ba Uploaded nate parents: diff changeset	589 - cdna_breakseqs_percident : maximum percent identity of fusion sequence alignments to cdna
999746fc92ba Uploaded nate parents: diff changeset	590 - deletion : fusion produced by a genomic deletion
999746fc92ba Uploaded nate parents: diff changeset	591 - est_breakseqs_percident : maximum percent identity of fusion sequence alignments to est
999746fc92ba Uploaded nate parents: diff changeset	592 - eversion : fusion produced by a genomic eversion
999746fc92ba Uploaded nate parents: diff changeset	593 - exonboundaries : fusion splice at exon boundaries
999746fc92ba Uploaded nate parents: diff changeset	594 - expression1 : expression of gene 1 as number of concordant pairs aligned to exons
999746fc92ba Uploaded nate parents: diff changeset	595 - expression2 : expression of gene 2 as number of concordant pairs aligned to exons
999746fc92ba Uploaded nate parents: diff changeset	596 - gene_chromosome1 : chromosome of gene 1
999746fc92ba Uploaded nate parents: diff changeset	597 - gene_chromosome2 : chromosome of gene 2
999746fc92ba Uploaded nate parents: diff changeset	598 - gene_end1 : end position for gene 1
999746fc92ba Uploaded nate parents: diff changeset	599 - gene_end2 : end position for gene 2
999746fc92ba Uploaded nate parents: diff changeset	600 - gene_location1 : location of breakpoint in gene 1
999746fc92ba Uploaded nate parents: diff changeset	601 - gene_location2 : location of breakpoint in gene 2
999746fc92ba Uploaded nate parents: diff changeset	602 - gene_start1 : start of gene 1
999746fc92ba Uploaded nate parents: diff changeset	603 - gene_start2 : start of gene 2
999746fc92ba Uploaded nate parents: diff changeset	604 - gene_strand1 : strand of gene 1
999746fc92ba Uploaded nate parents: diff changeset	605 - gene_strand2 : strand of gene 2
999746fc92ba Uploaded nate parents: diff changeset	606 - genome_breakseqs_percident : maximum percent identity of fusion sequence alignments to genome
999746fc92ba Uploaded nate parents: diff changeset	607 - genomic_break_pos1 : genomic position in gene 1 of fusion splice / breakpoint
999746fc92ba Uploaded nate parents: diff changeset	608 - genomic_break_pos2 : genomic position in gene 2 of fusion splice / breakpoint
999746fc92ba Uploaded nate parents: diff changeset	609 - genomic_strand1 : genomic strand in gene 1 of fusion splice / breakpoint, retained sequence upstream on this strand, breakpoint is downstream
999746fc92ba Uploaded nate parents: diff changeset	610 - genomic_strand2 : genomic strand in gene 2 of fusion splice / breakpoint, retained sequence upstream on this strand, breakpoint is downstream
999746fc92ba Uploaded nate parents: diff changeset	611 - interchromosomal : fusion produced by an interchromosomal translocation
999746fc92ba Uploaded nate parents: diff changeset	612 - interrupted_index1 : ratio of coverage before and after the fusion splice / breakpoint in gene 1
999746fc92ba Uploaded nate parents: diff changeset	613 - interrupted_index2 : ratio of coverage before and after the fusion splice / breakpoint in gene 2
999746fc92ba Uploaded nate parents: diff changeset	614 - inversion : fusion produced by genomic inversion
999746fc92ba Uploaded nate parents: diff changeset	615 - orf : fusion combines genes in a way that preserves a reading frame
999746fc92ba Uploaded nate parents: diff changeset	616 - probability : probability produced by classification using adaboost and example positives/negatives (only given in results.classified.txt)
999746fc92ba Uploaded nate parents: diff changeset	617 - read_through : fusion involving adjacent potentially resulting from co-transcription rather than genome rearrangement
999746fc92ba Uploaded nate parents: diff changeset	618 - repeat_proportion1 : proportion of the spanning reads in gene 1 that span a repeat region
999746fc92ba Uploaded nate parents: diff changeset	619 - repeat_proportion2 : proportion of the spanning reads in gene 2 that span a repeat region
999746fc92ba Uploaded nate parents: diff changeset	620 - max_repeat_proportion : max of repeat_proportion1 and repeat_proportion2
999746fc92ba Uploaded nate parents: diff changeset	621 - splice_score : number of nucleotides similar to GTAG at fusion splice
999746fc92ba Uploaded nate parents: diff changeset	622 - num_splice_variants : number of potential splice variants for this gene pair
999746fc92ba Uploaded nate parents: diff changeset	623 - splicing_index1 : number of concordant pairs in gene 1 spanning the fusion splice / breakpoint, divided by number of spanning reads supporting the fusion with gene 2
999746fc92ba Uploaded nate parents: diff changeset	624 - splicing_index2 : number of concordant pairs in gene 2 spanning the fusion splice / breakpoint, divided by number of spanning reads supporting the fusion with gene 1
999746fc92ba Uploaded nate parents: diff changeset	625
999746fc92ba Uploaded nate parents: diff changeset	626
999746fc92ba Uploaded nate parents: diff changeset	627 Example
999746fc92ba Uploaded nate parents: diff changeset	628
999746fc92ba Uploaded nate parents: diff changeset	629 results.tsv::
999746fc92ba Uploaded nate parents: diff changeset	630
999746fc92ba Uploaded nate parents: diff changeset	631 cluster_id splitr_sequence splitr_count splitr_span_pvalue splitr_pos_pvalue splitr_min_pvalue adjacent altsplice break_adj_entropy1 break_adj_entropy2 break_adj_entropy_min break_predict breakpoint_homology breakseqs_estislands_percident cdna_breakseqs_percident concordant_ratio deletion est_breakseqs_percident eversion exonboundaries expression1 expression2 gene1 gene2 gene_align_strand1 gene_align_strand2 gene_chromosome1 gene_chromosome2 gene_end1 gene_end2 gene_location1 gene_location2 gene_name1 gene_name2 gene_start1 gene_start2 gene_strand1 gene_strand2 genome_breakseqs_percident genomic_break_pos1 genomic_break_pos2 genomic_strand1 genomic_strand2 interchromosomal interrupted_index1 interrupted_index2 inversion library_name max_map_count max_repeat_proportion mean_map_count min_map_count num_multi_map num_splice_variants orf read_through repeat_proportion1 repeat_proportion2 span_count span_coverage1 span_coverage2 span_coverage_max span_coverage_min splice_score splicing_index1 splicing_index2
999746fc92ba Uploaded nate parents: diff changeset	632 1169 GCTTACTGTATGCCAGGCCCCAGAGGGGCAACCACCCTCTAAAGAGAGCGGCTCCTGCCTCCCAGAAAGCTCACAGACTGTGGGAGGGAAACAGGCAGCAGGTGAAGATGCCAAATGCCAGGATATCTGCCCTGTCCTTGCTTGATGCAGCTGCTGGCTCCCACGTTCTCCCCAGAATCCCCTCACACTCCTGCTGTTTTCTCTGCAGGTTGGCAGAGCCCCATGAGGGCAGGGCAGCCACTTTGTTCTTGGGCGGCAAACCTCCCTGGGCGGCACGGAAACCACGGTGAGAAGGGGGCAGGTCGGGCACGTGCAGGGACCACGCTGCAGG\|TGTACCCAACAGCTCCGAAGAGACAGCGACCATCGAGAACGGGCCATGATGACGATGGCGGTTTTGTCGAAAAGAAAAGGGGGAAATGTGGGGAAAAGCAAGAGAGATCAGATTGTTACTGTGTCTGTGTAGAAAGAAGTAGACATGGGAGACTCCATTTTGTTCTGTACTAAGAAAAATTCTTCTGCCTTGAGATTCGGTGACCCCACCCCCAACCCCGTGCTCTCTGAAACATGTGCTGTGTCCACTCAGGGTTGAATGGATTAAGGGCGGTGCGAGACGTGCTTT 2 0.000436307890680442 0.110748295953850 0.0880671602973091 N Y 3.19872427442695 3.48337348351473 3.19872427442695 splitr 0 0 0 0 Y 0 N N 0 0 ENSG00000105549 ENSG00000213753 + - 19 19 376013 59111168 intron upstream THEG AC016629.2 361750 59084870 - + 0 375099 386594 + - N 8.34107429512245 - N output_dir 82 0.677852348993289 40.6666666666667 1 11 1 N N 0.361271676300578 0.677852348993289 12 0.758602776578432 0.569678713445872 0.758602776578432 0.569678713445872 2 0.416666666666667 -
999746fc92ba Uploaded nate parents: diff changeset	633 3596 TGGGGGTTGAGGCTTCTGTTCCCAGGTTCCATGACCTCAGAGGTGGCTGGTGAGGTTATGACCTTTGCCCTCCAGCCCTGGCTTAAAACCTCAGCCCTAGGACCTGGTTAAAGGAAGGGGAGATGGAGCTTTGCCCCGACCCCCCCCCGTTCCCCTCACCTGTCAGCCCGAGCTGGGCCAGGGCCCCTAGGTGGGGAACTGGGCCGGGGGGCGGGCACAAGCGGAGGTGGTGCCCCCAAAAGGGCTCCCGGTGGGGTCTTGCTGAGAAGGTGAGGGGTTCCCGGGGCCGCAGCAGGTGGTGGTGGAGGAGCCAAGCGGCTGTAGAGCAAGGGGTGAGCAGGTTCCAGACCGTAGAGGCGGGCAGCGGCCACGGCCCCGGGTCCAGTTAGCTCCTCACCCGCCTCATAGAAGCGGGGTGGCCTTGCCAGGCGTGGGGGTGCTGCC\|TTCCTTGGATGTGGTAGCCGTTTCTCAGGCTCCCTCTCCGGAATCGAACCCTGATTCCCCGTCACCCGTGGTCACCATGGTAGGCACGGCGACTACCATCGAAAGTTGATAGGGCAGACGTTCGAATGGGTCGTCGCCGCCACGGGGGGCGTGCGATCAGCCCGAGGTTATCTAGAGTCACCAAAGCCGCCGGCGCCCGCCCCCCGGCCGGGGCCGGAGAGGGGCTGACCGGGTTGGTTTTGATCTGATAAATGCACGCATCCCCCCCGCGAAGGGGGTCAGCGCCCGTCGGCATGTATTAGCTCTAGAATTACCACAGTTATCCAAGTAGGAGAGGAGCGAGCGACCAAAGGAACCATAACTGATTTAATGAGCCATTCGCAGTTTCACTGTACCGGCCGTGCGTACTTAGACATGCATGGCTTAATCTTTGAGACAAGCATATGCTACTGGCAGG 250 7.00711162298275e-72 0.00912124762512338 0.00684237452309549 N N 3.31745197152461 3.47233119514066 3.31745197152461 splitr 7 0.0157657657657656 0 0 N 0.0135135135135136 N N 0 0 ENSG00000156860 ENSG00000212932 - + 16 21 30682131 48111157 coding upstream FBRS RPL23AP4 30670289 48110676 + + 0.0157657657657656 30680678 9827473 - + Y - - N output_dir 2 1 1.11111111111111 1 1 1 N N 0 1 9 0.325530693397641 0.296465452915709 0.325530693397641 0.296465452915709 2 - -
999746fc92ba Uploaded nate parents: diff changeset	634
999746fc92ba Uploaded nate parents: diff changeset	635 </help>
999746fc92ba Uploaded nate parents: diff changeset	636 </tool>

Mercurial > repos > nate > nate_test

annotate defuse.xml @ 2:999746fc92ba default tip