gatktools: variant_recalibrator.xml annotate

author	lz_hust
date	Sat, 01 Jun 2019 07:20:41 -0400 (2019-06-01)
parents
children

rev	line source
15 01ff8dd37d4d Uploaded lz_hust parents: diff changeset	1 <tool id="gatk2_variant_recalibrator" name="Variant Recalibrator" version="@VERSION@.1">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	2 <description></description>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	3 <macros>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	4 <import>gatk2_macros.xml</import>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	5 </macros>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	6 <expand macro="requirements">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	7 <requirement type="package" version="0.9.3">ggplot2</requirement>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	8 </expand>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	9 <expand macro="version_command" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	10 <command interpreter="python">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	11 gatk2_wrapper.py
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	12 --stdout "${output_log}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	13 #for $var_count, $variant in enumerate( $reference_source.input_variants ):
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	14 -d "--input:input_${var_count},%(file_type)s" "${variant}" "${variant.ext}" "input_variants_${var_count}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	15 #end for
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	16 -p '
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	17 @JAR_PATH@
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	18 -T "VariantRecalibrator"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	19 \$GATK2_SITE_OPTIONS
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	20
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	21 @THREADS@
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	22
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	23 #if $reference_source.reference_source_selector != "history":
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	24 -R "${reference_source.ref_file.fields.path}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	25 #end if
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	26 --recal_file "${output_recal}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	27 --tranches_file "${output_tranches}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	28 --rscript_file "${output_rscript}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	29 '
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	30
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	31 #set $rod_binding_names = dict()
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	32 #for $rod_binding in $rod_bind:
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	33 #if str( $rod_binding.rod_bind_type.rod_bind_type_selector ) == 'custom':
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	34 #set $rod_bind_name = $rod_binding.rod_bind_type.custom_rod_name
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	35 #elif str( $rod_binding.rod_bind_type.rod_bind_type_selector ) == 'comp':
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	36 #set $rod_bind_name = "comp" + $rod_binding.rod_bind_type.custom_rod_name
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	37 #else
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	38 #set $rod_bind_name = $rod_binding.rod_bind_type.rod_bind_type_selector
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	39 #end if
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	40 #set $rod_binding_names[$rod_bind_name] = $rod_binding_names.get( $rod_bind_name, -1 ) + 1
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	41 #if $rod_binding.rod_bind_type.rod_training_type.rod_training_type_selector == "not_training_truth_known":
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	42 -d "--resource:${rod_bind_name},%(file_type)s" "${rod_binding.rod_bind_type.input_rod}" "${rod_binding.rod_bind_type.input_rod.ext}" "input_${rod_bind_name}_${rod_binding_names[$rod_bind_name]}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	43 #else:
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	44 -d "--resource:${rod_bind_name},%(file_type)s,known=${rod_binding.rod_bind_type.rod_training_type.known},training=${rod_binding.rod_bind_type.rod_training_type.training},truth=${rod_binding.rod_bind_type.rod_training_type.truth},bad=${rod_binding.rod_bind_type.rod_training_type.bad},prior=${rod_binding.rod_bind_type.rod_training_type.prior}" "${rod_binding.rod_bind_type.input_rod}" "${rod_binding.rod_bind_type.input_rod.ext}" "input_${rod_bind_name}_${rod_binding_names[$rod_bind_name]}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	45 #end if
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	46 #end for
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	47
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	48 #include source=$standard_gatk_options#
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	49
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	50 ##start analysis specific options
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	51 -p '
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	52 #if str( $annotations ) != "None":
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	53 #for $annotation in str( $annotations.fields.gatk_value ).split( ',' ):
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	54 --use_annotation "${annotation}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	55 #end for
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	56 #end if
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	57 #for $additional_annotation in $additional_annotations:
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	58 --use_annotation "${additional_annotation.additional_annotation_name}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	59 #end for
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	60 --mode "${mode}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	61 '
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	62
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	63 #if $analysis_param_type.analysis_param_type_selector == "advanced":
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	64 -p '
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	65 --maxGaussians "${analysis_param_type.max_gaussians}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	66 --maxIterations "${analysis_param_type.max_iterations}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	67 --numKMeans "${analysis_param_type.num_k_means}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	68 --stdThreshold "${analysis_param_type.std_threshold}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	69 --shrinkage "${analysis_param_type.shrinkage}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	70 --dirichlet "${analysis_param_type.dirichlet}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	71 --priorCounts "${analysis_param_type.prior_counts}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	72
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	73 --minNumBadVariants "${analysis_param_type.min_num_bad_variants}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	74
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	75 --target_titv "${analysis_param_type.target_titv}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	76 #for $tranche in [ $tranche.strip() for $tranche in str( $analysis_param_type.ts_tranche ).split( ',' ) if $tranche.strip() ]
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	77 --TStranche "${tranche}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	78 #end for
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	79 #for $ignore_filter in $analysis_param_type.ignore_filters:
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	80 #set $ignore_filter_name = str( $ignore_filter.ignore_filter_type.ignore_filter_type_selector )
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	81 #if $ignore_filter_name == "custom":
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	82 #set $ignore_filter_name = str( $ignore_filter.ignore_filter_type.filter_name )
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	83 #end if
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	84 --ignore_filter "${ignore_filter_name}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	85 #end for
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	86 '
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	87 #end if
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	88
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	89 &&
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	90 mv "${output_rscript}.pdf" "${output_tranches_pdf}"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	91
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	92 </command>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	93 <inputs>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	94 <conditional name="reference_source">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	95 <expand macro="reference_source_selector_param" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	96 <when value="cached">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	97 <expand macro="input_variants" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	98 <param name="ref_file" type="select" label="Using reference genome" help="-R,--reference_sequence &lt;reference_sequence&gt;">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	99 <options from_data_table="gatk2_picard_indexes">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	100 <!-- <filter type="data_meta" key="dbkey" ref="variants[0].input_variants" column="dbkey"/> -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	101 </options>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	102 <validator type="no_options" message="A built-in reference genome is not available for the build associated with the selected input file"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	103 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	104 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	105 <when value="history"> <!-- FIX ME!!!! -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	106 <expand macro="input_variants" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	107 <param name="ref_file" type="data" format="fasta" label="Using reference file" help="-R,--reference_sequence &lt;reference_sequence&gt;" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	108 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	109 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	110
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	111 <repeat name="rod_bind" title="Binding for reference-ordered data" help="-resource,--resource &lt;resource&gt;" min="2">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	112 <conditional name="rod_bind_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	113 <param name="rod_bind_type_selector" type="select" label="Binding Type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	114 <option value="dbsnp" selected="True">dbSNP</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	115 <option value="variant">Variants</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	116 <option value="snps">SNPs</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	117 <option value="indels">INDELs</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	118 <option value="hapmap">HapMap</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	119 <option value="omni">OMNI</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	120 <option value="mask">Mask</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	121 <option value="custom">Custom</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	122 <option value="comp">Comp</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	123 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	124 <when value="variant">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	125 <param name="input_rod" type="data" format="vcf" label="Variant ROD file" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	126 <conditional name="rod_training_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	127 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	128 <option value="is_training_truth_known">Set training/truth/known sites</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	129 <option value="not_training_truth_known" selected="True">Don't Set options</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	130 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	131 <when value="not_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	132 <!-- do nothing here -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	133 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	134 <when value="is_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	135 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	136 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	137 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	138 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	139 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	140 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	141 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	142 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	143 <when value="comp">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	144 <param name="input_rod" type="data" format="vcf" label="ROD file" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	145 <param name="custom_rod_name" type="text" value="Unnamed" label="ROD Name"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	146 <conditional name="rod_training_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	147 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	148 <option value="is_training_truth_known">Set training/truth/known sites</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	149 <option value="not_training_truth_known" selected="True">Don't Set options</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	150 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	151 <when value="not_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	152 <!-- do nothing here -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	153 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	154 <when value="is_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	155 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	156 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	157 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	158 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	159 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	160 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	161 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	162 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	163 <when value="mask">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	164 <param name="input_rod" type="data" format="vcf" label="ROD file" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	165 <conditional name="rod_training_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	166 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	167 <option value="is_training_truth_known">Set training/truth/known sites</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	168 <option value="not_training_truth_known" selected="True">Don't Set options</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	169 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	170 <when value="not_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	171 <!-- do nothing here -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	172 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	173 <when value="is_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	174 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	175 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	176 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	177 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	178 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	179 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	180 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	181 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	182 <when value="dbsnp">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	183 <param name="input_rod" type="data" format="vcf" label="ROD file" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	184 <conditional name="rod_training_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	185 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	186 <option value="is_training_truth_known">Set training/truth/known sites</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	187 <option value="not_training_truth_known" selected="True">Don't Set options</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	188 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	189 <when value="not_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	190 <!-- do nothing here -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	191 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	192 <when value="is_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	193 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	194 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	195 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	196 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	197 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	198 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	199 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	200 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	201 <when value="snps">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	202 <param name="input_rod" type="data" format="vcf" label="ROD file" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	203 <conditional name="rod_training_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	204 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	205 <option value="is_training_truth_known">Set training/truth/known sites</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	206 <option value="not_training_truth_known" selected="True">Don't Set options</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	207 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	208 <when value="not_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	209 <!-- do nothing here -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	210 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	211 <when value="is_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	212 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	213 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	214 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	215 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	216 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	217 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	218 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	219 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	220 <when value="hapmap">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	221 <param name="input_rod" type="data" format="vcf" label="ROD file" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	222 <conditional name="rod_training_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	223 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	224 <option value="is_training_truth_known">Set training/truth/known sites</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	225 <option value="not_training_truth_known" selected="True">Don't Set options</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	226 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	227 <when value="not_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	228 <!-- do nothing here -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	229 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	230 <when value="is_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	231 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	232 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	233 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	234 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	235 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	236 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	237 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	238 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	239 <when value="omni">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	240 <param name="input_rod" type="data" format="vcf" label="ROD file" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	241 <conditional name="rod_training_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	242 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	243 <option value="is_training_truth_known">Set training/truth/known sites</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	244 <option value="not_training_truth_known" selected="True">Don't Set options</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	245 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	246 <when value="not_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	247 <!-- do nothing here -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	248 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	249 <when value="is_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	250 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	251 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	252 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	253 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	254 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	255 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	256 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	257 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	258 <when value="indels">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	259 <param name="input_rod" type="data" format="vcf" label="ROD file" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	260 <conditional name="rod_training_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	261 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	262 <option value="is_training_truth_known">Set training/truth/known sites</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	263 <option value="not_training_truth_known" selected="True">Don't Set options</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	264 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	265 <when value="not_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	266 <!-- do nothing here -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	267 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	268 <when value="is_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	269 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	270 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	271 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	272 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	273 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	274 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	275 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	276 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	277 <when value="custom">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	278 <param name="custom_rod_name" type="text" value="Unknown" label="ROD Name"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	279 <param name="input_rod" type="data" format="vcf" label="ROD file" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	280 <conditional name="rod_training_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	281 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	282 <option value="is_training_truth_known">Set training/truth/known sites</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	283 <option value="not_training_truth_known" selected="True">Don't Set options</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	284 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	285 <when value="not_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	286 <!-- do nothing here -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	287 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	288 <when value="is_training_truth_known">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	289 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	290 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	291 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	292 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	293 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	294 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	295 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	296 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	297 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	298 </repeat>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	299
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	300 <param name="annotations" type="select" multiple="True" display="checkboxes" label="annotations which should used for calculations" help="-an,--use_annotation &lt;use_annotation&gt;">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	301 <!-- load the available annotations from an external configuration file, since additional ones can be added to local installs -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	302 <options from_data_table="gatk2_annotations">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	303 <filter type="multiple_splitter" column="tools_valid_for" separator=","/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	304 <filter type="static_value" value="VariantRecalibrator" column="tools_valid_for"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	305 </options>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	306 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	307
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	308 <repeat name="additional_annotations" title="Additional annotation" help="-an,--use_annotation &lt;use_annotation&gt;">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	309 <param name="additional_annotation_name" type="text" value="" label="Annotation name" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	310 </repeat>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	311
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	312 <param name="mode" type="select" label="Recalibration mode" help="-mode,--mode &lt;mode&gt;">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	313 <option value="SNP" selected="True">SNP</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	314 <option value="INDEL">INDEL</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	315 <option value="BOTH">BOTH</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	316 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	317
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	318 <expand macro="gatk_param_type_conditional" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	319
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	320 <expand macro="analysis_type_conditional">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	321 <param name="max_gaussians" type="integer" label="maximum number of Gaussians to try during variational Bayes Algorithm" value="8" help="-mG,--maxGaussians &lt;maxGaussians&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	322 <param name="max_iterations" type="integer" label="maximum number of maximum number of VBEM iterations to be performed in variational Bayes Algorithm" value="150" help="-mI,--maxIterations &lt;maxIterations&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	323 <param name="num_k_means" type="integer" label="number of k-means iterations to perform in order to initialize the means of the Gaussians in the Gaussian mixture model" value="100" help="-nKM,--numKMeans &lt;numKMeans&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	324 <param name="std_threshold" type="float" label="If a variant has annotations more than -std standard deviations away from mean then don't use it for building the Gaussian mixture model." value="10.0" help="-std,--stdThreshold &lt;stdThreshold&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	325 <param name="shrinkage" type="float" label="shrinkage parameter in variational Bayes algorithm" value="1.0" help="-shrinkage,--shrinkage &lt;shrinkage&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	326 <param name="dirichlet" type="float" label="dirichlet parameter in variational Bayes algorithm" value="0.001" help="-dirichlet,--dirichlet &lt;dirichlet&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	327 <param name="prior_counts" type="float" label="number of prior counts to use in variational Bayes algorithm" value="20.0" help="-priorCounts,--priorCounts &lt;priorCounts&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	328 <!--<param name="trustAllPolymorphic" type="boolean" label="trustAllPolymorphic" truevalue="-/-trustAllPolymorphic=true" falsevalue="-/-trustAllPolymorphic=false"
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	329 help="Trust that all the input training sets' unfiltered records contain only polymorphic sites to drastically speed up the computation. -trustAllPolymorphic" />-->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	330 <param name="min_num_bad_variants" type="integer" label="Minimum number of worst scoring variants to use when building the Gaussian mixture model of bad variants" value="1000" help="--minNumBadVariants &lt;minNumBadVariants&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	331 <param name="target_titv" type="float" label="expected novel Ti/Tv ratio to use when calculating FDR tranches and for display on optimization curve output figures. (approx 2.15 for whole genome experiments). ONLY USED FOR PLOTTING PURPOSES!" value="2.15" help="-titv,--target_titv &lt;target_titv&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	332 <param name="ts_tranche" type="text" label="levels of novel false discovery rate (FDR, implied by ti/tv) at which to slice the data. (in percent, that is 1.0 for 1 percent)" value="100.0, 99.9, 99.0, 90.0" help="-tranche,--TStranche &lt;TStranche&gt;"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	333 <repeat name="ignore_filters" title="Ignore Filter" help="-ignoreFilter,--ignore_filter &lt;ignore_filter&gt;">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	334 <conditional name="ignore_filter_type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	335 <param name="ignore_filter_type_selector" type="select" label="Filter Type">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	336 <option value="HARD_TO_VALIDATE">HARD_TO_VALIDATE</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	337 <option value="LowQual" >LowQual</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	338 <option value="custom" selected="True">Other</option>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	339 </param>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	340 <when value="custom">
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	341 <param name="filter_name" type="text" value="" label="Filter name"/>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	342 </when>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	343 <when value="HARD_TO_VALIDATE" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	344 <when value="LowQual" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	345 </conditional>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	346 </repeat>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	347 </expand>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	348 </inputs>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	349 <outputs>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	350 <data format="gatk_recal" name="output_recal" label="${tool.name} on ${on_string} (Recalibration File)" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	351 <data format="gatk_tranche" name="output_tranches" label="${tool.name} on ${on_string} (Tranches File)" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	352 <data format="txt" name="output_rscript" label="${tool.name} on ${on_string} (RScript File)" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	353 <data format="pdf" name="output_tranches_pdf" label="${tool.name} on ${on_string} (PDF File)" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	354 <data format="txt" name="output_log" label="${tool.name} on ${on_string} (log)" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	355 </outputs>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	356 <tests>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	357 <!-- ADD TESTS -->
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	358 </tests>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	359 <help>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	360 What it does
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	361
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	362 Takes variant calls as .vcf files, learns a Gaussian mixture model over the variant annotations and evaluates the variant -- assigning an informative lod score
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	363
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	364 For more information on using the VariantRecalibrator module, see this `tool specific page <http://www.broadinstitute.org/gatk/gatkdocs/org_broadinstitute_sting_gatk_walkers_variantrecalibration_VariantRecalibrator.html>`_.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	365
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	366 To learn about best practices for variant detection using GATK, see this `overview <http://www.broadinstitute.org/gatk/guide/topic?name=best-practices>`_.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	367
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	368 If you encounter errors, please view the `GATK FAQ <http://www.broadinstitute.org/gatk/guide/topic?name=faqs>`_.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	369
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	370 ------
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	371
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	372 Inputs
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	373
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	374 GenomeAnalysisTK: VariantRecalibrator accepts a variant input file.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	375
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	376
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	377 Outputs
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	378
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	379 The output is in VCF format.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	380
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	381
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	382 Go `here <http://www.broadinstitute.org/gatk/guide/topic?name=intro>`_ for details on GATK file formats.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	383
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	384 -------
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	385
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	386 Settings::
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	387
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	388
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	389 tranches_file The output tranches file used by ApplyRecalibration
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	390 use_annotation The names of the annotations which should used for calculations
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	391 mode Recalibration mode to employ: 1.) SNP for recalibrating only snps (emitting indels untouched in the output VCF); 2.) INDEL for indels; and 3.) BOTH for recalibrating both snps and indels simultaneously. (SNP\|INDEL\|BOTH)
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	392 maxGaussians The maximum number of Gaussians to try during variational Bayes algorithm
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	393 maxIterations The maximum number of VBEM iterations to be performed in variational Bayes algorithm. Procedure will normally end when convergence is detected.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	394 numKMeans The number of k-means iterations to perform in order to initialize the means of the Gaussians in the Gaussian mixture model.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	395 stdThreshold If a variant has annotations more than -std standard deviations away from mean then don't use it for building the Gaussian mixture model.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	396 shrinkage The shrinkage parameter in variational Bayes algorithm.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	397 dirichlet The dirichlet parameter in variational Bayes algorithm.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	398 priorCounts The number of prior counts to use in variational Bayes algorithm.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	399 minNumBadVariants The minimum amount of worst scoring variants to use when building the Gaussian mixture model of bad variants.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	400 recal_file The output recal file used by ApplyRecalibration
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	401 target_titv The expected novel Ti/Tv ratio to use when calculating FDR tranches and for display on optimization curve output figures. (approx 2.15 for whole genome experiments). ONLY USED FOR PLOTTING PURPOSES!
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	402 TStranche The levels of novel false discovery rate (FDR, implied by ti/tv) at which to slice the data. (in percent, that is 1.0 for 1 percent)
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	403 ignore_filter If specified the optimizer will use variants even if the specified filter name is marked in the input VCF file
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	404 path_to_Rscript The path to your implementation of Rscript. For Broad users this is maybe /broad/tools/apps/R-2.6.0/bin/Rscript
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	405 rscript_file The output rscript file generated by the VQSR to aid in visualization of the input data and learned model
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	406 path_to_resources Path to resources folder holding the Sting R scripts.
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	407
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	408 @CITATION_SECTION@
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	409 </help>
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	410 <expand macro="citations" />
01ff8dd37d4d Uploaded lz_hust parents: diff changeset	411 </tool>

15

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

1 <tool id="gatk2_variant_recalibrator" name="Variant Recalibrator" version="@VERSION@.1">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

2 <description></description>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

3 <macros>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

4 <import>gatk2_macros.xml</import>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

5 </macros>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

6 <expand macro="requirements">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

7 <requirement type="package" version="0.9.3">ggplot2</requirement>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

8 </expand>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

9 <expand macro="version_command" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

10 <command interpreter="python">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

11 gatk2_wrapper.py

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

12 --stdout "${output_log}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

13 #for $var_count, $variant in enumerate( $reference_source.input_variants ):

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

14 -d "--input:input_${var_count},%(file_type)s" "${variant}" "${variant.ext}" "input_variants_${var_count}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

15 #end for

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

16 -p '

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

17 @JAR_PATH@

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

18 -T "VariantRecalibrator"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

19 \$GATK2_SITE_OPTIONS

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

20

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

21 @THREADS@

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

22

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

23 #if $reference_source.reference_source_selector != "history":

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

24 -R "${reference_source.ref_file.fields.path}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

25 #end if

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

26 --recal_file "${output_recal}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

27 --tranches_file "${output_tranches}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

28 --rscript_file "${output_rscript}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

29 '

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

30

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

31 #set $rod_binding_names = dict()

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

32 #for $rod_binding in $rod_bind:

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

33 #if str( $rod_binding.rod_bind_type.rod_bind_type_selector ) == 'custom':

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

34 #set $rod_bind_name = $rod_binding.rod_bind_type.custom_rod_name

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

35 #elif str( $rod_binding.rod_bind_type.rod_bind_type_selector ) == 'comp':

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

36 #set $rod_bind_name = "comp" + $rod_binding.rod_bind_type.custom_rod_name

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

37 #else

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

38 #set $rod_bind_name = $rod_binding.rod_bind_type.rod_bind_type_selector

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

39 #end if

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

40 #set $rod_binding_names[$rod_bind_name] = $rod_binding_names.get( $rod_bind_name, -1 ) + 1

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

41 #if $rod_binding.rod_bind_type.rod_training_type.rod_training_type_selector == "not_training_truth_known":

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

42 -d "--resource:${rod_bind_name},%(file_type)s" "${rod_binding.rod_bind_type.input_rod}" "${rod_binding.rod_bind_type.input_rod.ext}" "input_${rod_bind_name}_${rod_binding_names[$rod_bind_name]}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

43 #else:

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

44 -d "--resource:${rod_bind_name},%(file_type)s,known=${rod_binding.rod_bind_type.rod_training_type.known},training=${rod_binding.rod_bind_type.rod_training_type.training},truth=${rod_binding.rod_bind_type.rod_training_type.truth},bad=${rod_binding.rod_bind_type.rod_training_type.bad},prior=${rod_binding.rod_bind_type.rod_training_type.prior}" "${rod_binding.rod_bind_type.input_rod}" "${rod_binding.rod_bind_type.input_rod.ext}" "input_${rod_bind_name}_${rod_binding_names[$rod_bind_name]}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

45 #end if

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

46 #end for

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

47

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

48 #include source=$standard_gatk_options#

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

49

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

50 ##start analysis specific options

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

51 -p '

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

52 #if str( $annotations ) != "None":

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

53 #for $annotation in str( $annotations.fields.gatk_value ).split( ',' ):

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

54 --use_annotation "${annotation}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

55 #end for

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

56 #end if

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

57 #for $additional_annotation in $additional_annotations:

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

58 --use_annotation "${additional_annotation.additional_annotation_name}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

59 #end for

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

60 --mode "${mode}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

61 '

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

62

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

63 #if $analysis_param_type.analysis_param_type_selector == "advanced":

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

64 -p '

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

65 --maxGaussians "${analysis_param_type.max_gaussians}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

66 --maxIterations "${analysis_param_type.max_iterations}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

67 --numKMeans "${analysis_param_type.num_k_means}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

68 --stdThreshold "${analysis_param_type.std_threshold}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

69 --shrinkage "${analysis_param_type.shrinkage}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

70 --dirichlet "${analysis_param_type.dirichlet}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

71 --priorCounts "${analysis_param_type.prior_counts}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

72

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

73 --minNumBadVariants "${analysis_param_type.min_num_bad_variants}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

74

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

75 --target_titv "${analysis_param_type.target_titv}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

76 #for $tranche in [ $tranche.strip() for $tranche in str( $analysis_param_type.ts_tranche ).split( ',' ) if $tranche.strip() ]

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

77 --TStranche "${tranche}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

78 #end for

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

79 #for $ignore_filter in $analysis_param_type.ignore_filters:

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

80 #set $ignore_filter_name = str( $ignore_filter.ignore_filter_type.ignore_filter_type_selector )

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

81 #if $ignore_filter_name == "custom":

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

82 #set $ignore_filter_name = str( $ignore_filter.ignore_filter_type.filter_name )

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

83 #end if

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

84 --ignore_filter "${ignore_filter_name}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

85 #end for

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

86 '

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

87 #end if

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

88

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

89 &&

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

90 mv "${output_rscript}.pdf" "${output_tranches_pdf}"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

91

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

92 </command>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

93 <inputs>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

94 <conditional name="reference_source">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

95 <expand macro="reference_source_selector_param" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

96 <when value="cached">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

97 <expand macro="input_variants" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

98 <param name="ref_file" type="select" label="Using reference genome" help="-R,--reference_sequence &lt;reference_sequence&gt;">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

99 <options from_data_table="gatk2_picard_indexes">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

100

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

101 </options>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

102 <validator type="no_options" message="A built-in reference genome is not available for the build associated with the selected input file"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

103 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

104 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

105 <when value="history">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

106 <expand macro="input_variants" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

107 <param name="ref_file" type="data" format="fasta" label="Using reference file" help="-R,--reference_sequence &lt;reference_sequence&gt;" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

108 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

109 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

110

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

111 <repeat name="rod_bind" title="Binding for reference-ordered data" help="-resource,--resource &lt;resource&gt;" min="2">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

112 <conditional name="rod_bind_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

113 <param name="rod_bind_type_selector" type="select" label="Binding Type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

114 <option value="dbsnp" selected="True">dbSNP</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

115 <option value="variant">Variants</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

116 <option value="snps">SNPs</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

117 <option value="indels">INDELs</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

118 <option value="hapmap">HapMap</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

119 <option value="omni">OMNI</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

120 <option value="mask">Mask</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

121 <option value="custom">Custom</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

122 <option value="comp">Comp</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

123 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

124 <when value="variant">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

125 <param name="input_rod" type="data" format="vcf" label="Variant ROD file" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

126 <conditional name="rod_training_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

127 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

128 <option value="is_training_truth_known">Set training/truth/known sites</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

129 <option value="not_training_truth_known" selected="True">Don't Set options</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

130 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

131 <when value="not_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

132

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

133 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

134 <when value="is_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

135 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

136 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

137 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

138 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

139 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

140 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

141 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

142 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

143 <when value="comp">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

144 <param name="input_rod" type="data" format="vcf" label="ROD file" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

145 <param name="custom_rod_name" type="text" value="Unnamed" label="ROD Name"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

146 <conditional name="rod_training_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

147 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

148 <option value="is_training_truth_known">Set training/truth/known sites</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

149 <option value="not_training_truth_known" selected="True">Don't Set options</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

150 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

151 <when value="not_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

152

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

153 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

154 <when value="is_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

155 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

156 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

157 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

158 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

159 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

160 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

161 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

162 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

163 <when value="mask">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

164 <param name="input_rod" type="data" format="vcf" label="ROD file" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

165 <conditional name="rod_training_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

166 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

167 <option value="is_training_truth_known">Set training/truth/known sites</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

168 <option value="not_training_truth_known" selected="True">Don't Set options</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

169 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

170 <when value="not_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

171

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

172 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

173 <when value="is_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

174 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

175 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

176 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

177 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

178 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

179 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

180 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

181 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

182 <when value="dbsnp">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

183 <param name="input_rod" type="data" format="vcf" label="ROD file" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

184 <conditional name="rod_training_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

185 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

186 <option value="is_training_truth_known">Set training/truth/known sites</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

187 <option value="not_training_truth_known" selected="True">Don't Set options</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

188 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

189 <when value="not_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

190

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

191 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

192 <when value="is_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

193 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

194 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

195 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

196 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

197 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

198 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

199 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

200 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

201 <when value="snps">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

202 <param name="input_rod" type="data" format="vcf" label="ROD file" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

203 <conditional name="rod_training_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

204 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

205 <option value="is_training_truth_known">Set training/truth/known sites</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

206 <option value="not_training_truth_known" selected="True">Don't Set options</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

207 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

208 <when value="not_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

209

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

210 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

211 <when value="is_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

212 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

213 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

214 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

215 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

216 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

217 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

218 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

219 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

220 <when value="hapmap">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

221 <param name="input_rod" type="data" format="vcf" label="ROD file" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

222 <conditional name="rod_training_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

223 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

224 <option value="is_training_truth_known">Set training/truth/known sites</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

225 <option value="not_training_truth_known" selected="True">Don't Set options</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

226 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

227 <when value="not_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

228

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

229 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

230 <when value="is_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

231 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

232 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

233 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

234 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

235 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

236 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

237 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

238 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

239 <when value="omni">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

240 <param name="input_rod" type="data" format="vcf" label="ROD file" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

241 <conditional name="rod_training_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

242 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

243 <option value="is_training_truth_known">Set training/truth/known sites</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

244 <option value="not_training_truth_known" selected="True">Don't Set options</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

245 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

246 <when value="not_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

247

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

248 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

249 <when value="is_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

250 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

251 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

252 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

253 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

254 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

255 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

256 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

257 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

258 <when value="indels">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

259 <param name="input_rod" type="data" format="vcf" label="ROD file" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

260 <conditional name="rod_training_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

261 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

262 <option value="is_training_truth_known">Set training/truth/known sites</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

263 <option value="not_training_truth_known" selected="True">Don't Set options</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

264 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

265 <when value="not_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

266

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

267 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

268 <when value="is_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

269 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

270 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

271 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

272 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

273 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

274 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

275 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

276 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

277 <when value="custom">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

278 <param name="custom_rod_name" type="text" value="Unknown" label="ROD Name"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

279 <param name="input_rod" type="data" format="vcf" label="ROD file" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

280 <conditional name="rod_training_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

281 <param name="rod_training_type_selector" type="select" label="Use as training/truth/known sites">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

282 <option value="is_training_truth_known">Set training/truth/known sites</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

283 <option value="not_training_truth_known" selected="True">Don't Set options</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

284 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

285 <when value="not_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

286

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

287 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

288 <when value="is_training_truth_known">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

289 <param name="known" type="boolean" label="Is Known Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

290 <param name="training" type="boolean" label="Is Training Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

291 <param name="truth" type="boolean" label="Is Truth Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

292 <param name="bad" type="boolean" label="Is Bad Site" truevalue="true" falsevalue="false"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

293 <param name="prior" type="float" label="prior probability of being true" value="12.0"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

294 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

295 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

296 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

297 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

298 </repeat>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

299

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

300 <param name="annotations" type="select" multiple="True" display="checkboxes" label="annotations which should used for calculations" help="-an,--use_annotation &lt;use_annotation&gt;">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

301

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

302 <options from_data_table="gatk2_annotations">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

303 <filter type="multiple_splitter" column="tools_valid_for" separator=","/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

304 <filter type="static_value" value="VariantRecalibrator" column="tools_valid_for"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

305 </options>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

306 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

307

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

308 <repeat name="additional_annotations" title="Additional annotation" help="-an,--use_annotation &lt;use_annotation&gt;">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

309 <param name="additional_annotation_name" type="text" value="" label="Annotation name" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

310 </repeat>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

311

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

312 <param name="mode" type="select" label="Recalibration mode" help="-mode,--mode &lt;mode&gt;">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

313 <option value="SNP" selected="True">SNP</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

314 <option value="INDEL">INDEL</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

315 <option value="BOTH">BOTH</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

316 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

317

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

318 <expand macro="gatk_param_type_conditional" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

319

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

320 <expand macro="analysis_type_conditional">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

321 <param name="max_gaussians" type="integer" label="maximum number of Gaussians to try during variational Bayes Algorithm" value="8" help="-mG,--maxGaussians &lt;maxGaussians&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

322 <param name="max_iterations" type="integer" label="maximum number of maximum number of VBEM iterations to be performed in variational Bayes Algorithm" value="150" help="-mI,--maxIterations &lt;maxIterations&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

323 <param name="num_k_means" type="integer" label="number of k-means iterations to perform in order to initialize the means of the Gaussians in the Gaussian mixture model" value="100" help="-nKM,--numKMeans &lt;numKMeans&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

324 <param name="std_threshold" type="float" label="If a variant has annotations more than -std standard deviations away from mean then don't use it for building the Gaussian mixture model." value="10.0" help="-std,--stdThreshold &lt;stdThreshold&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

325 <param name="shrinkage" type="float" label="shrinkage parameter in variational Bayes algorithm" value="1.0" help="-shrinkage,--shrinkage &lt;shrinkage&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

326 <param name="dirichlet" type="float" label="dirichlet parameter in variational Bayes algorithm" value="0.001" help="-dirichlet,--dirichlet &lt;dirichlet&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

327 <param name="prior_counts" type="float" label="number of prior counts to use in variational Bayes algorithm" value="20.0" help="-priorCounts,--priorCounts &lt;priorCounts&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

328 <!--<param name="trustAllPolymorphic" type="boolean" label="trustAllPolymorphic" truevalue="-/-trustAllPolymorphic=true" falsevalue="-/-trustAllPolymorphic=false"

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

329 help="Trust that all the input training sets' unfiltered records contain only polymorphic sites to drastically speed up the computation. -trustAllPolymorphic" />-->

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

330 <param name="min_num_bad_variants" type="integer" label="Minimum number of worst scoring variants to use when building the Gaussian mixture model of bad variants" value="1000" help="--minNumBadVariants &lt;minNumBadVariants&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

331 <param name="target_titv" type="float" label="expected novel Ti/Tv ratio to use when calculating FDR tranches and for display on optimization curve output figures. (approx 2.15 for whole genome experiments). ONLY USED FOR PLOTTING PURPOSES!" value="2.15" help="-titv,--target_titv &lt;target_titv&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

332 <param name="ts_tranche" type="text" label="levels of novel false discovery rate (FDR, implied by ti/tv) at which to slice the data. (in percent, that is 1.0 for 1 percent)" value="100.0, 99.9, 99.0, 90.0" help="-tranche,--TStranche &lt;TStranche&gt;"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

333 <repeat name="ignore_filters" title="Ignore Filter" help="-ignoreFilter,--ignore_filter &lt;ignore_filter&gt;">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

334 <conditional name="ignore_filter_type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

335 <param name="ignore_filter_type_selector" type="select" label="Filter Type">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

336 <option value="HARD_TO_VALIDATE">HARD_TO_VALIDATE</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

337 <option value="LowQual" >LowQual</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

338 <option value="custom" selected="True">Other</option>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

339 </param>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

340 <when value="custom">

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

341 <param name="filter_name" type="text" value="" label="Filter name"/>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

342 </when>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

343 <when value="HARD_TO_VALIDATE" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

344 <when value="LowQual" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

345 </conditional>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

346 </repeat>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

347 </expand>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

348 </inputs>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

349 <outputs>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

350 <data format="gatk_recal" name="output_recal" label="${tool.name} on ${on_string} (Recalibration File)" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

351 <data format="gatk_tranche" name="output_tranches" label="${tool.name} on ${on_string} (Tranches File)" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

352 <data format="txt" name="output_rscript" label="${tool.name} on ${on_string} (RScript File)" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

353 <data format="pdf" name="output_tranches_pdf" label="${tool.name} on ${on_string} (PDF File)" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

354 <data format="txt" name="output_log" label="${tool.name} on ${on_string} (log)" />

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

355 </outputs>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

356 <tests>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

357

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

358 </tests>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

359 <help>

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

360 **What it does**

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

361

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

362 Takes variant calls as .vcf files, learns a Gaussian mixture model over the variant annotations and evaluates the variant -- assigning an informative lod score

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

363

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

364 For more information on using the VariantRecalibrator module, see this `tool specific page <http://www.broadinstitute.org/gatk/gatkdocs/org_broadinstitute_sting_gatk_walkers_variantrecalibration_VariantRecalibrator.html>`_.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

365

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

366 To learn about best practices for variant detection using GATK, see this `overview <http://www.broadinstitute.org/gatk/guide/topic?name=best-practices>`_.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

367

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

368 If you encounter errors, please view the `GATK FAQ <http://www.broadinstitute.org/gatk/guide/topic?name=faqs>`_.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

369

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

370 ------

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

371

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

372 **Inputs**

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

373

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

374 GenomeAnalysisTK: VariantRecalibrator accepts a variant input file.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

375

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

376

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

377 **Outputs**

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

378

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

379 The output is in VCF format.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

380

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

381

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

382 Go `here <http://www.broadinstitute.org/gatk/guide/topic?name=intro>`_ for details on GATK file formats.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

383

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

384 -------

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

385

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

386 **Settings**::

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

387

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

388

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

389 tranches_file The output tranches file used by ApplyRecalibration

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

390 use_annotation The names of the annotations which should used for calculations

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

391 mode Recalibration mode to employ: 1.) SNP for recalibrating only snps (emitting indels untouched in the output VCF); 2.) INDEL for indels; and 3.) BOTH for recalibrating both snps and indels simultaneously. (SNP|INDEL|BOTH)

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

392 maxGaussians The maximum number of Gaussians to try during variational Bayes algorithm

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

393 maxIterations The maximum number of VBEM iterations to be performed in variational Bayes algorithm. Procedure will normally end when convergence is detected.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

394 numKMeans The number of k-means iterations to perform in order to initialize the means of the Gaussians in the Gaussian mixture model.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

395 stdThreshold If a variant has annotations more than -std standard deviations away from mean then don't use it for building the Gaussian mixture model.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

396 shrinkage The shrinkage parameter in variational Bayes algorithm.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

397 dirichlet The dirichlet parameter in variational Bayes algorithm.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

398 priorCounts The number of prior counts to use in variational Bayes algorithm.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

399 minNumBadVariants The minimum amount of worst scoring variants to use when building the Gaussian mixture model of bad variants.

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

400 recal_file The output recal file used by ApplyRecalibration

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

401 target_titv The expected novel Ti/Tv ratio to use when calculating FDR tranches and for display on optimization curve output figures. (approx 2.15 for whole genome experiments). ONLY USED FOR PLOTTING PURPOSES!

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

402 TStranche The levels of novel false discovery rate (FDR, implied by ti/tv) at which to slice the data. (in percent, that is 1.0 for 1 percent)

01ff8dd37d4d Uploaded

lz_hust

parents:

diff changeset

403 ignore_filter If specified the optimizer will use variants even if the specified filter name is marked in the input VCF file

01ff8dd37d4d Uploaded

lz_hust