qiime2_suite: qiime2/qiime_feature-classifier_classify-hybrid-vsearch-sklearn.xml annotate

author	florianbegusch
date	Fri, 04 Sep 2020 13:12:49 +0000
parents
children

rev	line source
29 3ba9833030c1 Uploaded florianbegusch parents: diff changeset	1 <?xml version="1.0" ?>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	2 <tool id="qiime_feature-classifier_classify-hybrid-vsearch-sklearn" name="qiime feature-classifier classify-hybrid-vsearch-sklearn"
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	3 version="2020.8">
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	4 <description> ALPHA Hybrid classifier: VSEARCH exact match + sklearn classifier</description>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	5 <requirements>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	6 <requirement type="package" version="2020.8">qiime2</requirement>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	7 </requirements>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	8 <command><![CDATA[
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	9 qiime feature-classifier classify-hybrid-vsearch-sklearn
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	10
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	11 --i-query=$iquery
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	12
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	13 --i-reference-reads=$ireferencereads
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	14
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	15 --i-reference-taxonomy=$ireferencetaxonomy
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	16
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	17 --i-classifier=$iclassifier
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	18
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	19 #if str($pmaxaccepts) != 'None':
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	20 --p-maxaccepts=$pmaxaccepts
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	21 #end if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	22
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	23 --p-perc-identity=$ppercidentity
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	24
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	25 --p-query-cov=$pquerycov
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	26
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	27 #if str($pstrand) != 'None':
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	28 --p-strand=$pstrand
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	29 #end if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	30
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	31 --p-min-consensus=$pminconsensus
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	32
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	33 #if str($pmaxhits) != 'None':
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	34 --p-maxhits=$pmaxhits
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	35 #end if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	36
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	37 #if str($pmaxrejects) != 'None':
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	38 --p-maxrejects=$pmaxrejects
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	39 #end if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	40
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	41 #if str($pconfidence) != 'None':
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	42 --p-confidence=$pconfidence
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	43 #end if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	44
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	45 #if str($preadorientation) != 'None':
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	46 --p-read-orientation=$preadorientation
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	47 #end if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	48
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	49 --p-threads=$pthreads
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	50
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	51 #if $pnoprefilter:
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	52 --p-no-prefilter
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	53 #end if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	54
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	55 --p-sample-size=$psamplesize
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	56
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	57 --p-randseed=$prandseed
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	58
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	59 --o-classification=oclassification
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	60
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	61 #if str($examples) != 'None':
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	62 --examples=$examples
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	63 #end if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	64
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	65 ;
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	66 cp oclassification.qza $oclassification
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	67
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	68 ]]></command>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	69 <inputs>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	70 <param format="qza,no_unzip.zip" label="--i-query: ARTIFACT FeatureData[Sequence] Sequences to classify taxonomically. [required]" name="iquery" optional="False" type="data" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	71 <param format="qza,no_unzip.zip" label="--i-reference-reads: ARTIFACT FeatureData[Sequence] reference sequences. [required]" name="ireferencereads" optional="False" type="data" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	72 <param format="qza,no_unzip.zip" label="--i-reference-taxonomy: ARTIFACT FeatureData[Taxonomy] reference taxonomy labels. [required]" name="ireferencetaxonomy" optional="False" type="data" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	73 <param format="qza,no_unzip.zip" label="--i-classifier: ARTIFACT TaxonomicClassifier Pre-trained sklearn taxonomic classifier for classifying the reads. [required]" name="iclassifier" optional="False" type="data" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	74 <param label="--p-maxaccepts: " name="pmaxaccepts" optional="True" type="select">
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	75 <option selected="True" value="None">Selection is Optional</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	76 <option value="Int % Range(1">Int % Range(1</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	77 <option value="None">None</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	78 </param>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	79 <param exclude_max="False" label="--p-perc-identity: PROPORTION Range(0.0, 1.0, inclusive_end=True) Percent sequence similarity to use for PREFILTER. Reject match if percent identity to query is lower. Set to a lower value to perform a rough pre-filter. This parameter is ignored if `prefilter` is disabled. [default: 0.5]" max="1.0" min="0.0" name="ppercidentity" optional="True" type="float" value="0.5" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	80 <param exclude_max="False" label="--p-query-cov: PROPORTION Range(0.0, 1.0, inclusive_end=True) Query coverage threshold to use for PREFILTER. Reject match if query alignment coverage per high-scoring pair is lower. Set to a lower value to perform a rough pre-filter. This parameter is ignored if `prefilter` is disabled. [default: 0.8]" max="1.0" min="0.0" name="pquerycov" optional="True" type="float" value="0.8" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	81 <param label="--p-strand: " name="pstrand" optional="True" type="select">
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	82 <option selected="True" value="None">Selection is Optional</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	83 <option value="both">both</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	84 <option value="plus">plus</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	85 </param>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	86 <param exclude_max="False" exclude_min="True" label="--p-min-consensus: NUMBER Range(0.5, 1.0, inclusive_start=False, inclusive_end=True) Minimum fraction of assignments must match top hit to be accepted as consensus assignment. [default: 0.51]" max="1.0" min="0.5" name="pminconsensus" optional="True" type="float" value="0.51" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	87 <param label="--p-maxhits: " name="pmaxhits" optional="True" type="select">
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	88 <option selected="True" value="None">Selection is Optional</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	89 <option value="Int % Range(1">Int % Range(1</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	90 <option value="None">None</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	91 </param>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	92 <param label="--p-maxrejects: " name="pmaxrejects" optional="True" type="select">
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	93 <option selected="True" value="None">Selection is Optional</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	94 <option value="Int % Range(1">Int % Range(1</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	95 <option value="None">None</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	96 </param>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	97 <param label="--p-confidence: " name="pconfidence" optional="True" type="select">
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	98 <option selected="True" value="None">Selection is Optional</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	99 <option value="Float % Range(0">Float % Range(0</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	100 <option value="1">1</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	101 <option value="inclusive_end=True">inclusive_end=True</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	102 </param>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	103 <param label="--p-read-orientation: " name="preadorientation" optional="True" type="select">
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	104 <option selected="True" value="None">Selection is Optional</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	105 <option value="same">same</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	106 <option value="reverse-complement">reverse-complement</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	107 <option value="auto">auto</option>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	108 </param>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	109 <param label="--p-no-prefilter: Do not toggle positive filter of query sequences on or off. [default: True]" name="pnoprefilter" selected="False" type="boolean" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	110 <param label="--p-sample-size: INTEGER Range(1, None) Randomly extract the given number of sequences from the reference database to use for prefiltering. This parameter is ignored if `prefilter` is disabled. [default: 1000]" min="1" name="psamplesize" optional="True" type="integer" value="1000" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	111 <param label="--p-randseed: INTEGER Use integer as a seed for the pseudo-random generator Range(0, None) used during prefiltering. A given seed always produces the same output, which is useful for replicability. Set to 0 to use a pseudo-random seed. This parameter is ignored if `prefilter` is disabled. [default: 0]" min="0" name="prandseed" optional="True" type="integer" value="0" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	112 <param label="--examples: Show usage examples and exit." name="examples" optional="False" type="data" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	113
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	114 </inputs>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	115
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	116 <outputs>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	117 <data format="qza" label="${tool.name} on ${on_string}: classification.qza" name="oclassification" />
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	118
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	119 </outputs>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	120
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	121 <help><![CDATA[
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	122 ALPHA Hybrid classifier: VSEARCH exact match + sklearn classifier
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	123 ###############################################################
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	124
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	125 NOTE: THIS PIPELINE IS AN ALPHA RELEASE. Please report bugs to
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	126 https://forum.qiime2.org! Assign taxonomy to query sequences using hybrid
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	127 classifier. First performs rough positive filter to remove artifact and
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	128 low-coverage sequences (use "prefilter" parameter to toggle this step on or
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	129 off). Second, performs VSEARCH exact match between query and
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	130 reference_reads to find exact matches, followed by least common ancestor
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	131 consensus taxonomy assignment from among maxaccepts top hits, min_consensus
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	132 of which share that taxonomic assignment. Query sequences without an exact
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	133 match are then classified with a pre-trained sklearn taxonomy classifier to
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	134 predict the most likely taxonomic lineage.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	135
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	136 Parameters
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	137 ----------
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	138 query : FeatureData[Sequence]
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	139 Sequences to classify taxonomically.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	140 reference_reads : FeatureData[Sequence]
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	141 reference sequences.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	142 reference_taxonomy : FeatureData[Taxonomy]
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	143 reference taxonomy labels.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	144 classifier : TaxonomicClassifier
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	145 Pre-trained sklearn taxonomic classifier for classifying the reads.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	146 maxaccepts : Int % Range(1, None) \| Str % Choices('all'), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	147 Maximum number of hits to keep for each query. Set to "all" to keep all
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	148 hits > perc_identity similarity. Note that if strand=both, maxaccepts
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	149 will keep N hits for each direction (if searches in the opposite
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	150 direction yield results that exceed the minimum perc_identity). In
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	151 those cases use maxhits to control the total number of hits returned.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	152 This option works in pair with maxrejects. The search process sorts
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	153 target sequences by decreasing number of k-mers they have in common
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	154 with the query sequence, using that information as a proxy for sequence
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	155 similarity. After pairwise alignments, if the first target sequence
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	156 passes the acceptation criteria, it is accepted as best hit and the
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	157 search process stops for that query. If maxaccepts is set to a higher
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	158 value, more hits are accepted. If maxaccepts and maxrejects are both
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	159 set to "all", the complete database is searched.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	160 perc_identity : Float % Range(0.0, 1.0, inclusive_end=True), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	161 Percent sequence similarity to use for PREFILTER. Reject match if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	162 percent identity to query is lower. Set to a lower value to perform a
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	163 rough pre-filter. This parameter is ignored if `prefilter` is disabled.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	164 query_cov : Float % Range(0.0, 1.0, inclusive_end=True), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	165 Query coverage threshold to use for PREFILTER. Reject match if query
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	166 alignment coverage per high-scoring pair is lower. Set to a lower value
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	167 to perform a rough pre-filter. This parameter is ignored if `prefilter`
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	168 is disabled.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	169 strand : Str % Choices('both', 'plus'), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	170 Align against reference sequences in forward ("plus") or both
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	171 directions ("both").
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	172 min_consensus : Float % Range(0.5, 1.0, inclusive_start=False, inclusive_end=True), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	173 Minimum fraction of assignments must match top hit to be accepted as
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	174 consensus assignment.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	175 maxhits : Int % Range(1, None) \| Str % Choices('all'), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	176 maxrejects : Int % Range(1, None) \| Str % Choices('all'), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	177 reads_per_batch : Int % Range(0, None), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	178 Number of reads to process in each batch for sklearn classification. If
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	179 "auto", this parameter is autoscaled to min(number of query sequences /
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	180 threads, 20000).
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	181 confidence : Float % Range(0, 1, inclusive_end=True) \| Str % Choices('disable'), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	182 Confidence threshold for limiting taxonomic depth. Set to "disable" to
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	183 disable confidence calculation, or 0 to calculate confidence but not
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	184 apply it to limit the taxonomic depth of the assignments.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	185 read_orientation : Str % Choices('same', 'reverse-complement', 'auto'), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	186 Direction of reads with respect to reference sequences in pre-trained
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	187 sklearn classifier. same will cause reads to be classified unchanged;
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	188 reverse-complement will cause reads to be reversed and complemented
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	189 prior to classification. "auto" will autodetect orientation based on
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	190 the confidence estimates for the first 100 reads.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	191 threads : Int % Range(1, None), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	192 Number of threads to use for job parallelization.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	193 prefilter : Bool, optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	194 Toggle positive filter of query sequences on or off.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	195 sample_size : Int % Range(1, None), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	196 Randomly extract the given number of sequences from the reference
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	197 database to use for prefiltering. This parameter is ignored if
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	198 `prefilter` is disabled.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	199 randseed : Int % Range(0, None), optional
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	200 Use integer as a seed for the pseudo-random generator used during
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	201 prefiltering. A given seed always produces the same output, which is
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	202 useful for replicability. Set to 0 to use a pseudo-random seed. This
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	203 parameter is ignored if `prefilter` is disabled.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	204
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	205 Returns
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	206 -------
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	207 classification : FeatureData[Taxonomy]
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	208 The resulting taxonomy classifications.
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	209 ]]></help>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	210 <macros>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	211 <import>qiime_citation.xml</import>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	212 </macros>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	213 <expand macro="qiime_citation"/>
3ba9833030c1 Uploaded florianbegusch parents: diff changeset	214 </tool>

29

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

1 <?xml version="1.0" ?>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

2 <tool id="qiime_feature-classifier_classify-hybrid-vsearch-sklearn" name="qiime feature-classifier classify-hybrid-vsearch-sklearn"

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

3 version="2020.8">

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

4 <description> ALPHA Hybrid classifier: VSEARCH exact match + sklearn classifier</description>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

5 <requirements>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

6 <requirement type="package" version="2020.8">qiime2</requirement>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

7 </requirements>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

8 <command><![CDATA[

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

9 qiime feature-classifier classify-hybrid-vsearch-sklearn

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

10

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

11 --i-query=$iquery

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

12

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

13 --i-reference-reads=$ireferencereads

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

14

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

15 --i-reference-taxonomy=$ireferencetaxonomy

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

16

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

17 --i-classifier=$iclassifier

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

18

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

19 #if str($pmaxaccepts) != 'None':

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

20 --p-maxaccepts=$pmaxaccepts

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

21 #end if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

22

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

23 --p-perc-identity=$ppercidentity

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

24

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

25 --p-query-cov=$pquerycov

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

26

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

27 #if str($pstrand) != 'None':

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

28 --p-strand=$pstrand

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

29 #end if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

30

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

31 --p-min-consensus=$pminconsensus

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

32

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

33 #if str($pmaxhits) != 'None':

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

34 --p-maxhits=$pmaxhits

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

35 #end if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

36

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

37 #if str($pmaxrejects) != 'None':

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

38 --p-maxrejects=$pmaxrejects

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

39 #end if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

40

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

41 #if str($pconfidence) != 'None':

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

42 --p-confidence=$pconfidence

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

43 #end if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

44

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

45 #if str($preadorientation) != 'None':

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

46 --p-read-orientation=$preadorientation

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

47 #end if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

48

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

49 --p-threads=$pthreads

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

50

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

51 #if $pnoprefilter:

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

52 --p-no-prefilter

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

53 #end if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

54

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

55 --p-sample-size=$psamplesize

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

56

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

57 --p-randseed=$prandseed

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

58

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

59 --o-classification=oclassification

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

60

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

61 #if str($examples) != 'None':

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

62 --examples=$examples

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

63 #end if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

64

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

65 ;

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

66 cp oclassification.qza $oclassification

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

67

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

68 ]]></command>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

69 <inputs>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

70 <param format="qza,no_unzip.zip" label="--i-query: ARTIFACT FeatureData[Sequence] Sequences to classify taxonomically. [required]" name="iquery" optional="False" type="data" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

71 <param format="qza,no_unzip.zip" label="--i-reference-reads: ARTIFACT FeatureData[Sequence] reference sequences. [required]" name="ireferencereads" optional="False" type="data" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

72 <param format="qza,no_unzip.zip" label="--i-reference-taxonomy: ARTIFACT FeatureData[Taxonomy] reference taxonomy labels. [required]" name="ireferencetaxonomy" optional="False" type="data" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

73 <param format="qza,no_unzip.zip" label="--i-classifier: ARTIFACT TaxonomicClassifier Pre-trained sklearn taxonomic classifier for classifying the reads. [required]" name="iclassifier" optional="False" type="data" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

74 <param label="--p-maxaccepts: " name="pmaxaccepts" optional="True" type="select">

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

75 <option selected="True" value="None">Selection is Optional</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

76 <option value="Int % Range(1">Int % Range(1</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

77 <option value="None">None</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

78 </param>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

79 <param exclude_max="False" label="--p-perc-identity: PROPORTION Range(0.0, 1.0, inclusive_end=True) Percent sequence similarity to use for PREFILTER. Reject match if percent identity to query is lower. Set to a lower value to perform a rough pre-filter. This parameter is ignored if `prefilter` is disabled. [default: 0.5]" max="1.0" min="0.0" name="ppercidentity" optional="True" type="float" value="0.5" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

80 <param exclude_max="False" label="--p-query-cov: PROPORTION Range(0.0, 1.0, inclusive_end=True) Query coverage threshold to use for PREFILTER. Reject match if query alignment coverage per high-scoring pair is lower. Set to a lower value to perform a rough pre-filter. This parameter is ignored if `prefilter` is disabled. [default: 0.8]" max="1.0" min="0.0" name="pquerycov" optional="True" type="float" value="0.8" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

81 <param label="--p-strand: " name="pstrand" optional="True" type="select">

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

82 <option selected="True" value="None">Selection is Optional</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

83 <option value="both">both</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

84 <option value="plus">plus</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

85 </param>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

86 <param exclude_max="False" exclude_min="True" label="--p-min-consensus: NUMBER Range(0.5, 1.0, inclusive_start=False, inclusive_end=True) Minimum fraction of assignments must match top hit to be accepted as consensus assignment. [default: 0.51]" max="1.0" min="0.5" name="pminconsensus" optional="True" type="float" value="0.51" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

87 <param label="--p-maxhits: " name="pmaxhits" optional="True" type="select">

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

88 <option selected="True" value="None">Selection is Optional</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

89 <option value="Int % Range(1">Int % Range(1</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

90 <option value="None">None</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

91 </param>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

92 <param label="--p-maxrejects: " name="pmaxrejects" optional="True" type="select">

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

93 <option selected="True" value="None">Selection is Optional</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

94 <option value="Int % Range(1">Int % Range(1</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

95 <option value="None">None</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

96 </param>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

97 <param label="--p-confidence: " name="pconfidence" optional="True" type="select">

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

98 <option selected="True" value="None">Selection is Optional</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

99 <option value="Float % Range(0">Float % Range(0</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

100 <option value="1">1</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

101 <option value="inclusive_end=True">inclusive_end=True</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

102 </param>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

103 <param label="--p-read-orientation: " name="preadorientation" optional="True" type="select">

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

104 <option selected="True" value="None">Selection is Optional</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

105 <option value="same">same</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

106 <option value="reverse-complement">reverse-complement</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

107 <option value="auto">auto</option>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

108 </param>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

109 <param label="--p-no-prefilter: Do not toggle positive filter of query sequences on or off. [default: True]" name="pnoprefilter" selected="False" type="boolean" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

110 <param label="--p-sample-size: INTEGER Range(1, None) Randomly extract the given number of sequences from the reference database to use for prefiltering. This parameter is ignored if `prefilter` is disabled. [default: 1000]" min="1" name="psamplesize" optional="True" type="integer" value="1000" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

111 <param label="--p-randseed: INTEGER Use integer as a seed for the pseudo-random generator Range(0, None) used during prefiltering. A given seed always produces the same output, which is useful for replicability. Set to 0 to use a pseudo-random seed. This parameter is ignored if `prefilter` is disabled. [default: 0]" min="0" name="prandseed" optional="True" type="integer" value="0" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

112 <param label="--examples: Show usage examples and exit." name="examples" optional="False" type="data" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

113

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

114 </inputs>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

115

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

116 <outputs>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

117 <data format="qza" label="${tool.name} on ${on_string}: classification.qza" name="oclassification" />

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

118

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

119 </outputs>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

120

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

121 <help><![CDATA[

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

122 ALPHA Hybrid classifier: VSEARCH exact match + sklearn classifier

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

123 ###############################################################

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

124

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

125 NOTE: THIS PIPELINE IS AN ALPHA RELEASE. Please report bugs to

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

126 https://forum.qiime2.org! Assign taxonomy to query sequences using hybrid

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

127 classifier. First performs rough positive filter to remove artifact and

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

128 low-coverage sequences (use "prefilter" parameter to toggle this step on or

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

129 off). Second, performs VSEARCH exact match between query and

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

130 reference_reads to find exact matches, followed by least common ancestor

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

131 consensus taxonomy assignment from among maxaccepts top hits, min_consensus

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

132 of which share that taxonomic assignment. Query sequences without an exact

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

133 match are then classified with a pre-trained sklearn taxonomy classifier to

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

134 predict the most likely taxonomic lineage.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

135

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

136 Parameters

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

137 ----------

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

138 query : FeatureData[Sequence]

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

139 Sequences to classify taxonomically.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

140 reference_reads : FeatureData[Sequence]

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

141 reference sequences.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

142 reference_taxonomy : FeatureData[Taxonomy]

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

143 reference taxonomy labels.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

144 classifier : TaxonomicClassifier

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

145 Pre-trained sklearn taxonomic classifier for classifying the reads.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

146 maxaccepts : Int % Range(1, None) | Str % Choices('all'), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

147 Maximum number of hits to keep for each query. Set to "all" to keep all

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

148 hits > perc_identity similarity. Note that if strand=both, maxaccepts

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

149 will keep N hits for each direction (if searches in the opposite

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

150 direction yield results that exceed the minimum perc_identity). In

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

151 those cases use maxhits to control the total number of hits returned.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

152 This option works in pair with maxrejects. The search process sorts

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

153 target sequences by decreasing number of k-mers they have in common

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

154 with the query sequence, using that information as a proxy for sequence

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

155 similarity. After pairwise alignments, if the first target sequence

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

156 passes the acceptation criteria, it is accepted as best hit and the

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

157 search process stops for that query. If maxaccepts is set to a higher

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

158 value, more hits are accepted. If maxaccepts and maxrejects are both

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

159 set to "all", the complete database is searched.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

160 perc_identity : Float % Range(0.0, 1.0, inclusive_end=True), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

161 Percent sequence similarity to use for PREFILTER. Reject match if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

162 percent identity to query is lower. Set to a lower value to perform a

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

163 rough pre-filter. This parameter is ignored if `prefilter` is disabled.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

164 query_cov : Float % Range(0.0, 1.0, inclusive_end=True), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

165 Query coverage threshold to use for PREFILTER. Reject match if query

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

166 alignment coverage per high-scoring pair is lower. Set to a lower value

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

167 to perform a rough pre-filter. This parameter is ignored if `prefilter`

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

168 is disabled.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

169 strand : Str % Choices('both', 'plus'), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

170 Align against reference sequences in forward ("plus") or both

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

171 directions ("both").

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

172 min_consensus : Float % Range(0.5, 1.0, inclusive_start=False, inclusive_end=True), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

173 Minimum fraction of assignments must match top hit to be accepted as

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

174 consensus assignment.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

175 maxhits : Int % Range(1, None) | Str % Choices('all'), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

176 maxrejects : Int % Range(1, None) | Str % Choices('all'), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

177 reads_per_batch : Int % Range(0, None), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

178 Number of reads to process in each batch for sklearn classification. If

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

179 "auto", this parameter is autoscaled to min(number of query sequences /

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

180 threads, 20000).

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

181 confidence : Float % Range(0, 1, inclusive_end=True) | Str % Choices('disable'), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

182 Confidence threshold for limiting taxonomic depth. Set to "disable" to

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

183 disable confidence calculation, or 0 to calculate confidence but not

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

184 apply it to limit the taxonomic depth of the assignments.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

185 read_orientation : Str % Choices('same', 'reverse-complement', 'auto'), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

186 Direction of reads with respect to reference sequences in pre-trained

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

187 sklearn classifier. same will cause reads to be classified unchanged;

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

188 reverse-complement will cause reads to be reversed and complemented

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

189 prior to classification. "auto" will autodetect orientation based on

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

190 the confidence estimates for the first 100 reads.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

191 threads : Int % Range(1, None), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

192 Number of threads to use for job parallelization.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

193 prefilter : Bool, optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

194 Toggle positive filter of query sequences on or off.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

195 sample_size : Int % Range(1, None), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

196 Randomly extract the given number of sequences from the reference

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

197 database to use for prefiltering. This parameter is ignored if

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

198 `prefilter` is disabled.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

199 randseed : Int % Range(0, None), optional

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

200 Use integer as a seed for the pseudo-random generator used during

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

201 prefiltering. A given seed always produces the same output, which is

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

202 useful for replicability. Set to 0 to use a pseudo-random seed. This

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

203 parameter is ignored if `prefilter` is disabled.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

204

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

205 Returns

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

206 -------

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

207 classification : FeatureData[Taxonomy]

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

208 The resulting taxonomy classifications.

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

209 ]]></help>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

210 <macros>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

211 <import>qiime_citation.xml</import>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

212 </macros>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

213 <expand macro="qiime_citation"/>

3ba9833030c1 Uploaded

florianbegusch

parents:

diff changeset

214 </tool>

Mercurial > repos > florianbegusch > qiime2_suite

annotate qiime2/qiime_feature-classifier_classify-hybrid-vsearch-sklearn.xml @ 29:3ba9833030c1 draft