qiime2_suite: qiime2/qiime_sample-classifier

annotate qiime2/qiime_sample-classifier_maturity-index.xml @ 0:370e0b6e9826 draft

Uploaded

author	florianbegusch
date	Wed, 17 Jul 2019 03:05:17 -0400
parents
children	255f48db74f8

rev	line source
0 370e0b6e9826 Uploaded florianbegusch parents: diff changeset	1 <?xml version="1.0" ?>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	2 <tool id="qiime_sample-classifier_maturity-index" name="qiime sample-classifier maturity-index" version="2019.4">
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	3 <description> - Microbial maturity index prediction.</description>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	4 <requirements>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	5 <requirement type="package" version="2019.4">qiime2</requirement>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	6 </requirements>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	7 <command>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	8 <![CDATA[
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	9 qiime sample-classifier maturity-index --i-table=$itable
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	10
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	11 #def list_dict_to_string(list_dict):
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	12 #set $file_list = list_dict[0]['additional_input'].__getattr__('file_name')
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	13 #for d in list_dict[1:]:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	14 #set $file_list = $file_list + ' --m-metadata-file=' + d['additional_input'].__getattr__('file_name')
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	15 #end for
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	16 #return $file_list
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	17 #end def
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	18
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	19 --m-metadata-file=$list_dict_to_string($input_files_mmetadatafile) --p-group-by="$pgroupby" --p-column="$pcolumn" --p-control="$pcontrol"
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	20
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	21 #set $pnjobs = '${GALAXY_SLOTS:-4}'
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	22
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	23 #if str($pnjobs):
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	24 --p-n-jobs="$pnjobs"
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	25 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	26
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	27
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	28 #if $pparametertuning:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	29 --p-parameter-tuning
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	30 #else
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	31 --p-no-parameter-tuning
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	32 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	33
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	34 #if $pstep:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	35 --p-step=$pstep
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	36 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	37
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	38 #if $pstratify:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	39 --p-stratify
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	40 #else
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	41 --p-no-stratify
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	42 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	43
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	44 #if $poptimizefeatureselection:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	45 --p-optimize-feature-selection
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	46 #else
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	47 --p-no-optimize-feature-selection
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	48 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	49
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	50 #if $ptestsize:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	51 --p-test-size=$ptestsize
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	52 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	53 --o-visualization=ovisualization
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	54 #if str($pestimator) != 'None':
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	55 --p-estimator=$pestimator
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	56 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	57
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	58 #if $pmazstats:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	59 --p-maz-stats
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	60 #else
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	61 --p-no-maz-stats
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	62 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	63
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	64 #if str($cmdconfig) != 'None':
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	65 --cmd-config=$cmdconfig
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	66 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	67
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	68 #if $pcv:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	69 --p-cv=$pcv
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	70 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	71
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	72 #if $pnestimators:
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	73 --p-n-estimators=$pnestimators
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	74 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	75
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	76 #if str($prandomstate):
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	77 --p-random-state="$prandomstate"
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	78 #end if
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	79 ;
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	80 qiime tools export ovisualization.qzv --output-dir out && mkdir -p '$ovisualization.files_path'
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	81 && cp -r out/* '$ovisualization.files_path'
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	82 && mv '$ovisualization.files_path/index.html' '$ovisualization'
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	83 ]]>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	84 </command>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	85 <inputs>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	86 <param format="qza,no_unzip.zip" label="--i-table: FeatureTable[Frequency] Feature table containing all features that should be used for target prediction. [required]" name="itable" optional="False" type="data"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	87
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	88 <repeat name="input_files_mmetadatafile" optional="False" title="--m-metadata-file">
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	89 <param label="--m-metadata-file: Metadata file or artifact viewable as metadata. This option may be supplied multiple times to merge metadata. [required]" name="additional_input" type="data" format="tabular,qza,no_unzip.zip" />
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	90 </repeat>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	91
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	92 <param label="--p-column: Numeric metadata column to use as prediction target. [required]" name="pcolumn" optional="False" type="text"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	93
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	94 <param label="--p-group-by: Categorical metadata column to use for plotting and significance testing between main treatment groups. [required]" name="pgroupby" optional="False" type="text"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	95 <param label="--p-control: Value of group_by to use as control group. The regression model will be trained using only control group data, and the maturity scores of other groups consequently will be assessed relative to this group. [required]" name="pcontrol" optional="False" type="text"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	96
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	97 <param label="--p-estimator: Regression model to use for prediction.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	98 [default: RandomForestRegressor]" name="pestimator" optional="True" type="select">
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	99 <option selected="True" value="None">Selection is Optional</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	100 <option value="Ridge">Ridge</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	101 <option value="RandomForestRegressor">RandomForestRegressor</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	102 <option value="GradientBoostingRegressor">GradientBoostingRegressor</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	103 <option value="ExtraTreesRegressor">ExtraTreesRegressor</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	104 <option value="SVR">SVR</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	105 <option value="ElasticNet">ElasticNet</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	106 <option value="Lasso">Lasso</option>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	107 </param>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	108 <param label="--p-n-estimators: Number of trees to grow for estimation. More trees will improve predictive accuracy up to a threshold level, but will also increase time and memory requirements. This parameter only affects ensemble estimators, such as Random Forest, AdaBoost, ExtraTrees, and GradientBoosting. [default: 100]" name="pnestimators" optional="True" type="integer" value="100"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	109
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	110 <param label="--p-test-size: Fraction of input samples to exclude from training set and use for classifier testing. [default: 0.2]" name="ptestsize" optional="True" type="float" value="0.2"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	111
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	112 <param label="--p-step: If optimize_feature_selection is True, step is the percentage of features to remove at each iteration. [default: 0.05]" name="pstep" optional="True" type="float" value="0.05"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	113
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	114 <param label="--p-cv: Number of k-fold cross-validations to perform. [default: 5]" name="pcv" optional="True" type="integer" value="5"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	115
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	116 <param label="--p-random-state: Seed used by random number generator. [optional]" name="prandomstate" optional="True" type="text"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	117
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	118 <param label="--p-parameter-tuning: --p-no-parameter-tuning Automatically tune hyperparameters using random grid search. [default: True]" name="pparametertuning" checked="True" type="boolean"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	119 <param label="--p-optimize-feature-selection: --p-no-optimize-feature-selection Automatically optimize input feature selection using recursive feature elimination. [default: True]" name="poptimizefeatureselection" checked="True" type="boolean"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	120
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	121 <param label="--p-stratify: --p-no-stratify Evenly stratify training and test data among metadata categories. If True, all values in column must match at least two samples. [default: False]" name="pstratify" checked="False" type="boolean"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	122
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	123 <param label="--p-maz-stats: --p-no-maz-stats Calculate anova and pairwise tests on MAZ scores. [default: True]" name="pmazstats" checked="True" type="boolean"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	124
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	125 <param label="--cmd-config: Use config file for command options" name="cmdconfig" optional="True" type="data"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	126 </inputs>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	127 <outputs>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	128 <data format="html" label="${tool.name} on ${on_string}: visualization.qzv" name="ovisualization"/>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	129 </outputs>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	130 <help>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	131 <![CDATA[
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	132 Microbial maturity index prediction.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	133 -------------------------------------
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	134
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	135 Calculates a "microbial maturity" index from a regression model trained on
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	136 feature data to predict a given continuous metadata column, e.g., to
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	137 predict age as a function of microbiota composition. The model is trained
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	138 on a subset of control group samples, then predicts the column value for
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	139 all samples. This visualization computes maturity index z-scores to compare
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	140 relative "maturity" between each group, as described in
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	141 doi:10.1038/nature13421. This method can be used to predict between-group
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	142 differences in relative trajectory across any type of continuous metadata
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	143 gradient, e.g., intestinal microbiome development by age, microbial
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	144 succession during wine fermentation, or microbial community differences
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	145 along environmental gradients, as a function of two or more different
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	146 "treatment" groups.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	147
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	148 Parameters
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	149 ----------
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	150 table : FeatureTable[Frequency]
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	151 Feature table containing all features that should be used for target
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	152 prediction.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	153 metadata : Metadata
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	154 \
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	155 column : Str
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	156 Numeric metadata column to use as prediction target.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	157 group_by : Str
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	158 Categorical metadata column to use for plotting and significance
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	159 testing between main treatment groups.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	160 control : Str
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	161 Value of group_by to use as control group. The regression model will be
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	162 trained using only control group data, and the maturity scores of other
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	163 groups consequently will be assessed relative to this group.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	164 estimator : Str % Choices({'ElasticNet', 'ExtraTreesRegressor', 'GradientBoostingRegressor', 'Lasso', 'RandomForestRegressor', 'Ridge', 'SVR'}), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	165 Regression model to use for prediction.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	166 n_estimators : Int % Range(1, None), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	167 Number of trees to grow for estimation. More trees will improve
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	168 predictive accuracy up to a threshold level, but will also increase
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	169 time and memory requirements. This parameter only affects ensemble
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	170 estimators, such as Random Forest, AdaBoost, ExtraTrees, and
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	171 GradientBoosting.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	172 test_size : Float % Range(0.0, 1.0, inclusive_start=False), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	173 Fraction of input samples to exclude from training set and use for
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	174 classifier testing.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	175 step : Float % Range(0.0, 1.0, inclusive_start=False), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	176 If optimize_feature_selection is True, step is the percentage of
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	177 features to remove at each iteration.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	178 cv : Int % Range(1, None), optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	179 Number of k-fold cross-validations to perform.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	180 random_state : Int, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	181 Seed used by random number generator.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	182 parameter_tuning : Bool, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	183 Automatically tune hyperparameters using random grid search.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	184 optimize_feature_selection : Bool, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	185 Automatically optimize input feature selection using recursive feature
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	186 elimination.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	187 stratify : Bool, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	188 Evenly stratify training and test data among metadata categories. If
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	189 True, all values in column must match at least two samples.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	190 maz_stats : Bool, optional
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	191 Calculate anova and pairwise tests on MAZ scores.
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	192
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	193 Returns
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	194 -------
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	195 visualization : Visualization
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	196 \
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	197 ]]>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	198 </help>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	199 <macros>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	200 <import>qiime_citation.xml</import>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	201 </macros>
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	202 <expand macro="qiime_citation" />
370e0b6e9826 Uploaded florianbegusch parents: diff changeset	203 </tool>

Mercurial > repos > florianbegusch > qiime2_suite

annotate qiime2/qiime_sample-classifier_maturity-index.xml @ 0:370e0b6e9826 draft