mafft: Mafft/mafft.xml annotate

author	basfplant
date	Tue, 05 Mar 2013 04:01:17 -0500
parents
children

rev	line source
0 e4d26cd8be10 Uploaded basfplant parents: diff changeset	1 <tool id="mafft" name="Mafft" version="1.0.0">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	2 <description>Multiple sequence Alignment using Fast Fourier Transform</description>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	3 <command>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	4 #if (str($advanced.select)=="proteins"):
e4d26cd8be10 Uploaded basfplant parents: diff changeset	5 #if($oformat.value=="clustal"):
e4d26cd8be10 Uploaded basfplant parents: diff changeset	6 $advanced.select_strategy
e4d26cd8be10 Uploaded basfplant parents: diff changeset	7 --clustalout
e4d26cd8be10 Uploaded basfplant parents: diff changeset	8 $advanced.matrixAA
e4d26cd8be10 Uploaded basfplant parents: diff changeset	9 --op $advanced.gap_open
e4d26cd8be10 Uploaded basfplant parents: diff changeset	10 --ep $advanced.offset
e4d26cd8be10 Uploaded basfplant parents: diff changeset	11 #else:
e4d26cd8be10 Uploaded basfplant parents: diff changeset	12 $advanced.select_strategy
e4d26cd8be10 Uploaded basfplant parents: diff changeset	13 $advanced.matrixAA
e4d26cd8be10 Uploaded basfplant parents: diff changeset	14 --op $advanced.gap_open
e4d26cd8be10 Uploaded basfplant parents: diff changeset	15 --ep $advanced.offset
e4d26cd8be10 Uploaded basfplant parents: diff changeset	16 #end if
e4d26cd8be10 Uploaded basfplant parents: diff changeset	17 #else if (str($advanced.select)=="nucleic"):
e4d26cd8be10 Uploaded basfplant parents: diff changeset	18 #if($oformat.value=="clustal"):
e4d26cd8be10 Uploaded basfplant parents: diff changeset	19 $advanced.select_strategy
e4d26cd8be10 Uploaded basfplant parents: diff changeset	20 --clustalout
e4d26cd8be10 Uploaded basfplant parents: diff changeset	21 $advanced.matrixNucl
e4d26cd8be10 Uploaded basfplant parents: diff changeset	22 --op $advanced.gap_open
e4d26cd8be10 Uploaded basfplant parents: diff changeset	23 --ep $advanced.offset
e4d26cd8be10 Uploaded basfplant parents: diff changeset	24 #else:
e4d26cd8be10 Uploaded basfplant parents: diff changeset	25 $advanced.select_strategy
e4d26cd8be10 Uploaded basfplant parents: diff changeset	26 $advanced.matrixNucl
e4d26cd8be10 Uploaded basfplant parents: diff changeset	27 --op $advanced.gap_open
e4d26cd8be10 Uploaded basfplant parents: diff changeset	28 --ep $advanced.offset
e4d26cd8be10 Uploaded basfplant parents: diff changeset	29 #end if
e4d26cd8be10 Uploaded basfplant parents: diff changeset	30 #else:
e4d26cd8be10 Uploaded basfplant parents: diff changeset	31 mafft --retree 2 --maxiterate 0 --quiet ##mafft-fftns2, the default strategy
e4d26cd8be10 Uploaded basfplant parents: diff changeset	32 #if ($oformat.value=="clustal"):
e4d26cd8be10 Uploaded basfplant parents: diff changeset	33 --clustalout
e4d26cd8be10 Uploaded basfplant parents: diff changeset	34 #end if
e4d26cd8be10 Uploaded basfplant parents: diff changeset	35 #if (str($inputtype.selectInput)=="proteins"):
e4d26cd8be10 Uploaded basfplant parents: diff changeset	36 --bl 62
e4d26cd8be10 Uploaded basfplant parents: diff changeset	37 #else:
e4d26cd8be10 Uploaded basfplant parents: diff changeset	38 --kimura 200
e4d26cd8be10 Uploaded basfplant parents: diff changeset	39 #end if
e4d26cd8be10 Uploaded basfplant parents: diff changeset	40 --op 1.530000 --ep 0.000000
e4d26cd8be10 Uploaded basfplant parents: diff changeset	41 #end if
e4d26cd8be10 Uploaded basfplant parents: diff changeset	42 $inputfile > $output 2> /dev/null
e4d26cd8be10 Uploaded basfplant parents: diff changeset	43 </command>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	44 <inputs>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	45 <conditional name="inputtype">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	46 <param name="selectInput" type="select" label="Select the type of sequences in your input file.">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	47 <option value="proteins" selected="True">protein input</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	48 <option value="nucleic">nucleic acid input</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	49 </param>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	50 <when value="proteins">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	51 </when>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	52 <when value="nucleic">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	53 </when>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	54 </conditional> ## end conditional input
e4d26cd8be10 Uploaded basfplant parents: diff changeset	55 <param name="inputfile" type="data" format="fasta" label="Unaligned fasta input sequences (proteins or nucleotides)" />
e4d26cd8be10 Uploaded basfplant parents: diff changeset	56 <param name="oformat" type="select" label="Output format" help="Please select an output format. Error: tree output generates alignement file instead of Newick file, also in the commandline.">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	57 <option value="fasta" selected="true">fasta</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	58 <option value="clustal">clustal</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	59 </param>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	60 <conditional name="advanced" help="if no advanced options default FFN-NS2 strategy is executed">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	61 <param name="select" type="select" label="Show advanced options">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	62 <option value="no" selected="True">No</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	63 <option value="proteins">for protein input files</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	64 <option value="nucleic">for nucleic acid input files</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	65 </param>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	66 <when value="no">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	67 </when>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	68 <when value="proteins">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	69 <param name="select_strategy" type="select" label="Strategy">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	70 <option value="mafft --quiet --auto" selected="true">Auto (FFT-NS-1, FFT-NS-2, FFT-NS-i or L-INS-i; depends on data size)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	71 <option value="mafft --quiet --retree 1 --maxiterate 0">FFT-NS-1 (Very fast, recommended for > 2.000 sequences; progressive method)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	72 <option value="mafft --retree 2 --maxiterate 0 --quiet">FFT-NS-2 (Fast, progressive method)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	73 <option value="mafft --retree 2 --maxiterate 2 --nofft --quiet">medium (Iterative refinement method, two cycles only)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	74 <option value="mafft --retree 2 --maxiterate 2 --quiet">FFT-NS-i (Slow, iterative refinement method)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	75 <option value="mafft --ep 0 --genafpair --maxiterate 1000 --quiet">E-INS-I (Very slow, recommended for < 2 sequences with multiple conserved domains and long gaps)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	76 <option value="mafft --localpair --maxiterate 1000 --quiet">L-INS-I (Very slow, recommended for < 200 sequences whith one conserved domain and long gaps)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	77 <option value="mafft --globalpair --maxiterate 1000 --quiet">G-INS-I (Very slow, recommended for < 200 sequences with global homology)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	78 <option value="mafft --quiet --retree 1 --maxiterate 0 --nofft --parttree">NW-NS-PartTree-1 (recommended for ~10,000 to ~50,000 sequences; progressive method with the PartTree algorithm)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	79 </param>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	80 <param name="matrixAA" type="select" label="Scoring matrix for amino acid sequences">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	81 <option value="--bl 30">BLOSUM30</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	82 <option value="--bl 45">BLOSUM45</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	83 <option value="--bl 62">BLOSUM62</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	84 <option value="--bl 80">BLOSUM80</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	85 <option value="--jtt 100">JTT100</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	86 <option value="--jtt 200">JTT200</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	87 </param>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	88 <param name="gap_open" label="Gap openingpenalty (5-200)" type="integer" value="50"/>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	89 <param name="offset" label="Offset value (0-1)" type="float" value="0.0"/>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	90 </when>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	91 <when value="nucleic">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	92 <param name="select_strategy" type="select" label="Strategy">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	93 <option value="mafft --quiet --auto" selected="true">Auto (FFT-NS-1, FFT-NS-2, FFT-NS-i or L-INS-i; depends on data size)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	94 <option value="mafft --quiet --retree 1 --maxiterate 0">FFT-NS-1 (Very fast, recommended for > 2.000 sequences; progressive method)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	95 <option value="mafft --retree 2 --maxiterate 0 --quiet">FFT-NS-2 (Fast, progressive method)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	96 <option value="mafft --retree 2 --maxiterate 2 --nofft --quiet">medium (Iterative refinement method, two cycles only)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	97 <option value="mafft --retree 2 --maxiterate 2 --quiet">FFT-NS-i (Slow, iterative refinement method)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	98 <option value="mafft --ep 0 --genafpair --maxiterate 1000 --quiet">E-INS-I (Very slow, recommended for < 2 sequences with multiple conserved domains and long gaps)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	99 <option value="mafft --localpair --maxiterate 1000 --quiet">L-INS-I (Very slow, recommended for < 200 sequences whith one conserved domain and long gaps)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	100 <option value="mafft --globalpair --maxiterate 1000 --quiet">C-INS-I (Very slow, recommended for < 200 sequences with global homology)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	101 <option value="mafft --quiet --retree 1 --maxiterate 0 --nofft --parttree">NW-NS-PartTree-1 (recommended for ~10,000 to ~50,000 sequences; progressive method with the PartTree algorithm)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	102 <option value="mafft-qinsi --quiet">Q-INS-I (Extremely slow; secondary structure of RNA is considered; recommended for a global alignment of highly divergent ncRNAs with < 200 sequences, < 1.000 nucleotides)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	103 <option value="mafft-xinsi --quiet">X-INS-I (Applicable to up to ~50 sequences to ~1,000 nucleotides. Multiple structural alignment by combining pairwise structural alignments given by an external program.)</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	104 </param>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	105 <param name="matrixNucl" type="select" label="Scoring matrix for nucleic acid sequences">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	106 <option value="--kimura 1">1PAM / kappa=2</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	107 <option value="--kimura 20">20PAM / kappa=2</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	108 <option value="--kimura 200">200PAM / kappa=2</option>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	109 </param>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	110 <param name="gap_open" label="Gap openingpenalty (5-200)" type="integer" value="50"/>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	111 <param name="offset" label="Offset value (0-1)" type="float" value="0.0"/>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	112 </when>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	113 </conditional> ## end conditional advanced
e4d26cd8be10 Uploaded basfplant parents: diff changeset	114 </inputs>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	115 <outputs>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	116 <data format="fasta" name="output">
e4d26cd8be10 Uploaded basfplant parents: diff changeset	117 <change_format>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	118 <when input="oformat" value="clustal" format="clustal"/>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	119 </change_format>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	120 </data>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	121 </outputs>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	122 <help>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	123 What it does
e4d26cd8be10 Uploaded basfplant parents: diff changeset	124 MAFFT is a multiple sequence alignment program for proteins and nucleotides using fast fourier transform.
e4d26cd8be10 Uploaded basfplant parents: diff changeset	125
e4d26cd8be10 Uploaded basfplant parents: diff changeset	126 If no advanced options are selected, the following default paramters will be used:
e4d26cd8be10 Uploaded basfplant parents: diff changeset	127 - for proteins: mafft-FFT-NS-2 method (Fast, progressive method), BLOSUM62 substitution matrix, gap opening penalty 1.53 and offset value 0.00
e4d26cd8be10 Uploaded basfplant parents: diff changeset	128
e4d26cd8be10 Uploaded basfplant parents: diff changeset	129 - for nucleic acids: mafft-FFT-NS-2 method (Fast, progressive method), 200PAM/kappa=2 substitution matrix, gap opening penalty 1.53 and offset value 0.00
e4d26cd8be10 Uploaded basfplant parents: diff changeset	130
e4d26cd8be10 Uploaded basfplant parents: diff changeset	131
e4d26cd8be10 Uploaded basfplant parents: diff changeset	132 MAFFT offers a range of multiple alignment methods, classified into three types, (a) the progressive method, (b) the iterative refinement method with the WSP score, and (c) the iterative refinment method using both the WSP and consistency scores. In general, there is a tradeoff between speed and accuracy. The order of speed is a > b > c, whereas the order of accuracy is a < b < c.
e4d26cd8be10 Uploaded basfplant parents: diff changeset	133
e4d26cd8be10 Uploaded basfplant parents: diff changeset	134 - Auto (FFT-NS-1, FFT-NS-2, FFT-NS-i or L-INS-i; depends on data size) (a,b or c)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	135
e4d26cd8be10 Uploaded basfplant parents: diff changeset	136 - FFT-NS-1 (Very fast, recommended for > 2.000 sequences; progressive method) (a)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	137
e4d26cd8be10 Uploaded basfplant parents: diff changeset	138 - FFT-NS-2 (Fast, progressive method) (DEFAULT if no advanced options) (a)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	139
e4d26cd8be10 Uploaded basfplant parents: diff changeset	140 - medium (Iterative refinement method, two cycles only) (b)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	141
e4d26cd8be10 Uploaded basfplant parents: diff changeset	142 - FFT-NS-i (Slow, iterative refinement method) (b)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	143
e4d26cd8be10 Uploaded basfplant parents: diff changeset	144 - E-INS-I (Very slow, recommended for < 2 sequences with multiple conserved domains and long gaps) (c)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	145
e4d26cd8be10 Uploaded basfplant parents: diff changeset	146 - L-INS-I (Very slow, recommended for < 200 sequences whith one conserved domain and long gaps) (c)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	147
e4d26cd8be10 Uploaded basfplant parents: diff changeset	148 - G-INS-I (Very slow, recommended for < 200 sequences with global homology) (c)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	149
e4d26cd8be10 Uploaded basfplant parents: diff changeset	150 - NW-NS-PartTree-1 (recommended for ~10,000 to ~50,000 sequences; progressive method with the PartTree algorithm) (a)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	151
e4d26cd8be10 Uploaded basfplant parents: diff changeset	152 For nucleotides only, there are still additional alignment methods:
e4d26cd8be10 Uploaded basfplant parents: diff changeset	153
e4d26cd8be10 Uploaded basfplant parents: diff changeset	154 - Q-INS-I (Extremely slow; secondary structure of RNA is considered; recommended for a global alignment of highly divergent ncRNAs with < 200 sequences, < 1.000 nucleotides)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	155
e4d26cd8be10 Uploaded basfplant parents: diff changeset	156 - X-INS-I (Applicable to up to ~50 sequences to ~1,000 nucleotides. Multiple structural alignment by combining pairwise structural alignments given by an external program.)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	157
e4d26cd8be10 Uploaded basfplant parents: diff changeset	158
e4d26cd8be10 Uploaded basfplant parents: diff changeset	159 Depending on the nature of the sequences in the input file, the advanced options change. When "for protein input files" is selected from the advanced options, BLOSUM or JTT substitution matrices can be chosen. The selection "for nucleic acid input files" only offers substitution matrices of the type PAM / kappa = x. For nucleic acids, two extra strategies are available compared to proteins, namely X-INS-i and Q-INS-i.
e4d26cd8be10 Uploaded basfplant parents: diff changeset	160
e4d26cd8be10 Uploaded basfplant parents: diff changeset	161 Documentation
e4d26cd8be10 Uploaded basfplant parents: diff changeset	162
e4d26cd8be10 Uploaded basfplant parents: diff changeset	163 Mafft website http://mafft.cbrc.jp/alignment/software/
e4d26cd8be10 Uploaded basfplant parents: diff changeset	164
e4d26cd8be10 Uploaded basfplant parents: diff changeset	165 Manpages of Mafft at http://mafft.cbrc.jp/alignment/software/manual/manual.html
e4d26cd8be10 Uploaded basfplant parents: diff changeset	166
e4d26cd8be10 Uploaded basfplant parents: diff changeset	167 More information about the algorithms can be found at http://mafft.cbrc.jp/alignment/software/algorithms/algorithms.html#GLE.
e4d26cd8be10 Uploaded basfplant parents: diff changeset	168
e4d26cd8be10 Uploaded basfplant parents: diff changeset	169
e4d26cd8be10 Uploaded basfplant parents: diff changeset	170 Author and affiliation
e4d26cd8be10 Uploaded basfplant parents: diff changeset	171
e4d26cd8be10 Uploaded basfplant parents: diff changeset	172
e4d26cd8be10 Uploaded basfplant parents: diff changeset	173 Katrien Bernaerts and Domantas Motiejunas, 21/06/2012
e4d26cd8be10 Uploaded basfplant parents: diff changeset	174
e4d26cd8be10 Uploaded basfplant parents: diff changeset	175 Corresponding author: domantas dot motiejunas at cropdesign dot com
e4d26cd8be10 Uploaded basfplant parents: diff changeset	176
e4d26cd8be10 Uploaded basfplant parents: diff changeset	177
e4d26cd8be10 Uploaded basfplant parents: diff changeset	178
e4d26cd8be10 Uploaded basfplant parents: diff changeset	179 Affiliation: CropDesign N.V., a BASF Plant Science Company - Technologiepark 3, 9052 Zwijnaarde - Belgium
e4d26cd8be10 Uploaded basfplant parents: diff changeset	180
e4d26cd8be10 Uploaded basfplant parents: diff changeset	181 Terms of use
e4d26cd8be10 Uploaded basfplant parents: diff changeset	182
e4d26cd8be10 Uploaded basfplant parents: diff changeset	183 Galaxy wrapper for Mafft � multiple aligment tool - Copyright (C) 2012 CropDesign N.V. - this software may be used, copied and redistributed, with or without modification freely, without advance permission, provided that the above Copyright statement is reproduced with each copy.
e4d26cd8be10 Uploaded basfplant parents: diff changeset	184 THIS SOFTWARE IS PROVIDED "AS IS" WITHOUT ANY EXPRESS OR IMPLIED WARRANTIES. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE (INCLUDING NEGLIGENCE OR OTHERWISE).
e4d26cd8be10 Uploaded basfplant parents: diff changeset	185
e4d26cd8be10 Uploaded basfplant parents: diff changeset	186
e4d26cd8be10 Uploaded basfplant parents: diff changeset	187 Citation
e4d26cd8be10 Uploaded basfplant parents: diff changeset	188
e4d26cd8be10 Uploaded basfplant parents: diff changeset	189 - Katoh, Toh 2010 (Bioinformatics 26:1899-1900). Parallelization of the MAFFT multiple sequence alignment program.(describes the multithread version; Linux only)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	190
e4d26cd8be10 Uploaded basfplant parents: diff changeset	191 - Katoh, Asimenos, Toh 2009 (Methods in Molecular Biology 537:39-64). Multiple Alignment of DNA Sequences with MAFFT. In Bioinformatics for DNA Sequence Analysis edited by D. Posada (outlines DNA alignment methods and several tips including group-to-group alignment and rough clustering of a large number of sequences)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	192
e4d26cd8be10 Uploaded basfplant parents: diff changeset	193 - Katoh, Toh 2008 (BMC Bioinformatics 9:212). Improved accuracy of multiple ncRNA alignment by incorporating structural information into a MAFFT-based framework. (describes RNA structural alignment methods)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	194
e4d26cd8be10 Uploaded basfplant parents: diff changeset	195 - Katoh, Toh 2008 (Briefings in Bioinformatics 9:286-298). Recent developments in the MAFFT multiple sequence alignment program. (outlines version 6; Fast Breaking Paper in Thomson Reuters' ScienceWatch)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	196
e4d26cd8be10 Uploaded basfplant parents: diff changeset	197 - Katoh, Toh 2007 (Bioinformatics 23:372-374) Errata. PartTree: an algorithm to build an approximate tree from a large number of unaligned sequences. (describes the PartTree algorithm)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	198
e4d26cd8be10 Uploaded basfplant parents: diff changeset	199 - Katoh, Kuma, Toh, Miyata 2005 (Nucleic Acids Res. 33:511-518). MAFFT version 5: improvement in accuracy of multiple sequence alignment. (describes [ancestral versions of] the G-INS-i, L-INS-i and E-INS-i strategies)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	200
e4d26cd8be10 Uploaded basfplant parents: diff changeset	201 - Katoh, Misawa, Kuma, Miyata 2002 (Nucleic Acids Res. 30:3059-3066). MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform. (describes the FFT-NS-1, FFT-NS-2 and FFT-NS-i strategies)
e4d26cd8be10 Uploaded basfplant parents: diff changeset	202
e4d26cd8be10 Uploaded basfplant parents: diff changeset	203 </help>
e4d26cd8be10 Uploaded basfplant parents: diff changeset	204 </tool>

0

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

1 <tool id="mafft" name="Mafft" version="1.0.0">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

2 <description>Multiple sequence Alignment using Fast Fourier Transform</description>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

3 <command>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

4 #if (str($advanced.select)=="proteins"):

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

5 #if($oformat.value=="clustal"):

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

6 $advanced.select_strategy

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

7 --clustalout

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

8 $advanced.matrixAA

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

9 --op $advanced.gap_open

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

10 --ep $advanced.offset

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

11 #else:

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

12 $advanced.select_strategy

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

13 $advanced.matrixAA

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

14 --op $advanced.gap_open

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

15 --ep $advanced.offset

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

16 #end if

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

17 #else if (str($advanced.select)=="nucleic"):

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

18 #if($oformat.value=="clustal"):

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

19 $advanced.select_strategy

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

20 --clustalout

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

21 $advanced.matrixNucl

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

22 --op $advanced.gap_open

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

23 --ep $advanced.offset

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

24 #else:

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

25 $advanced.select_strategy

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

26 $advanced.matrixNucl

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

27 --op $advanced.gap_open

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

28 --ep $advanced.offset

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

29 #end if

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

30 #else:

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

31 mafft --retree 2 --maxiterate 0 --quiet ##mafft-fftns2, the default strategy

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

32 #if ($oformat.value=="clustal"):

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

33 --clustalout

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

34 #end if

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

35 #if (str($inputtype.selectInput)=="proteins"):

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

36 --bl 62

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

37 #else:

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

38 --kimura 200

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

39 #end if

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

40 --op 1.530000 --ep 0.000000

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

41 #end if

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

42 $inputfile > $output 2> /dev/null

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

43 </command>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

44 <inputs>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

45 <conditional name="inputtype">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

46 <param name="selectInput" type="select" label="Select the type of sequences in your input file.">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

47 <option value="proteins" selected="True">protein input</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

48 <option value="nucleic">nucleic acid input</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

49 </param>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

50 <when value="proteins">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

51 </when>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

52 <when value="nucleic">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

53 </when>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

54 </conditional> ## end conditional input

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

55 <param name="inputfile" type="data" format="fasta" label="Unaligned fasta input sequences (proteins or nucleotides)" />

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

56 <param name="oformat" type="select" label="Output format" help="Please select an output format. Error: tree output generates alignement file instead of Newick file, also in the commandline.">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

57 <option value="fasta" selected="true">fasta</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

58 <option value="clustal">clustal</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

59 </param>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

60 <conditional name="advanced" help="if no advanced options default FFN-NS2 strategy is executed">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

61 <param name="select" type="select" label="Show advanced options">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

62 <option value="no" selected="True">No</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

63 <option value="proteins">for protein input files</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

64 <option value="nucleic">for nucleic acid input files</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

65 </param>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

66 <when value="no">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

67 </when>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

68 <when value="proteins">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

69 <param name="select_strategy" type="select" label="Strategy">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

70 <option value="mafft --quiet --auto" selected="true">Auto (FFT-NS-1, FFT-NS-2, FFT-NS-i or L-INS-i; depends on data size)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

71 <option value="mafft --quiet --retree 1 --maxiterate 0">FFT-NS-1 (Very fast, recommended for > 2.000 sequences; progressive method)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

72 <option value="mafft --retree 2 --maxiterate 0 --quiet">FFT-NS-2 (Fast, progressive method)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

73 <option value="mafft --retree 2 --maxiterate 2 --nofft --quiet">medium (Iterative refinement method, two cycles only)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

74 <option value="mafft --retree 2 --maxiterate 2 --quiet">FFT-NS-i (Slow, iterative refinement method)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

75 <option value="mafft --ep 0 --genafpair --maxiterate 1000 --quiet">E-INS-I (Very slow, recommended for < 2 sequences with multiple conserved domains and long gaps)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

76 <option value="mafft --localpair --maxiterate 1000 --quiet">L-INS-I (Very slow, recommended for < 200 sequences whith one conserved domain and long gaps)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

77 <option value="mafft --globalpair --maxiterate 1000 --quiet">G-INS-I (Very slow, recommended for < 200 sequences with global homology)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

78 <option value="mafft --quiet --retree 1 --maxiterate 0 --nofft --parttree">NW-NS-PartTree-1 (recommended for ~10,000 to ~50,000 sequences; progressive method with the PartTree algorithm)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

79 </param>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

80 <param name="matrixAA" type="select" label="Scoring matrix for amino acid sequences">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

81 <option value="--bl 30">BLOSUM30</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

82 <option value="--bl 45">BLOSUM45</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

83 <option value="--bl 62">BLOSUM62</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

84 <option value="--bl 80">BLOSUM80</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

85 <option value="--jtt 100">JTT100</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

86 <option value="--jtt 200">JTT200</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

87 </param>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

88 <param name="gap_open" label="Gap openingpenalty (5-200)" type="integer" value="50"/>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

89 <param name="offset" label="Offset value (0-1)" type="float" value="0.0"/>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

90 </when>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

91 <when value="nucleic">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

92 <param name="select_strategy" type="select" label="Strategy">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

93 <option value="mafft --quiet --auto" selected="true">Auto (FFT-NS-1, FFT-NS-2, FFT-NS-i or L-INS-i; depends on data size)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

94 <option value="mafft --quiet --retree 1 --maxiterate 0">FFT-NS-1 (Very fast, recommended for > 2.000 sequences; progressive method)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

95 <option value="mafft --retree 2 --maxiterate 0 --quiet">FFT-NS-2 (Fast, progressive method)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

96 <option value="mafft --retree 2 --maxiterate 2 --nofft --quiet">medium (Iterative refinement method, two cycles only)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

97 <option value="mafft --retree 2 --maxiterate 2 --quiet">FFT-NS-i (Slow, iterative refinement method)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

98 <option value="mafft --ep 0 --genafpair --maxiterate 1000 --quiet">E-INS-I (Very slow, recommended for < 2 sequences with multiple conserved domains and long gaps)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

99 <option value="mafft --localpair --maxiterate 1000 --quiet">L-INS-I (Very slow, recommended for < 200 sequences whith one conserved domain and long gaps)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

100 <option value="mafft --globalpair --maxiterate 1000 --quiet">C-INS-I (Very slow, recommended for < 200 sequences with global homology)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

101 <option value="mafft --quiet --retree 1 --maxiterate 0 --nofft --parttree">NW-NS-PartTree-1 (recommended for ~10,000 to ~50,000 sequences; progressive method with the PartTree algorithm)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

102 <option value="mafft-qinsi --quiet">Q-INS-I (Extremely slow; secondary structure of RNA is considered; recommended for a global alignment of highly divergent ncRNAs with < 200 sequences, < 1.000 nucleotides)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

103 <option value="mafft-xinsi --quiet">X-INS-I (Applicable to up to ~50 sequences to ~1,000 nucleotides. Multiple structural alignment by combining pairwise structural alignments given by an external program.)</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

104 </param>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

105 <param name="matrixNucl" type="select" label="Scoring matrix for nucleic acid sequences">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

106 <option value="--kimura 1">1PAM / kappa=2</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

107 <option value="--kimura 20">20PAM / kappa=2</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

108 <option value="--kimura 200">200PAM / kappa=2</option>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

109 </param>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

110 <param name="gap_open" label="Gap openingpenalty (5-200)" type="integer" value="50"/>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

111 <param name="offset" label="Offset value (0-1)" type="float" value="0.0"/>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

112 </when>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

113 </conditional> ## end conditional advanced

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

114 </inputs>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

115 <outputs>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

116 <data format="fasta" name="output">

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

117 <change_format>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

118 <when input="oformat" value="clustal" format="clustal"/>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

119 </change_format>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

120 </data>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

121 </outputs>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

122 <help>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

123 **What it does**

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

124 MAFFT is a multiple sequence alignment program for proteins and nucleotides using fast fourier transform.

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

125

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

126 If no advanced options are selected, the following default paramters will be used:

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

127 - for proteins: mafft-FFT-NS-2 method (Fast, progressive method), BLOSUM62 substitution matrix, gap opening penalty 1.53 and offset value 0.00

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

128

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

129 - for nucleic acids: mafft-FFT-NS-2 method (Fast, progressive method), 200PAM/kappa=2 substitution matrix, gap opening penalty 1.53 and offset value 0.00

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

130

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

131

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

132 MAFFT offers a range of multiple alignment methods, classified into three types, (a) the progressive method, (b) the iterative refinement method with the WSP score, and (c) the iterative refinment method using both the WSP and consistency scores. In general, there is a tradeoff between speed and accuracy. The order of speed is a > b > c, whereas the order of accuracy is a < b < c.

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

133

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

134 - Auto (FFT-NS-1, FFT-NS-2, FFT-NS-i or L-INS-i; depends on data size) (a,b or c)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

135

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

136 - FFT-NS-1 (Very fast, recommended for > 2.000 sequences; progressive method) (a)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

137

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

138 - FFT-NS-2 (Fast, progressive method) (DEFAULT if no advanced options) (a)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

139

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

140 - medium (Iterative refinement method, two cycles only) (b)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

141

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

142 - FFT-NS-i (Slow, iterative refinement method) (b)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

143

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

144 - E-INS-I (Very slow, recommended for < 2 sequences with multiple conserved domains and long gaps) (c)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

145

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

146 - L-INS-I (Very slow, recommended for < 200 sequences whith one conserved domain and long gaps) (c)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

147

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

148 - G-INS-I (Very slow, recommended for < 200 sequences with global homology) (c)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

149

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

150 - NW-NS-PartTree-1 (recommended for ~10,000 to ~50,000 sequences; progressive method with the PartTree algorithm) (a)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

151

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

152 For nucleotides only, there are still additional alignment methods:

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

153

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

154 - Q-INS-I (Extremely slow; secondary structure of RNA is considered; recommended for a global alignment of highly divergent ncRNAs with < 200 sequences, < 1.000 nucleotides)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

155

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

156 - X-INS-I (Applicable to up to ~50 sequences to ~1,000 nucleotides. Multiple structural alignment by combining pairwise structural alignments given by an external program.)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

157

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

158

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

159 Depending on the nature of the sequences in the input file, the advanced options change. When "for protein input files" is selected from the advanced options, BLOSUM or JTT substitution matrices can be chosen. The selection "for nucleic acid input files" only offers substitution matrices of the type PAM / kappa = x. For nucleic acids, two extra strategies are available compared to proteins, namely X-INS-i and Q-INS-i.

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

160

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

161 **Documentation**

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

162

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

163 Mafft website http://mafft.cbrc.jp/alignment/software/

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

164

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

165 Manpages of Mafft at http://mafft.cbrc.jp/alignment/software/manual/manual.html

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

166

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

167 More information about the algorithms can be found at http://mafft.cbrc.jp/alignment/software/algorithms/algorithms.html#GLE.

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

168

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

169

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

170 **Author and affiliation**

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

171

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

172

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

173 Katrien Bernaerts and Domantas Motiejunas, 21/06/2012

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

174

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

175 Corresponding author: domantas dot motiejunas at cropdesign dot com

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

176

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

177

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

178

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

179 Affiliation: CropDesign N.V., a BASF Plant Science Company - Technologiepark 3, 9052 Zwijnaarde - Belgium

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

180

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

181 **Terms of use**

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

182

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

183 Galaxy wrapper for Mafft � multiple aligment tool - Copyright (C) 2012 CropDesign N.V. - this software may be used, copied and redistributed, with or without modification freely, without advance permission, provided that the above Copyright statement is reproduced with each copy.

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

184 THIS SOFTWARE IS PROVIDED "AS IS" WITHOUT ANY EXPRESS OR IMPLIED WARRANTIES. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE (INCLUDING NEGLIGENCE OR OTHERWISE).

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

185

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

186

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

187 **Citation**

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

188

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

189 - Katoh, Toh 2010 (Bioinformatics 26:1899-1900). Parallelization of the MAFFT multiple sequence alignment program.(describes the multithread version; Linux only)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

190

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

191 - Katoh, Asimenos, Toh 2009 (Methods in Molecular Biology 537:39-64). Multiple Alignment of DNA Sequences with MAFFT. In Bioinformatics for DNA Sequence Analysis edited by D. Posada (outlines DNA alignment methods and several tips including group-to-group alignment and rough clustering of a large number of sequences)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

192

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

193 - Katoh, Toh 2008 (BMC Bioinformatics 9:212). Improved accuracy of multiple ncRNA alignment by incorporating structural information into a MAFFT-based framework. (describes RNA structural alignment methods)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

194

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

195 - Katoh, Toh 2008 (Briefings in Bioinformatics 9:286-298). Recent developments in the MAFFT multiple sequence alignment program. (outlines version 6; Fast Breaking Paper in Thomson Reuters' ScienceWatch)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

196

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

197 - Katoh, Toh 2007 (Bioinformatics 23:372-374) Errata. PartTree: an algorithm to build an approximate tree from a large number of unaligned sequences. (describes the PartTree algorithm)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

198

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

199 - Katoh, Kuma, Toh, Miyata 2005 (Nucleic Acids Res. 33:511-518). MAFFT version 5: improvement in accuracy of multiple sequence alignment. (describes [ancestral versions of] the G-INS-i, L-INS-i and E-INS-i strategies)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

200

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

201 - Katoh, Misawa, Kuma, Miyata 2002 (Nucleic Acids Res. 30:3059-3066). MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform. (describes the FFT-NS-1, FFT-NS-2 and FFT-NS-i strategies)

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

202

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

203 </help>

e4d26cd8be10 Uploaded

basfplant

parents:

diff changeset

204 </tool>

Mercurial > repos > basfplant > mafft

annotate Mafft/mafft.xml @ 0:e4d26cd8be10 draft default tip