Mercurial > repos > iuc > seqtk

<?xml version="1.0"?>
<tool id="seqtk_subseq" name="seqtk_subseq" version="@TOOL_VERSION@.1">
    <description>extract subsequences from FASTA/Q files</description>
    <expand macro="bio_tools"/>
    <macros>
        <import>macros.xml</import>
        <requirement type="package" version="@AWK_VERSION@">gawk</requirement>
    </macros>
    <expand macro="requirements"/>
    <expand macro="stdio"/>
    <command><![CDATA[
seqtk subseq
$t
-l $l
'$in_file'
#if $source.type == 'bed':
    '$in_bed'
#else
    '$name_list'
#end if
#if $t == '-t':
    | awk 'BEGIN{print "chr\tunknown\tseq"}1'
#end if
@CONDITIONAL_GZIP_OUT@
    ]]></command>
    <inputs>
        <expand macro="in_faq"/>
        <conditional name="source">
            <param name="type" type="select" label="Select source of sequence choices">
                <option value="bed">BED</option>
                <option value="name">FASTA/Q ID list</option>
            </param>
            <when value="bed">
                <param name="in_bed" type="data" format="bed" label="Input BED file"/>
            </when>
            <when value="name">
                <param name="name_list" type="data" format="txt" label="Input ID list"/>
            </when>
        </conditional>
        <param argument="-t" type="boolean" truevalue="-t" falsevalue="" label="TAB delimited output" />
        <param argument="-l" type="integer" value="0" label="Sequence line length" />
    </inputs>
    <outputs>
        <data name="default" format_source="in_file" label="Selected sequences from $in_file.name">
            <change_format>
                <when input="t" value="-t" format="tabular"/>
            </change_format>
        </data>
    </outputs>
    <tests>
        <test>
            <param name="in_file" value="seqtk_subseq.fa"/>
            <param name="type" value="name"/>
            <param name="t" value="False" />
            <param name="name_list" value="seqtk_subseq_list.txt"/>
            <output name="default" file="seqtk_subseq.out" ftype="fasta"/>
        </test>
        <test>
            <param name="in_file" value="seqtk_subseq.fa.gz" ftype="fasta.gz"/>
            <param name="type" value="name"/>
            <param name="t" value="False" />
            <param name="name_list" value="seqtk_subseq_list.txt"/>
            <output name="default" file="seqtk_subseq.out.gz" ftype="fasta.gz"/>
        </test>
    </tests>
    <help><![CDATA[
**What it does**

Given a list of newline separated IDs from a fasta file, this will extract those named fasta sequences from the input file.

::

    # Input ID list
    seq1

    # Input fasta
    >seq1
    ACGTMRWSYK
    >seq2
    RWSYKACGTM

results in

::

    # Output result
    >seq1
    ACGTMRWSYK

@ATTRIBUTION@
    ]]></help>
    <expand macro="citation" />
</tool>
author	iuc
date	Thu, 14 Oct 2021 09:22:39 +0000
parents	a09586d5149a
children	4b494533146a