# HG changeset patch # User drosofff # Date 1481063374 18000 # Node ID b1e152172de9afefaaf0b32bfdd1158db4413457 # Parent a006d42dd75970d23dae8278e2eb4359bf0263f2 planemo upload for repository https://github.com/ARTbio/tools-artbio/tree/master/tools/lumpy commit 5f3fb85a6eb667b04c4de65eb722261f315c8241 diff -r a006d42dd759 -r b1e152172de9 lumpy.xml --- a/lumpy.xml Tue Dec 06 09:29:31 2016 -0500 +++ b/lumpy.xml Tue Dec 06 17:29:34 2016 -0500 @@ -1,4 +1,4 @@ - + find structural variants lumpy-sv @@ -10,38 +10,107 @@ lumpy --version "input.discordants.unsorted.bam" && - samtools view -h input.bam | python $__tool_directory__/extractSplitReads_BwaMem.py -i stdin | samtools view -Sb - > "input.splitters.unsorted.bam" && - samtools sort input.discordants.unsorted.bam > input.discordants.bam && - samtools sort input.splitters.unsorted.bam > input.splitters.bam && - samtools view -r readgroup input.bam - |tail -n +$seq_method.additional_params.samplingValue - |python $__tool_directory__/pairend_distro.py -r 101 -X 4 -N $seq_method.additional_params.samplingValue -o input.lib.histo > meandev.txt && - mean=\$(cat meandev.txt | sed s/mean:// | sed -r s/stdev:.+//) && - stdev=\$(cat meandev.txt | sed -r s/mean:.+stdev://) && - lumpy -mw 4 -tt 0 - -pe id:input.bam,bam_file:input.discordants.bam,histo_file:input.lib.histo,mean:"\$mean",stdev:"\$stdev",read_length:$seq_method.readLength,min_non_overlap:$seq_method.additional_params.min_non_overlap,discordant_z:$seq_method.additional_params.discordant_z,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold - -sr id:input.bam,bam_file:input.splitters.bam,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold > output.vcf && - mv input.discordants.bam $discordants && - mv input.splitters.bam $splits && - mv input.lib.histo $histogram && - mv output.vcf $vcf_call && - rm input.discordants.unsorted.bam input.splitters.unsorted.bam meandev.txt + #if $analysis_type.analysis_type_list == "one_sample": + ln -f -s $analysis_type.input_file input.bam && + #else: + ln -f -s $analysis_type.input_file input.A.bam && + ln -f -s $analysis_type.input_fileB input.B.bam && #end if - #if $seq_method.seq_method_list == "single-read": - samtools view -h input.bam | python $__tool_directory__/extractSplitReads_BwaMem.py -i stdin | samtools view -Sb - > "input.splitters.unsorted.bam" && - lumpy -mw 4 -tt 0 - -sr id:input.bam,bam_file:input.splitters.unsorted.bam,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold > output.vcf && - mv input.splitters.unsorted.bam $splits && - mv output.vcf $vcf_call + + #if $analysis_type.analysis_type_list == "one_sample": + + #if $seq_method.seq_method_list == "paired-end": + samtools view -b -F 1294 input.bam > "input.discordants.unsorted.bam" && + samtools view -h input.bam | python $__tool_directory__/extractSplitReads_BwaMem.py -i stdin | samtools view -Sb - > "input.splitters.unsorted.bam" && + samtools sort input.discordants.unsorted.bam > input.discordants.bam && + samtools sort input.splitters.unsorted.bam > input.splitters.bam && + samtools view -r readgroup input.bam + |tail -n +$seq_method.additional_params.samplingValue + |python $__tool_directory__/pairend_distro.py -r 101 -X 4 -N $seq_method.additional_params.samplingValue -o input.lib.histo > meandev.txt && + mean=\$(cat meandev.txt | sed s/mean:// | sed -r s/stdev:.+//) && + stdev=\$(cat meandev.txt | sed -r s/mean:.+stdev://) && + lumpy -mw $seq_method.additional_params.mw -tt $seq_method.additional_params.tt + -pe id:input.bam,bam_file:input.discordants.bam,histo_file:input.lib.histo,mean:"\$mean",stdev:"\$stdev",read_length:$seq_method.readLength,min_non_overlap:$seq_method.additional_params.min_non_overlap,discordant_z:$seq_method.additional_params.discordant_z,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold + -sr id:input.bam,bam_file:input.splitters.bam,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold > output.vcf && + mv input.discordants.bam $discordants && + mv input.splitters.bam $splits && + mv input.lib.histo $histogram && + mv output.vcf $vcf_call && + rm input.discordants.unsorted.bam input.splitters.unsorted.bam meandev.txt + #end if + #if $seq_method.seq_method_list == "single-read": + samtools view -h input.bam | python $__tool_directory__/extractSplitReads_BwaMem.py -i stdin | samtools view -Sb - > "input.splitters.unsorted.bam" && + lumpy -mw $seq_method.additional_params.mw -tt $seq_method.additional_params.tt + -sr id:input.bam,bam_file:input.splitters.unsorted.bam,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold > output.vcf && + mv input.splitters.unsorted.bam $splits && + mv output.vcf $vcf_call + #end if + + #else: + + #if $seq_method.seq_method_list == "paired-end": + samtools view -b -F 1294 input.A.bam > "input.A.discordants.unsorted.bam" && + samtools view -b -F 1294 input.B.bam > "input.B.discordants.unsorted.bam" && + samtools view -h input.A.bam | python $__tool_directory__/extractSplitReads_BwaMem.py -i stdin | samtools view -Sb - > "input.A.splitters.unsorted.bam" && + samtools view -h input.B.bam | python $__tool_directory__/extractSplitReads_BwaMem.py -i stdin | samtools view -Sb - > "input.B.splitters.unsorted.bam" && + samtools sort input.A.discordants.unsorted.bam > input.A.discordants.bam && + samtools sort input.B.discordants.unsorted.bam > input.B.discordants.bam && + samtools sort input.A.splitters.unsorted.bam > input.A.splitters.bam && + samtools sort input.B.splitters.unsorted.bam > input.B.splitters.bam && + samtools view -r readgroup input.A.bam + |tail -n +$seq_method.additional_params.samplingValue + |python $__tool_directory__/pairend_distro.py -r 101 -X 4 -N $seq_method.additional_params.samplingValue -o input.A.lib.histo > meandevA.txt && + samtools view -r readgroup input.B.bam + |tail -n +$seq_method.additional_params.samplingValue + |python $__tool_directory__/pairend_distro.py -r 101 -X 4 -N $seq_method.additional_params.samplingValue -o input.B.lib.histo > meandevB.txt && + meanA=\$(cat meandevA.txt | sed s/mean:// | sed -r s/stdev:.+//) && + meanB=\$(cat meandevB.txt | sed s/mean:// | sed -r s/stdev:.+//) && + stdevA=\$(cat meandevA.txt | sed -r s/mean:.+stdev://) && + stdevB=\$(cat meandevB.txt | sed -r s/mean:.+stdev://) && + lumpy -mw $seq_method.additional_params.mw -tt $seq_method.additional_params.tt + -pe id:inputA.bam,bam_file:input.A.discordants.bam,histo_file:input.A.lib.histo,mean:"\$meanA",stdev:"\$stdevA",read_length:$seq_method.readLength,min_non_overlap:$seq_method.additional_params.min_non_overlap,discordant_z:$seq_method.additional_params.discordant_z,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold + -pe id:inputB.bam,bam_file:input.B.discordants.bam,histo_file:input.B.lib.histo,mean:"\$meanB",stdev:"\$stdevA",read_length:$seq_method.readLength,min_non_overlap:$seq_method.additional_params.min_non_overlap,discordant_z:$seq_method.additional_params.discordant_z,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold + -sr id:inputA.bam,bam_file:input.A.splitters.bam,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold + -sr id:inputB.bam,bam_file:input.B.splitters.bam,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold > output.vcf && + mv input.A.discordants.bam $discordants && + mv input.B.discordants.bam $discordantsB && + mv input.A.splitters.bam $splits && + mv input.B.splitters.bam $splitsB && + mv input.A.lib.histo $histogram && + mv input.B.lib.histo $histogramB && + mv output.vcf $vcf_call && + rm input.A.discordants.unsorted.bam input.B.discordants.unsorted.bam input.A.splitters.unsorted.bam input.B.splitters.unsorted.bam meandevA.txt meandevB.txt + #end if + #if $seq_method.seq_method_list == "single-read": + samtools view -h input.A.bam | python $__tool_directory__/extractSplitReads_BwaMem.py -i stdin | samtools view -Sb - > "input.A.splitters.unsorted.bam" && + samtools view -h input.B.bam | python $__tool_directory__/extractSplitReads_BwaMem.py -i stdin | samtools view -Sb - > "input.B.splitters.unsorted.bam" && + lumpy -mw $seq_method.additional_params.mw -tt $seq_method.additional_params.tt + -sr id:input.A.bam,bam_file:input.A.splitters.unsorted.bam,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold + -sr id:input.B.bam,bam_file:input.B.splitters.unsorted.bam,back_distance:$seq_method.additional_params.back_distance,weight:$seq_method.additional_params.weight,min_mapping_threshold:$seq_method.additional_params.min_mapping_threshold > output.vcf && + mv input.A.splitters.unsorted.bam $splits && + mv input.B.splitters.unsorted.bam $splitsB && + mv output.vcf $vcf_call + #end if + + #end if ]]> - + + + + + + + + + + + + + @@ -51,6 +120,8 @@

+ + @@ -60,6 +131,8 @@

+ + @@ -71,20 +144,34 @@ - + seq_method['seq_method_list'] == "paired-end" - - + + seq_method['seq_method_list'] == "paired-end" + analysis_type['analysis_type_list'] == "two_sample" + + + + analysis_type['analysis_type_list'] == "two_sample" + + seq_method['seq_method_list'] == "paired-end" - + + seq_method['seq_method_list'] == "paired-end" + analysis_type['analysis_type_list'] == "two_sample" + + + + +