Mercurial > repos > iuc > samtools_markdup
changeset 0:046cbf29795a draft
planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/master/tool_collections/samtools/samtools_markdup commit 0fe00966500158720fb63dc9b28f6a4ca0d1e1eb
author | iuc |
---|---|
date | Fri, 28 Sep 2018 04:29:07 -0400 |
parents | |
children | 83b8e36e9cbe |
files | macros.xml samtools_markdup.xml test-data/5_markdup.expected.bam test-data/5_markdup.expected.sam test-data/5_markdup.sam test-data/6_remove_dups.expected.bam test-data/6_remove_dups.expected.sam test-data/6_remove_dups.sam test-data/7_mark_supp_dup.bam test-data/7_mark_supp_dup.expected.bam test-data/7_mark_supp_dup.expected.sam test-data/7_mark_supp_dup.sam |
diffstat | 12 files changed, 368 insertions(+), 0 deletions(-) [+] |
line wrap: on
line diff
--- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/macros.xml Fri Sep 28 04:29:07 2018 -0400 @@ -0,0 +1,172 @@ +<macros> + <xml name="requirements"> + <requirements> + <requirement type="package" version="@TOOL_VERSION@">samtools</requirement> + <yield/> + </requirements> + </xml> + <token name="@TOOL_VERSION@">1.9</token> + <token name="@FLAGS@">#set $flags = sum(map(int, str($filter).split(',')))</token> + <token name="@PREPARE_IDX@"><![CDATA[ + ##prepare input and indices + ln -s '$input' infile && + #if $input.is_of_type('bam'): + #if str( $input.metadata.bam_index ) != "None": + ln -s '${input.metadata.bam_index}' infile.bai && + #else: + samtools index infile infile.bai && + #end if + #elif $input.is_of_type('cram'): + #if str( $input.metadata.cram_index ) != "None": + ln -s '${input.metadata.cram_index}' infile.crai && + #else: + samtools index infile infile.crai && + #end if + #end if + ]]></token> + <token name="@PREPARE_IDX_MULTIPLE@"><![CDATA[ + ##prepare input and indices + #for $i, $bam in enumerate( $input_bams ): + ln -s '$bam' '${i}' && + #if $bam.is_of_type('bam'): + #if str( $bam.metadata.bam_index ) != "None": + ln -s '${bam.metadata.bam_index}' '${i}.bai' && + #else: + samtools index '${i}' '${i}.bai' && + #end if + #elif $bam.is_of_type('cram'): + #if str( $bam.metadata.cram_index ) != "None": + ln -s '${bam.metadata.cram_index}' '${i}.crai' && + #else: + samtools index '${i}' '${i}.crai' && + #end if + #end if + #end for + ]]></token> + <token name="@PREPARE_FASTA_IDX@"><![CDATA[ + ##checks for reference data ($addref_cond.addref_select=="history" or =="cached") + ##and sets the -t/-T parameters accordingly: + ##- in case of history a symbolic link is used because samtools (view) will generate + ## the index which might not be possible in the directory containing the fasta file + ##- in case of cached the absolute path is used which allows to read the cram file + ## without specifying the reference + #if $addref_cond.addref_select == "history": + ln -s '${addref_cond.ref}' reference.fa && + samtools faidx reference.fa && + #set reffa="reference.fa" + #set reffai="reference.fa.fai" + #elif $addref_cond.addref_select == "cached": + #set reffa=str($addref_cond.ref.fields.path) + #set reffai=str($addref_cond.ref.fields.path)+".fai" + #else + #set reffa=None + #set reffai=None + #end if + ]]></token> + <token name="@ADDTHREADS@"><![CDATA[ + ##compute the number of ADDITIONAL threads to be used by samtools (-@) + addthreads=\${GALAXY_SLOTS:-1} && (( addthreads-- )) && + ]]></token> + <token name="@ADDMEMORY@"><![CDATA[ + ##compute the number of memory available to samtools sort (-m) + ##use only 75% of available: https://github.com/samtools/samtools/issues/831 + addmemory=\${GALAXY_MEMORY_MB_PER_SLOT:-768} && + ((addmemory=addmemory*75/100)) && + ]]></token> + <xml name="seed_input"> + <param name="seed" type="integer" optional="True" label="Seed for random number generator" help="If empty a random seed is used." /> + </xml> + <xml name="flag_options"> + <option value="1">read is paired</option> + <option value="2">read is mapped in a proper pair</option> + <option value="4">read is unmapped</option> + <option value="8">mate is unmapped</option> + <option value="16">read reverse strand</option> + <option value="32">mate reverse strand</option> + <option value="64">read is the first in a pair</option> + <option value="128">read is the second in a pair</option> + <option value="256">alignment or read is not primary</option> + <option value="512">read fails platform/vendor quality checks</option> + <option value="1024">read is a PCR or optical duplicate</option> + <option value="2048">supplementary alignment</option> + </xml> + + <!-- region specification macros and tokens for tools that allow the specification + of region by bed file / space separated list of regions --> + <token name="@REGIONS_FILE@"><![CDATA[ + #if $cond_region.select_region == 'tab': + -t '$cond_region.targetregions' + #end if + ]]></token> + <token name="@REGIONS_MANUAL@"><![CDATA[ + #if $cond_region.select_region == 'text': + #for $i, $x in enumerate($cond_region.regions_repeat): + '${x.region}' + #end for + #end if + ]]></token> + <xml name="regions_macro"> + <conditional name="cond_region"> + <param name="select_region" type="select" label="Filter by regions" help="restricts output to only those alignments which overlap the specified region(s)"> + <option value="no" selected="True">No</option> + <option value="text">Manualy specify regions</option> + <option value="tab">Regions from tabular file</option> + </param> + <when value="no"/> + <when value="text"> + <repeat name="regions_repeat" min="1" default="1" title="Regions"> + <param name="region" type="text" label="region" help="format chr:from-to"> + <validator type="regex" message="Required format: CHR[:FROM[-TO]]; where CHR: string containing any character except quotes, whitespace and colon; FROM and TO: any integer">^[^\s'\":]+(:\d+(-\d+){0,1}){0,1}$</validator> + </param> + </repeat> + </when> + <when value="tab"> + <param name="targetregions" argument="-t/--target-regions" type="data" format="tabular" label="Target regions file" help="Do stats in these regions only. Tab-delimited file chr,from,to (1-based, inclusive)" /> + </when> + </conditional> + </xml> + + <xml name="citations"> + <citations> + <citation type="bibtex"> + @misc{SAM_def, + title={Definition of SAM/BAM format}, + url = {https://samtools.github.io/hts-specs/},} + </citation> + <citation type="doi">10.1093/bioinformatics/btp352</citation> + <citation type="doi">10.1093/bioinformatics/btr076</citation> + <citation type="doi">10.1093/bioinformatics/btr509</citation> + <citation type="bibtex"> + @misc{Danecek_et_al, + Author={Danecek, P., Schiffels, S., Durbin, R.}, + title={Multiallelic calling model in bcftools (-m)}, + url = {http://samtools.github.io/bcftools/call-m.pdf},} + </citation> + <citation type="bibtex"> + @misc{Durbin_VCQC, + Author={Durbin, R.}, + title={Segregation based metric for variant call QC}, + url = {http://samtools.github.io/bcftools/rd-SegBias.pdf},} + </citation> + <citation type="bibtex"> + @misc{Li_SamMath, + Author={Li, H.}, + title={Mathematical Notes on SAMtools Algorithms}, + url = {http://www.broadinstitute.org/gatk/media/docs/Samtools.pdf},} + </citation> + <citation type="bibtex"> + @misc{SamTools_github, + title={SAMTools GitHub page}, + url = {https://github.com/samtools/samtools},} + </citation> + </citations> + </xml> + <xml name="version_command"> + <version_command><![CDATA[samtools 2>&1 | grep Version]]></version_command> + </xml> + <xml name="stdio"> + <stdio> + <exit_code range="1:" level="fatal" description="Error" /> + </stdio> + </xml> +</macros>
--- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/samtools_markdup.xml Fri Sep 28 04:29:07 2018 -0400 @@ -0,0 +1,80 @@ +<tool id="samtools_markdup" name="Samtools markdup" version="@TOOL_VERSION@"> + <description>marks duplicate alignments</description> + <macros> + <import>macros.xml</import> + </macros> + <expand macro="requirements"/> + <expand macro="stdio"/> + <expand macro="version_command"/> + <command><![CDATA[ +@ADDTHREADS@ +## coordinate sort input +#if not $bamfile.is_of_type('bam'): + samtools sort + -@ \$addthreads -m \${GALAXY_MEMORY_MB:-768}M -T sorttemp + -O sam + -o coordsort.sam + '$bamfile' && +#else: + ln -s '$bamfile' coordsort.sam && +#end if + +samtools markdup + +-@ \$addthreads +#if str($maxlen) != '': + -l $maxlen +#end if +$remove +$stats +$supp +coordsort.sam +'$output' + ]]></command> + <inputs> + <param name="bamfile" type="data" format="sam,bam,cram" optional="false" label="Alignment" /> + <param name="remove" type="boolean" argument="-r" truevalue="-r" falsevalue="" label="Remove duplicate reads" /> + <param name="maxlen" type="integer" optional="true" argument="-l" min="0" label="Expected maximum read length of INT bases. (default 300)"/> + <param name="stats" type="boolean" argument="-s" truevalue="-s" falsevalue="" label="Print basic statistics" /> + <param name="supp" type="boolean" argument="-S" truevalue="-S" falsevalue="" label="Mark supplementary reads of duplicates as duplicates" /> + </inputs> + <outputs> + <!-- output bam, if input was name sorted then restore this sorting order --> + <data name="output" format="bam"/> + </outputs> + <tests> + <!-- tests and data extracted from + https://github.com/samtools/samtools/blob/6d79411685d8f0fbb34e123f52d72b63271f4dcb/test/test.pl#L2616 + TODO the 1st 4 tests are negative, I do not know how to test for the error code +--> +<!-- test_cmd($opts, out=>'markdup/1_name_sort.expected.sam', err=>'1_name_sort.expected.sam.err', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/1_name_sort.sam -", expect_fail=>1); + test_cmd($opts, out=>'markdup/2_bad_order.expected.sam', err=>'2_bad_order.expected.sam.err', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/2_bad_order.sam -", expect_fail=>1); + test_cmd($opts, out=>'markdup/3_missing_mc.expected.sam', err=>'3_missing_mc.expected.sam.err', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/3_missing_mc.sam -", expect_fail=>1); + test_cmd($opts, out=>'markdup/4_missing_ms.expected.sam', err=>'4_missing_ms.expected.sam.err', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/4_missing_ms.sam -", expect_fail=>1);--> + <test> + <param name="bamfile" value="5_markdup.sam" /> + <output name="output" file="5_markdup.expected.bam" /> + </test> + <!-- test_cmd($opts, out=>'markdup/5_markdup.expected.sam', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam $$opts{path}/markdup/5_markdup.sam -");--> + <test> + <param name="bamfile" value="6_remove_dups.sam" /> + <param name="remove" value="-r" /> + <output name="output" file="6_remove_dups.expected.bam" /> + </test> + <!-- test_cmd($opts, out=>'markdup/6_remove_dups.expected.sam', cmd=>"$$opts{bin}/samtools markdup${threads} -O sam -r $$opts{path}/markdup/6_remove_dups.sam -");--> + <test> + <param name="bamfile" value="7_mark_supp_dup.bam" /> + <param name="supp" value="-S" /> + <output name="output" file="7_mark_supp_dup.expected.bam" /> + </test> + <!-- + test_cmd($opts, out=>'markdup/7_mark_supp_dup.expected.sam', cmd=>"$$opts{bin}/samtools markdup${threads} -S -O sam $$opts{path}/markdup/7_mark_supp_dup.sam -");--> + </tests> + <help> +Mark duplicate alignments from a coordinate sorted file that has been run through fixmate with the -m option. This program relies on the MC and ms tags that fixmate provides. + +Note: The Galaxy tool sorts the data automatically if the input is SAM or query name sorted. +The output is BAM (which is query name sorted again if the input is). + </help> + <expand macro="citations"/> +</tool>
--- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/5_markdup.expected.sam Fri Sep 28 04:29:07 2018 -0400 @@ -0,0 +1,18 @@ +@HD VN:1.4 SO:coordinate +@SQ SN:contig_000000000 LN:11391 +entry1 1187 contig_000000000 109 60 250M = 137 278 GATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG 1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00 NM:i:18 AS:i:164 XS:i:0 MQ:i:60 MC:Z:250M ms:i:6744 +entry2 163 contig_000000000 109 60 250M = 137 278 TATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG BBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00 NM:i:2 AS:i:240 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9279 +entry3 99 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9509 +entry4 1187 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0 NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9604 +entry1 1107 contig_000000000 137 60 250M = 109 -278 TTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG ;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11> NM:i:7 AS:i:222 XS:i:19 MQ:i:60 MC:Z:250M ms:i:5687 +entry2 83 contig_000000000 137 60 250M = 109 -278 GTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG 0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8804 +entry3 147 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA 9BGC0FFBGFFGGGGFFGFEGGHGHGCGHHHHGHGGHGHHHGHHHHGHHGGGHHHHFHGHGHHHHHHGHHFHHHHHHHHHGHHHHGHHGHHHHG2HHGFHHGHHHHHHDFHHHGGHHGHGHHHFHHDHHHHHHHHHHHHFHHHHHGHHHHHHHHHHHHFFHHHHGHHHHHHFHHHHHHHHHHHHHHGCGGGHHHGGGGGGGGGGGGGGGHHHHHGHHHHHHHHHHHHHGGGGGGGGGGFFFFFFFBBBBB NM:i:1 AS:i:245 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9634 +entry4 1107 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA GGGGGGGGGGGGGGGGGFFGHHHHHGGHHGHHHHGFHHHHGHHHHHHHHHGGHHFEHHHHHHHHHGGHHHHHHHHHHHFHHGFHGHHHGFFHFHHHHHHHHHFHHEHHHHHHHGGHHGHGHHHHHHHHHFGGHHHHHHGFHFHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHGHHHHHHHHHHHGGGGGHHHGGGGGGGGGGGGGGGHHHHHHHGHHHHHGHHHHHGGGGGGGGGGFFFFFFFACCBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9217 +entry5 163 contig_000000000 304 60 250M = 422 368 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAG AABBBFFFFFFFGGGFGGGGGGHHHHHHHHHGHHHHHHHGGHGHHHHHHHHHHGHHHHHHHHFHFGHHHHHHHHHGHGGHFHHHHHHHHHHGFFHHHHHEHHHGHHHHHGDEEGHGHGEGGHHHHHHHHHGHHHFGHHHHHHHFGHHHHHGG?GGGAGHHFFHHFFGG2>@FGGFGFBGGHFHGHHHHHFFF?FGHHGGGGFGEGGHHGGGGHGFGDGHGHHFHEGFHGFGFFHFFHHFHGHFHBFGGF? NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9562 +entry6 69 contig_000000000 304 0 * = 304 0 GCGGTGGAACGCCGCTTCGGCAACGATCTTCCGTCGTCTCCAGTGGAGTGGCTGACGGATAATGGTTCATGCTACCGGGCTAATGAAACACGCCAGTTCGCCCGGATGTTGGGACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG BCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF AS:i:0 XS:i:0 MQ:i:49 MC:Z:35M215S ms:i:9339 +entry6 1161 contig_000000000 304 49 35M215S = 304 0 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT ABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0 NM:i:0 AS:i:35 XS:i:0 MC:Z:* ms:i:9398 +entry5 83 contig_000000000 422 60 250M = 304 -368 TGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA .DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9461 +entry7 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:4569 +entry7 181 contig_000000000 3891 0 * = 3891 0 CAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG ////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8580 +entry8 1145 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:3281 +entry8 181 contig_000000000 3891 0 * = 3891 0 GACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT 9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8542
--- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/5_markdup.sam Fri Sep 28 04:29:07 2018 -0400 @@ -0,0 +1,18 @@ +@HD VN:1.4 SO:coordinate +@SQ SN:contig_000000000 LN:11391 +entry1 163 contig_000000000 109 60 250M = 137 278 GATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG 1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00 NM:i:18 AS:i:164 XS:i:0 MQ:i:60 MC:Z:250M ms:i:6744 +entry2 163 contig_000000000 109 60 250M = 137 278 TATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG BBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00 NM:i:2 AS:i:240 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9279 +entry3 99 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9509 +entry4 163 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0 NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9604 +entry1 83 contig_000000000 137 60 250M = 109 -278 TTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG ;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11> NM:i:7 AS:i:222 XS:i:19 MQ:i:60 MC:Z:250M ms:i:5687 +entry2 83 contig_000000000 137 60 250M = 109 -278 GTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG 0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8804 +entry3 147 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA 9BGC0FFBGFFGGGGFFGFEGGHGHGCGHHHHGHGGHGHHHGHHHHGHHGGGHHHHFHGHGHHHHHHGHHFHHHHHHHHHGHHHHGHHGHHHHG2HHGFHHGHHHHHHDFHHHGGHHGHGHHHFHHDHHHHHHHHHHHHFHHHHHGHHHHHHHHHHHHFFHHHHGHHHHHHFHHHHHHHHHHHHHHGCGGGHHHGGGGGGGGGGGGGGGHHHHHGHHHHHHHHHHHHHGGGGGGGGGGFFFFFFFBBBBB NM:i:1 AS:i:245 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9634 +entry4 83 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA GGGGGGGGGGGGGGGGGFFGHHHHHGGHHGHHHHGFHHHHGHHHHHHHHHGGHHFEHHHHHHHHHGGHHHHHHHHHHHFHHGFHGHHHGFFHFHHHHHHHHHFHHEHHHHHHHGGHHGHGHHHHHHHHHFGGHHHHHHGFHFHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHGHHHHHHHHHHHGGGGGHHHGGGGGGGGGGGGGGGHHHHHHHGHHHHHGHHHHHGGGGGGGGGGFFFFFFFACCBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9217 +entry5 163 contig_000000000 304 60 250M = 422 368 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAG AABBBFFFFFFFGGGFGGGGGGHHHHHHHHHGHHHHHHHGGHGHHHHHHHHHHGHHHHHHHHFHFGHHHHHHHHHGHGGHFHHHHHHHHHHGFFHHHHHEHHHGHHHHHGDEEGHGHGEGGHHHHHHHHHGHHHFGHHHHHHHFGHHHHHGG?GGGAGHHFFHHFFGG2>@FGGFGFBGGHFHGHHHHHFFF?FGHHGGGGFGEGGHHGGGGHGFGDGHGHHFHEGFHGFGFFHFFHHFHGHFHBFGGF? NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9562 +entry6 69 contig_000000000 304 0 * = 304 0 GCGGTGGAACGCCGCTTCGGCAACGATCTTCCGTCGTCTCCAGTGGAGTGGCTGACGGATAATGGTTCATGCTACCGGGCTAATGAAACACGCCAGTTCGCCCGGATGTTGGGACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG BCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF AS:i:0 XS:i:0 MQ:i:49 MC:Z:35M215S ms:i:9339 +entry6 137 contig_000000000 304 49 35M215S = 304 0 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT ABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0 NM:i:0 AS:i:35 XS:i:0 MC:Z:* ms:i:9398 +entry5 83 contig_000000000 422 60 250M = 304 -368 TGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA .DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9461 +entry7 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:4569 +entry7 181 contig_000000000 3891 0 * = 3891 0 CAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG ////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8580 +entry8 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:3281 +entry8 181 contig_000000000 3891 0 * = 3891 0 GACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT 9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8542
--- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/6_remove_dups.expected.sam Fri Sep 28 04:29:07 2018 -0400 @@ -0,0 +1,12 @@ +@HD VN:1.4 SO:coordinate +@SQ SN:contig_000000000 LN:11391 +entry2 163 contig_000000000 109 60 250M = 137 278 TATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG BBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00 NM:i:2 AS:i:240 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9279 +entry3 99 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9509 +entry2 83 contig_000000000 137 60 250M = 109 -278 GTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG 0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8804 +entry3 147 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA 9BGC0FFBGFFGGGGFFGFEGGHGHGCGHHHHGHGGHGHHHGHHHHGHHGGGHHHHFHGHGHHHHHHGHHFHHHHHHHHHGHHHHGHHGHHHHG2HHGFHHGHHHHHHDFHHHGGHHGHGHHHFHHDHHHHHHHHHHHHFHHHHHGHHHHHHHHHHHHFFHHHHGHHHHHHFHHHHHHHHHHHHHHGCGGGHHHGGGGGGGGGGGGGGGHHHHHGHHHHHHHHHHHHHGGGGGGGGGGFFFFFFFBBBBB NM:i:1 AS:i:245 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9634 +entry5 163 contig_000000000 304 60 250M = 422 368 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAG AABBBFFFFFFFGGGFGGGGGGHHHHHHHHHGHHHHHHHGGHGHHHHHHHHHHGHHHHHHHHFHFGHHHHHHHHHGHGGHFHHHHHHHHHHGFFHHHHHEHHHGHHHHHGDEEGHGHGEGGHHHHHHHHHGHHHFGHHHHHHHFGHHHHHGG?GGGAGHHFFHHFFGG2>@FGGFGFBGGHFHGHHHHHFFF?FGHHGGGGFGEGGHHGGGGHGFGDGHGHHFHEGFHGFGFFHFFHHFHGHFHBFGGF? NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9562 +entry6 69 contig_000000000 304 0 * = 304 0 GCGGTGGAACGCCGCTTCGGCAACGATCTTCCGTCGTCTCCAGTGGAGTGGCTGACGGATAATGGTTCATGCTACCGGGCTAATGAAACACGCCAGTTCGCCCGGATGTTGGGACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG BCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF AS:i:0 XS:i:0 MQ:i:49 MC:Z:35M215S ms:i:9339 +entry5 83 contig_000000000 422 60 250M = 304 -368 TGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA .DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9461 +entry7 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:4569 +entry7 181 contig_000000000 3891 0 * = 3891 0 CAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG ////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8580 +entry8 181 contig_000000000 3891 0 * = 3891 0 GACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT 9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8542
--- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/6_remove_dups.sam Fri Sep 28 04:29:07 2018 -0400 @@ -0,0 +1,18 @@ +@HD VN:1.4 SO:coordinate +@SQ SN:contig_000000000 LN:11391 +entry1 163 contig_000000000 109 60 250M = 137 278 GATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG 1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00 NM:i:18 AS:i:164 XS:i:0 MQ:i:60 MC:Z:250M ms:i:6744 +entry2 163 contig_000000000 109 60 250M = 137 278 TATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG BBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00 NM:i:2 AS:i:240 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9279 +entry3 99 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9509 +entry4 163 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0 NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9604 +entry1 83 contig_000000000 137 60 250M = 109 -278 TTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG ;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11> NM:i:7 AS:i:222 XS:i:19 MQ:i:60 MC:Z:250M ms:i:5687 +entry2 83 contig_000000000 137 60 250M = 109 -278 GTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG 0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8804 +entry3 147 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA 9BGC0FFBGFFGGGGFFGFEGGHGHGCGHHHHGHGGHGHHHGHHHHGHHGGGHHHHFHGHGHHHHHHGHHFHHHHHHHHHGHHHHGHHGHHHHG2HHGFHHGHHHHHHDFHHHGGHHGHGHHHFHHDHHHHHHHHHHHHFHHHHHGHHHHHHHHHHHHFFHHHHGHHHHHHFHHHHHHHHHHHHHHGCGGGHHHGGGGGGGGGGGGGGGHHHHHGHHHHHHHHHHHHHGGGGGGGGGGFFFFFFFBBBBB NM:i:1 AS:i:245 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9634 +entry4 83 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA GGGGGGGGGGGGGGGGGFFGHHHHHGGHHGHHHHGFHHHHGHHHHHHHHHGGHHFEHHHHHHHHHGGHHHHHHHHHHHFHHGFHGHHHGFFHFHHHHHHHHHFHHEHHHHHHHGGHHGHGHHHHHHHHHFGGHHHHHHGFHFHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHGHHHHHHHHHHHGGGGGHHHGGGGGGGGGGGGGGGHHHHHHHGHHHHHGHHHHHGGGGGGGGGGFFFFFFFACCBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9217 +entry5 163 contig_000000000 304 60 250M = 422 368 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAG AABBBFFFFFFFGGGFGGGGGGHHHHHHHHHGHHHHHHHGGHGHHHHHHHHHHGHHHHHHHHFHFGHHHHHHHHHGHGGHFHHHHHHHHHHGFFHHHHHEHHHGHHHHHGDEEGHGHGEGGHHHHHHHHHGHHHFGHHHHHHHFGHHHHHGG?GGGAGHHFFHHFFGG2>@FGGFGFBGGHFHGHHHHHFFF?FGHHGGGGFGEGGHHGGGGHGFGDGHGHHFHEGFHGFGFFHFFHHFHGHFHBFGGF? NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9562 +entry6 69 contig_000000000 304 0 * = 304 0 GCGGTGGAACGCCGCTTCGGCAACGATCTTCCGTCGTCTCCAGTGGAGTGGCTGACGGATAATGGTTCATGCTACCGGGCTAATGAAACACGCCAGTTCGCCCGGATGTTGGGACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG BCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF AS:i:0 XS:i:0 MQ:i:49 MC:Z:35M215S ms:i:9339 +entry6 137 contig_000000000 304 49 35M215S = 304 0 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT ABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0 NM:i:0 AS:i:35 XS:i:0 MC:Z:* ms:i:9398 +entry5 83 contig_000000000 422 60 250M = 304 -368 TGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA .DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9461 +entry7 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:4569 +entry7 181 contig_000000000 3891 0 * = 3891 0 CAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG ////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8580 +entry8 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:3281 +entry8 181 contig_000000000 3891 0 * = 3891 0 GACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT 9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8542
--- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/7_mark_supp_dup.expected.sam Fri Sep 28 04:29:07 2018 -0400 @@ -0,0 +1,25 @@ +@HD VN:1.4 SO:coordinate +@SQ SN:contig_000000000 LN:11391 +@SQ SN:contig_000000008 LN:29043 +entry1 1187 contig_000000000 109 60 250M = 137 278 GATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG 1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00 NM:i:18 AS:i:164 XS:i:0 MQ:i:60 MC:Z:250M ms:i:6744 +entry2 163 contig_000000000 109 60 250M = 137 278 TATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG BBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00 NM:i:2 AS:i:240 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9279 +entry3 99 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9509 +entry4 1187 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0 NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9604 +entry1 1107 contig_000000000 137 60 250M = 109 -278 TTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG ;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11> NM:i:7 AS:i:222 XS:i:19 MQ:i:60 MC:Z:250M ms:i:5687 +entry2 83 contig_000000000 137 60 250M = 109 -278 GTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG 0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8804 +entry3 147 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA 9BGC0FFBGFFGGGGFFGFEGGHGHGCGHHHHGHGGHGHHHGHHHHGHHGGGHHHHFHGHGHHHHHHGHHFHHHHHHHHHGHHHHGHHGHHHHG2HHGFHHGHHHHHHDFHHHGGHHGHGHHHFHHDHHHHHHHHHHHHFHHHHHGHHHHHHHHHHHHFFHHHHGHHHHHHFHHHHHHHHHHHHHHGCGGGHHHGGGGGGGGGGGGGGGHHHHHGHHHHHHHHHHHHHGGGGGGGGGGFFFFFFFBBBBB NM:i:1 AS:i:245 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9634 +entry4 1107 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA GGGGGGGGGGGGGGGGGFFGHHHHHGGHHGHHHHGFHHHHGHHHHHHHHHGGHHFEHHHHHHHHHGGHHHHHHHHHHHFHHGFHGHHHGFFHFHHHHHHHHHFHHEHHHHHHHGGHHGHGHHHHHHHHHFGGHHHHHHGFHFHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHGHHHHHHHHHHHGGGGGHHHGGGGGGGGGGGGGGGHHHHHHHGHHHHHGHHHHHGGGGGGGGGGFFFFFFFACCBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9217 +entry5 163 contig_000000000 304 60 250M = 422 368 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAG AABBBFFFFFFFGGGFGGGGGGHHHHHHHHHGHHHHHHHGGHGHHHHHHHHHHGHHHHHHHHFHFGHHHHHHHHHGHGGHFHHHHHHHHHHGFFHHHHHEHHHGHHHHHGDEEGHGHGEGGHHHHHHHHHGHHHFGHHHHHHHFGHHHHHGG?GGGAGHHFFHHFFGG2>@FGGFGFBGGHFHGHHHHHFFF?FGHHGGGGFGEGGHHGGGGHGFGDGHGHHFHEGFHGFGFFHFFHHFHGHFHBFGGF? NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9562 +entry6 1093 contig_000000000 304 0 * = 304 0 GCGGTGGAACGCCGCTTCGGCAACGATCTTCCGTCGTCTCCAGTGGAGTGGCTGACGGATAATGGTTCATGCTACCGGGCTAATGAAACACGCCAGTTCGCCCGGATGTTGGGACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG BCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF AS:i:0 XS:i:0 MQ:i:49 MC:Z:35M215S ms:i:9339 +entry6 1161 contig_000000000 304 49 35M215S = 304 0 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT ABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0 NM:i:0 AS:i:35 XS:i:0 MC:Z:* ms:i:9398 +entry5 83 contig_000000000 422 60 250M = 304 -368 TGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA .DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9461 +entry7 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:4569 +entry7 181 contig_000000000 3891 0 * = 3891 0 CAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG ////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8580 +entry8 1145 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:3281 +entry8 1205 contig_000000000 3891 0 * = 3891 0 GACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT 9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8542 +entry9 1187 contig_000000008 28855 12 54S189M7S = 28855 189 CAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATGTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGTGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT BCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF1EGGHHHHHGCEFEEGFHFHFHFHHHH4444?44FE4B4?4D44D444433B20/??FH2?/?/32222D2FB//F>2FDHF00???/??CHGGGHFHBGHB<>1<<1DF1D0=<0FDGB0=000</<.G:CHB:.;;000;00CH0;0;0;00; NM:i:3 AS:i:174 XS:i:159 SA:Z:contig_000000008,28949,+,95M155S,12,1; MQ:i:30 MC:Z:34S189M27S ms:i:8529 +entry10 99 contig_000000008 28855 15 54S189M7S = 28855 189 CAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT DDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHHEHGHHHHHGHGFFGGHHFHHHHHHHHHHGFEFDFHHHHHHHHHHHHGHFGFHHFEHDGGHCCFEHFHHFHHHHH/FFFHGHHHCCGGGGFHGHGHHHHHHEDDFDHFFHHHHFGHFGFDHDGEDFHHCEECFGHEEFAHFCGH1CF1E1FBFFGF NM:i:1 AS:i:184 XS:i:164 SA:Z:contig_000000008,28949,+,95M155S,15,1; MQ:i:32 MC:Z:34S189M27S ms:i:8035 +entry9 1107 contig_000000008 28855 30 34S189M27S = 28855 -189 TACTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA :0FGEEGGGGGGEEHHHHC:00C:CGGGC0GBFGD0<DHFEHHHD=00<<.1<0GFE.FCG1FDF11BHGFCAHFFBFCEGCF</HFDGDHDFFB22GDHFHHG4?3?B?4?4F4FFH?D4BF3/333HHGGEEGBHBHHFFHEHHEGF2HHFEGHGGGHHFHHHFDGBAHHFHHHHHFHFHHFGHHEHHHHGHG5HHGGGGGHGHGHHHHHHHHHHHHHHHGFHHHGGGGGGGGGGGFFFFFFFDDDDD NM:i:1 AS:i:184 XS:i:145 MQ:i:12 MC:Z:54S189M7S ms:i:7507 +entry10 147 contig_000000008 28855 32 34S189M27S = 28855 -189 TGTTTTGTTGGGTTGTTTTTTACATTTATTTAGTTATTTATATTATATCTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTTCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA <:.:.<.EEA..A:<-000<00000<:000DGFDH0H=0HD00H===.10.11<BCDHGGDGHF11GBFHEFEFGCFF//C/FA?AHEGFDG?B?BD3GG4FHHGDDG4BHDFHEDEF?F4?GB/3B3HGGHGHHHHHHHFHHHHHHFB3HFEGGHGCGHGHHGFGG5BHHHGHFFHHBFGHFHHF5FHHHHHHGDHG2G5FHHGHGHHHHHHHHHHHHHHHGGHHHGGGGGGGGGGGFFFFFFFCDDDC NM:i:2 AS:i:179 XS:i:137 MQ:i:15 MC:Z:54S189M7S ms:i:9375 +entry9 3235 contig_000000008 28949 12 95M155H = 28855 95 CAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT BCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF NM:i:1 AS:i:90 XS:i:0 SA:Z:contig_000000008,28855,+,54S189M7S,12,3; +entry10 2147 contig_000000008 28949 15 95M155H = 28855 95 CAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT DDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHH NM:i:1 AS:i:90 XS:i:0 SA:Z:contig_000000008,28855,+,54S189M7S,15,1;
--- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/7_mark_supp_dup.sam Fri Sep 28 04:29:07 2018 -0400 @@ -0,0 +1,25 @@ +@HD VN:1.4 SO:coordinate +@SQ SN:contig_000000000 LN:11391 +@SQ SN:contig_000000008 LN:29043 +entry1 163 contig_000000000 109 60 250M = 137 278 GATTGATATTTATTTATTATTTTATTATGTTTATTTCTTTATTTATTATCATTATTATTATTATTCTTATTATTGTTATATAAAAACATCGTAAACACAGTAAACGATAGTACTAATACTACTACTAATAAAGATAGATTTTTTTATATATATATATGTATGATCTTTTAACGTTACTTATTCAAATGCTATGTCATTTTGTAATATTTGTCATGGCAAGTATCAAACTGCTTCGGTTCTCATTGATTAG 1111>DD3DFFF3B333B3FBG3D3A33BG3D3F3333AFG3DF3D33B22D22222222D2B2A2ADE2AA2DAG222BD22D11//11//00B110ABB2FD1?>/>A2@2@2@F2@F21GB11FDDF21111111B2B11>/?1FB22>>>22>B2BG22B12B>F>11/0<0/2B2222B2@G11>22@22@G222201?1??1<?DF1FG1001<1>1F1=11>111>1-....000=0000=00 NM:i:18 AS:i:164 XS:i:0 MQ:i:60 MC:Z:250M ms:i:6744 +entry2 163 contig_000000000 109 60 250M = 137 278 TATTGATATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATACAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCATGTATCAAACTGCCTGGGTTATCATTGATTAG BBBBB5F5DFFFGGGFGGGGGGHHHHHHHHHGHHGHHHHHHHHHHHHGGHHHHHHHEHHGHHGHHFHHHHHGHHHHHFHHHD5A33FBGBFHGGGFGGEGGGBGGAEGAEHH5GD5FEGFD5GGFGHFHE4GHGGHHHHHHHDEEA?FGHHGHGHFBEFFHEGHH4GGHHCFFFHHFHHHHHHBFHG1FFBFF01BGHHHFCFF@1GHHBGGFHFF1?1?FBGGF11FD110FG.<FFGGH1FGH0DG00 NM:i:2 AS:i:240 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9279 +entry3 99 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BBBBBFFFFFFFGGGGGGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGGHHHHHHHHHHHHHHHHHHGGHGGHGHHHHHGHHHHHHHHHFHHHGHHGHHHHGHHHGGHHHHHHHHHHHHHGHHHHHGHHHHIHHHIIHHHHHHHGHGHHHGHHHHGHHHGHHGHHHHGHHHHHHGHBFFHHHHHHHGHHHGHEHHHFFGGHHHHHHHEHHHFH=GHHHF NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9509 +entry4 163 contig_000000000 116 60 250M = 222 356 ATTTATTTATTATTTTATTATGTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAG BCCCCFFFFFFFGGGGGGGGGGEHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHHHHHHHHHHHHHGHHGHHHHHEEF5FEGFGFHHGHHFHHHHFHFDEGHAEGHHHFHHFHFFHHGBGGHHFHHFHFHHHGGHGHFGEFHDGGHGHHHHGDHHFFHHGHHHDFDHGHHHHHGHGBHGHHFBDHGGF2FDHHHBGD2@DHHFEHHFFHEC2<FD1GF<DDGHHB0GHAAFFCGGDHHG1FGF0DDGGFH0 NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9604 +entry1 83 contig_000000000 137 60 250M = 109 -278 TTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAGAACCTAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATTTATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCACACTGCCTGGGTTATCATTGATTCGGTACTAGAGATAGTGTTTAAATAATACG ;0C0G;0C0:0FFGDD00D==00000D=00D1D=1DDDF>11=<<1><111<?1<111?1D1??00<>@@11F//0A>2HG>B>2B22222B2FFB2BB22>>2B22BFBEEFGHHG2FGBB22FFB2DB1100F/1FG@G1BHHFGGAGB1DB@22EB00GCEADB1AFHHHGD21BEDF1AF1FA11DAA221BD1AA/EF00FF1FF2EDEBGEA0B03AD3D33AB1A1GEFGEFB3DB31>>11> NM:i:7 AS:i:222 XS:i:19 MQ:i:60 MC:Z:250M ms:i:5687 +entry2 83 contig_000000000 137 60 250M = 109 -278 GTTTATTTATTTATTTATTATCATTATTATTATTATTATTATTATTGTTATATAAAAACATAGTAAACACAGTAAACGATAGTAGTAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAG 0GHHHBD0DFGHHHG<D0FD0BD0FHHHG=GGBGG1DGDGHFFGFDHDHGFGAGGHHHGHHHHHHHGGFHHHEGHHGHHGHHGHHHHDBHHHHHHGFGHHHHFHHHFHFG@EBGG4BHGGHHHHHHHHGHHHHHHGHFGBHHHHHHHHHHFHFFHHHHEHFHHHHHHGAFHHHFGHHG2HFHHHGHHHHHHHGHEHHHHGEHGHGHHHHGHHHHHHHHHHHHHGFGHFGFGGGGGGGGFFFFFDFBBBBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8804 +entry3 147 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGCCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA 9BGC0FFBGFFGGGGFFGFEGGHGHGCGHHHHGHGGHGHHHGHHHHGHHGGGHHHHFHGHGHHHHHHGHHFHHHHHHHHHGHHHHGHHGHHHHG2HHGFHHGHHHHHHDFHHHGGHHGHGHHHFHHDHHHHHHHHHHHHFHHHHHGHHHHHHHHHHHHFFHHHHGHHHHHHFHHHHHHHHHHHHHHGCGGGHHHGGGGGGGGGGGGGGGHHHHHGHHHHHHHHHHHHHGGGGGGGGGGFFFFFFFBBBBB NM:i:1 AS:i:245 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9634 +entry4 83 contig_000000000 222 60 250M = 116 -356 TAATACTACTACTAATAAATATATATTTTTTTATATATATATATGTATGTTCTTTTAATGTTAATTTTTCAAATGCTTTGGCATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTA GGGGGGGGGGGGGGGGGFFGHHHHHGGHHGHHHHGFHHHHGHHHHHHHHHGGHHFEHHHHHHHHHGGHHHHHHHHHHHFHHGFHGHHHGFFHFHHHHHHHHHFHHEHHHHHHHGGHHGHGHHHHHHHHHFGGHHHHHHGFHFHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHHHGHHHHHHHHHHHGGGGGHHHGGGGGGGGGGGGGGGHHHHHHHGHHHHHGHHHHHGGGGGGGGGGFFFFFFFACCBB NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9217 +entry5 163 contig_000000000 304 60 250M = 422 368 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGCCTGGGTTATCATTGATTAGGTACTAGAGATAGTGTTTAAATAATAAGTGTCCATCAAAGAGCAGAACAGCTGCGTGTTTGCGTGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAG AABBBFFFFFFFGGGFGGGGGGHHHHHHHHHGHHHHHHHGGHGHHHHHHHHHHGHHHHHHHHFHFGHHHHHHHHHGHGGHFHHHHHHHHHHGFFHHHHHEHHHGHHHHHGDEEGHGHGEGGHHHHHHHHHGHHHFGHHHHHHHFGHHHHHGG?GGGAGHHFFHHFFGG2>@FGGFGFBGGHFHGHHHHHFFF?FGHHGGGGFGEGGHHGGGGHGFGDGHGHHFHEGFHGFGFFHFFHHFHGHFHBFGGF? NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9562 +entry6 69 contig_000000000 304 0 * = 304 0 GCGGTGGAACGCCGCTTCGGCAACGATCTTCCGTCGTCTCCAGTGGAGTGGCTGACGGATAATGGTTCATGCTACCGGGCTAATGAAACACGCCAGTTCGCCCGGATGTTGGGACTTGAACCGAAGAACACGGCGGTGCGGAGTCCGGAGAGTAACGGAATAGCAGAGAGCTTCGTGAAAACGATAAAGCGTGACTACATCAGTATCATGCCCAAACCAGACGGGTTAACGGCAGCAAAGAACCTTGCAG BCCCBCBCFFDDGGGGGGGGGGGHGGHHHHHHGHHGGGHHHHHHHHHHHHGGHGGHGGGGGHHHHHHHHHHHHHHHGGGGGHHHHHHHHHHGGGGGHHHGGGGGGDGGHHHHGHHGHHHGHHGGGGGGGHHGGGGGGGGGGAGGGGGGDGAGFGGGGFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFBEFFFFFFFFFEFFFFFFEFFFFFF AS:i:0 XS:i:0 MQ:i:49 MC:Z:35M215S ms:i:9339 +entry6 137 contig_000000000 304 49 35M215S = 304 0 ATTTTGTAACATTTGTCATGCCAAGTATCAAACTGGATTTGCCCCTATATTTCCAGACATCTGTTATCACTTAACCCATTACAAGCCCGCTGCCGCAGATATTCCCGTGGCGAGCGATAACCCAGCGCACTATGCGGATGCCATTCGTTATAATGCTCGAACGCCTCTGCAAGGTTCTTTGCTGCCGTTAACCCGTCTGGTTTGGGCATGATACTGATGTAGTCACGCTTTATCGTTTTCACGAAGCTCT ABBBBFFFFFFFGGGGGGGGGGHHHHHHHHGHGHHHHHHHGHHHGHGHHHHHHFGHHGHHHIHHHHHIHHHHHHHHHGHHHHHHHHGHGGGGGHGGGGGHHHHHHHGG1EGGGGGGFHGGHHHGHGGGGGGHHHHGGCGFHHGHHHHFHEHHHHHHHGGGHHGGGHGEGHGFHGCGCFHHHHHHHGGGGD?FFGA9EFFGCGG?AGGFGGGGGGFFFFFFFFFFFFFFFFFBFFEF?FEBBFED.ACFF0 NM:i:0 AS:i:35 XS:i:0 MC:Z:* ms:i:9398 +entry5 83 contig_000000000 422 60 250M = 304 -368 TGTGTGTGTGTGTGAGTTTGAAAGCAATAGACAGAGGGTAAGACTGTGTAATAGAGTGTAAGAGAGTGTCAGAGTGAGTGTGTAAATGGACGCCTATCATTTAGCATGGGTCAATCTAGTGAAAGCTCGCAGCAGCTCTCTAAGTGTCTGGCATTGCAGCAAATTGAGCCGAATGCATTTCTGCACACGTAAACACGGCAGAATACAGATTAGCCAAGCCCAATCTCTCATTAAATCCACATTTAATAGA .DDFGEAGGGFGFHGHHFFHHHHHHHHHHGCHHHHHHFFHHHHHHHHHHHHHHHHHHGHHFHHHHHHGHHHHHHHHHGHHHHHHHHGGGGGHGHHHFHHHHFHHHHHHHHHGHHHHHHHHHHHEEEEGHHHHHHHGHHHHHHHHHGHGHHHHHHHHHHHHHHHHHGGGHHHHHHHHHHHHHHHHHHHGHFHHHGGGHHHHHHHHHHHHHHGHHGGHHHHHHFHEFCHHGGGGGGGGGGFFFFFFFCCCCC NM:i:0 AS:i:250 XS:i:0 MQ:i:60 MC:Z:250M ms:i:9461 +entry7 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;GFC/0FC;/AFGFC0BDA.?BGFFC0FB9G0C/HHGBFHG:.GFCGEHGHGHFHHHEFHHGBGDF1EHF1GFGGFDFHFHHHFHHG1BG1HHGHHEHGBC>2<2HHHHFHHFHHHHFEGD2EFHHGEF4EHHFFG?/GGF3GFFCE3HGHFHGAHFGF1AGHHGGHHGD5HGF3HF3HHFHHHGHG1FEHHHFHHHEHHGFHHHFHHHHFGGCECEEGHHHGHHHGGGGFGGFFGFFF4BBBBBABB NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:4569 +entry7 181 contig_000000000 3891 0 * = 3891 0 CAGTCACTCGCCTCCCGCTAACAGTCCAACTCTTCTGGTTCATCTGCGAGTCATGGTGTACCGATGTTTTGTTCTCTAGAAAGCGAAAACATTGATATGGCTGAGGGGGGCTAGCAATTTTGGCCTGATAATGGGTGTGAAATATTCAAACTGTTATGATGCTAGCCCAAATAAAACTGTTGGGACTATCTCGGGAAGAAAAATCATGATCAGAGAAGCTAGGAAAGTGTCCTTGGTATGGTAAGCACTG ////-------;----0090;.9/0/000A//::.;.0000::.?@<=0/0=0./00..<..11>00>>0111<?111<////<20GF@212222<1F011B?//<E0FGFB211B1?0/??01BB22210?>?1@222B22@211122B11E@22112110000/B222A222ADB//0FB2DDBA///A/01D11011ADD211D1211BA11A311331D1A10B1FAFB1A1B3111@33111>11 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8580 +entry8 121 contig_000000000 3891 60 250M = 3891 0 ACACCACCAGCACCAGCCTAAACCGTTGATACAAGGCAGGATGGATCCGTGCTTTCATGTTGTTGATGCTAAATTCTGACTCACATCTGAATATTCCAGCAGAAATCGAGACTCATCAGAGCAGGCAACGTTTTTACAATCTTTTATTGTCCAATTTTGGTGAGCCTGTGTGAATTGTAGTCTCAGTTTCCTGTTCTTAGCTGACAGGAGTGGCACCCGGTGTGGTCTTCTGCTGCTGTAGCCCATCCGC 99;.9//FFF9/GFB9FBGBC.A.FCFGFGFBHHGB:0GHFCG-AA@CHGC0FFGGC.HC>><BGFFHHGGHEHFHHFGFFGHHGF1?11<1HHG<CFGBFGEHFGFGDHHG2FGEHFHCGGDGGHGFGGFDFHHFHHGGFHGEEHFBGEHHHGGEFHHHHGAGHFE1BFHHHGHGGGFHFHFDDFFCAEFFGEFHHHHHHFHGGBFHFHFFEEA?CEEAHHHHHCGF0CFFGFFF1FFF1AA@DAAA@A NM:i:0 AS:i:250 XS:i:0 MC:Z:* ms:i:3281 +entry8 181 contig_000000000 3891 0 * = 3891 0 GACGGCGCCTGGAGCGCGTAGGCAAAGCATGATCATCTGAGCACGGCGAACGAGAGTCAGACAAAGGGTTGATCGCCAGTAACGCTCGAGAAAGACACTCCCCCGCAACAACAATCAAACCAACAGTGCACTTTCATTTGCGAATCATGGAATAATGTTGGTTTGGGCTGTAGAAGGCCAAGATATATAAATTGCTGTAGAGGGTTGGGCATGTGGACCGTAAAATGGGTGGGAAGTATAAGAACTTTGT 9;-----/;;--------/;9//////////////////-9------;...C09000;00090/...90.;---./00....-..<.000=0<00..---////1</00211221/B?//122011211111B111//>//2221122222@11>///CE?>/>//1112211111012B22222AD22110011111B/0A///B01111111ABB0013ED10FE1B111333A3333@33D>>1111 AS:i:0 XS:i:0 MQ:i:60 MC:Z:250M ms:i:8542 +entry9 163 contig_000000008 28855 12 54S189M7S = 28855 189 CAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATGTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGTGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT BCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF1EGGHHHHHGCEFEEGFHFHFHFHHHH4444?44FE4B4?4D44D444433B20/??FH2?/?/32222D2FB//F>2FDHF00???/??CHGGGHFHBGHB<>1<<1DF1D0=<0FDGB0=000</<.G:CHB:.;;000;00CH0;0;0;00; NM:i:3 AS:i:174 XS:i:159 SA:Z:contig_000000008,28949,+,95M155S,12,1; MQ:i:30 MC:Z:34S189M27S ms:i:8529 +entry10 99 contig_000000008 28855 15 54S189M7S = 28855 189 CAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGT DDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHHEHGHHHHHGHGFFGGHHFHHHHHHHHHHGFEFDFHHHHHHHHHHHHGHFGFHHFEHDGGHCCFEHFHHFHHHHH/FFFHGHHHCCGGGGFHGHGHHHHHHEDDFDHFFHHHHFGHFGFDHDGEDFHHCEECFGHEEFAHFCGH1CF1E1FBFFGF NM:i:1 AS:i:184 XS:i:164 SA:Z:contig_000000008,28949,+,95M155S,15,1; MQ:i:32 MC:Z:34S189M27S ms:i:8035 +entry9 83 contig_000000008 28855 30 34S189M27S = 28855 -189 TACTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA :0FGEEGGGGGGEEHHHHC:00C:CGGGC0GBFGD0<DHFEHHHD=00<<.1<0GFE.FCG1FDF11BHGFCAHFFBFCEGCF</HFDGDHDFFB22GDHFHHG4?3?B?4?4F4FFH?D4BF3/333HHGGEEGBHBHHFFHEHHEGF2HHFEGHGGGHHFHHHFDGBAHHFHHHHHFHFHHFGHHEHHHHGHG5HHGGGGGHGHGHHHHHHHHHHHHHHHGFHHHGGGGGGGGGGGFFFFFFFDDDDD NM:i:1 AS:i:184 XS:i:145 MQ:i:12 MC:Z:54S189M7S ms:i:7507 +entry10 147 contig_000000008 28855 32 34S189M27S = 28855 -189 TGTTTTGTTGGGTTGTTTTTTACATTTATTTAGTTATTTATATTATATCTCAACCAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTTCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGTACTTTGTTGGGTTGTTTATAACCTTTA <:.:.<.EEA..A:<-000<00000<:000DGFDH0H=0HD00H===.10.11<BCDHGGDGHF11GBFHEFEFGCFF//C/FA?AHEGFDG?B?BD3GG4FHHGDDG4BHDFHEDEF?F4?GB/3B3HGGHGHHHHHHHFHHHHHHFB3HFEGGHGCGHGHHGFGG5BHHHGHFFHHBFGHFHHF5FHHHHHHGDHG2G5FHHGHGHHHHHHHHHHHHHHHGGHHHGGGGGGGGGGGFFFFFFFCDDDC NM:i:2 AS:i:179 XS:i:137 MQ:i:15 MC:Z:54S189M7S ms:i:9375 +entry9 2211 contig_000000008 28949 12 95M155H = 28855 95 CAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT BCCBBFFCBCCFGGGGGGGGGGGHHHHHHHHGGGGGHHHHHHHHHHHHF5DGG5BGFDG5GFHFEHF5F553GHA1GEGHFEAFAF5FEGHFHFF NM:i:1 AS:i:90 XS:i:0 SA:Z:contig_000000008,28855,+,54S189M7S,12,3; +entry10 2147 contig_000000008 28949 15 95M155H = 28855 95 CAGTTGGGTTAAATATTTGGTGCTTTGTTGGGTTGTTTATAACCTTTATTTAGTTATTTATATTATAACTCAACCAGTTGGGTTAAATATTTGGT DDECDFFDCCCFGGGGGGGGGGHHHHHHHHHGGGGGHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHGHHHHHGGGHHHHHHHHHHH NM:i:1 AS:i:90 XS:i:0 SA:Z:contig_000000008,28855,+,54S189M7S,15,1;