changeset 2:31a442afee19 draft default tip

planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/main/tools/ucsc_tools/axttomaf commit 27e5f0847b96c0fef7548d3606dd3958ebda7d1f
author iuc
date Thu, 26 Sep 2024 16:52:37 +0000
parents f063c97a7f8f
children
files axttomaf.xml test-data/2.axt test-data/hg38.noprefix.fasta.fai test-data/mm39.noprefix.fasta.fai
diffstat 4 files changed, 107 insertions(+), 1 deletions(-) [+]
line wrap: on
line diff
--- a/axttomaf.xml	Sun Sep 22 07:26:54 2024 +0000
+++ b/axttomaf.xml	Thu Sep 26 16:52:37 2024 +0000
@@ -1,9 +1,21 @@
-<tool id="ucsc_axtomaf" name="axtToMaf" version="@TOOL_VERSION@+galaxy0" profile="21.05" license="MIT">
+<tool id="ucsc_axtomaf" name="axtToMaf" version="@TOOL_VERSION@+galaxy1" profile="21.05" license="MIT">
     <description>
         Convert dataset from axt to MAF format
     </description>
     <macros>
         <token name="@TOOL_VERSION@">469</token>
+        <xml name="sanitize_query">
+            <sanitizer>
+                <valid initial="string.printable">
+                    <remove value=" "/>
+                    <remove value="&apos;" />
+                </valid>
+                <mapping initial="none">
+                    <add source=" " target=""/>
+                    <add source="&apos;" target="&apos;&quot;&apos;&quot;&apos;"/>
+                </mapping>
+            </sanitizer>
+        </xml>
     </macros>
     <xrefs>
         <xref type="bio.tools">UCSC_Genome_Browser_Utilities</xref>
@@ -25,6 +37,14 @@
         #else:
             '$query_reference_index_source.que_ref_index_file.fields.path'
         #end if
+        #if str($t_prefix)
+            -tPrefix='$t_prefix'
+        #end if
+        #if str($q_prefix)
+            -qPrefix='$q_prefix'
+        #end if
+        $score
+        $scoreZero
         '$out'
     ]]></command>
     <inputs>
@@ -60,6 +80,14 @@
             </when>
         </conditional>
 
+        <param name="t_prefix" type="text" optional="true" label="add this to start of TARGET sequence name in maf" help="Typically organism name and a dot (hg38.) is used">
+            <expand macro="sanitize_query"/>
+        </param>
+        <param name="q_prefix" type="text" optional="true" label="add this to start of QUERY sequence name in maf" help="Typically organism name and a dot (mm10.) is used">
+            <expand macro="sanitize_query"/>
+        </param>
+        <param argument="-score" type="boolean" truevalue="-score" falsevalue="" label="Recalculate score" />
+        <param argument="-scoreZero" type="boolean" truevalue="-scoreZero" falsevalue="" label="Recalculate score if zero" />
     </inputs>
     <outputs>
         <data name="out" format="maf" />
@@ -78,6 +106,20 @@
             <output name="out" file="1.maf"/>
         </test>
         <test>
+            <param name="in_axt" value="2.axt"/>
+            <conditional name="target_reference_index_source">
+                <param name="target_reference_index_source_selector" value="history" />
+                <param name="in_tar_ref_index" value="hg38.noprefix.fasta.fai"/>
+            </conditional>
+            <conditional name="query_reference_index_source">
+                <param name="query_reference_index_source_selector" value="history" />
+                <param name="in_que_ref_index" value="mm39.noprefix.fasta.fai"/>
+            </conditional>
+            <param name="t_prefix" value="hg38." />
+            <param name="q_prefix" value="mm39." />
+            <output name="out" file="1.maf"/>
+        </test>
+        <test>
             <param name="in_axt" value="1.axt"/>
             <conditional name="target_reference_index_source">
                 <param name="target_reference_index_source_selector" value="cached" />
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/2.axt	Thu Sep 26 16:52:37 2024 +0000
@@ -0,0 +1,19 @@
+0 chr1 52448 53340 chr2 111209343 111210259 + 33103
+GCCAATGGATAGAGTAAATAATTCTGCGGTATCTAAATTTGTATTGATTGGACTTTCAAGCTCTTGGGAGATGCATCTTTTTCTTTTTTGGTTCTTCTCTGTGTTCTACATGGGAATTATCCTGGAAAATCTCTTCATTGTGTTCACAGTAATTATTGACTCTCATTTA-AATTCCCCAGGTACTGCCTACTGGCCAACATTTATCTTCTTGATCTGGG----TCTTCTCCTACAGT-------------TCTGACTTTTTCACTAACTGCAGCATCATTTCTTTTCCAAGATGCATCATACAGATATTTTTCATTTGTGTCATGCGTAAAAATTGAGATGGTGCTGCTCATAACCATGGCATAGAGCAGGTACACTGCCAATCTGTAAGCCTCCCCATTACCTGACCACAATGAACCCCAAAATGTGTGTTTCCTTTGT---TGGAGGCATCCTGGATAGTCAGGATAATCCATGCTGTATCTCAGTTTGTTTTTGCCATAAACTTGCCTTTTTGTGGCCCTAATAGAGTAGGTAGTTTTCACTGTGATTTTCCTTATGTCATGAAACTTGCTTGTGTAGACACTTACAAACTAGAGGTTGTAGTCACTGCTAACAGTGGGCTTATATCCATAGCTACCTGTTTCTTATTAATAATATCCTATATTTTCATTTCGGTAACCGTCTAGAATCCTTCTTCAGGAGACTTATCTAAAGCATTTGT-GTCATGTTAGATCACATCACAGTAGGGATTTTGTTTTTTATGCCATGTATATTTCTGTATGTGTAGCCTTTGCCTAAAACAACACATGATTAATATTTGTTCATTGTTCCTTTTGCTATCACCCCTG--------TCTAGGATCTACACATTAAGAAACAAAGACATGAACGTCTCCATGGAAAGACTGGGAAAATGGA
+GTCAATGGATCAAATAAATGAAACTGTAGCTTTTGAATTTGTGTTGTTGGGACTCTCCAGTTCTTGGAAAAATACAATTTTTCTCATGTCCACCTTCTCTTTGCTCTATGTAAGCATCATCGTGGGAAACCTTTTCATTGTCTTTTTGGTAATTAATGACTCCCGTTTACAGTCTCCTATGTATTTTCTTTTGGCCAATCTGTCCCTCATTGATGTTGGACTTTCCTCTACCACAGTGCCCAAGATGATCTCAGATCTTCTGAAAGAGCACAAAGTAATATCTTTCCACAGTTGCATGACTCAGATCTGCTCCATCCACATTATG-GGAGGAGTGGAGATGGTGCTGCTCATAGCCATGGCGTTTGACAGGTACACGGCCA-TCTGTAAGCCTCTGCACTACATGAGCATCATGAGCCCTAGAATATGCATTTCATTTGTAATTGCTGGC----TGGGTCACTGGAGTGGTCCATGCCATGTCACAGTTCTCTTTTGTTGTGAACCTGCCTTTTTGTGGTCCTAACAAAGTGGACAGCTTTTACTGCGACTTCCCTCGAATCATACAACTGGCATGCACGGATAGAGACACATTTGAGTTTGTTGTTGCTGCCAACAGTGGCTTCATGACCTTGGGGACCTTCTTCTTGCTTCTCCTCTCCTATGTCTTCATTTTGGTCACAGTCTGGCAAAGGTCTTCAGGGGACTTGTCAAAGGCGCTTGTCACTCTGTCAGCTCACATCACTGTGGTTGTTCTGTTTTTTACTCCATGCATGTTTCTCTATGTGTGGCCTTTCCCCACATCATCGACTGACAAATACCTGTTCATTGTTGACTTTGCTGTCACCCCTGCTCTTAATCCTGTCATCTATACTTTAAGGAACAAAGATATGAAGGAAGCCATAAAAAAGCTGAGCAAGCAGA
+
+1 chr1 56555 58924 chr2 111303515 111305845 + 43395
+CACATTATTCTGCAGTTTTTATCTTGCTTACGTATTTTTGGAATGTTACTATTTTTCAAAAATTAATTTGGGATCAACCAACACTTCTTATTCTGCTGCTGTTCTAGAGAAAATCATTTTCCTCATTTCTGAACAAGAGAAAATGAAAT-----------------ACAGCTCTAAACAAATGCCACTGTAAACCAAGGTGGAGCCTTTGCACTTTCAGGCCACCATGATAACCT---GGAGATTAGATTTTTCTGTGTCTTTATATCAATAATAAAGCCAAGCTTCTCCAGGGGTATCCACTAGGCTTGTCTCAATGGCTCAATACAGGTCCTTTTGTGAATGATTACCTCACCCTCATGGAAACACACTCTT-GTTACAGAAACTCAGAATGATTCTATTTTTTCTTTTATATTTGTATATGTTTTTCCAATACCTCTGAAAAAACTGATCCAAAAAAAATACAAATTTTAATTGTAGCCAGTCAATTCAGGAAGGATAAAGGTCAAAAACTTTCAAAGAAACCTTCAGCCCCAACACACTAAACTTTGGGAGCACAGGTTGGCATCCAGAGGTAAACATTTGCTATAACTGATAACAGGAGAAGGATCCATTTATTCACCTGTTATCAATTACAGGCATTGTATTTAAAGATCAGATGTTTTATATTTATTTCTTCAAATTTCATTCATGGTGCCATAAGTGAAGGTATCTCTGTCCACCCTGAATATATTTTCACTCCCTCATCTCAGTCATTCCGAACAATTCACACACTAAGATTACCCATGCTAAATGGGGATTCTTTTTTACTAGCCAATGTAGTACCTCAAATCCTTCCTTCCCTCCCCCTATTTCATCAGCAGGCAATTCTTTTGATACTTTTGTCAAGGGGAAATTGTGTGACTCAGAGATCTAGTCCCCAAGAGAAACTAATAATGGGCTGGGTATTGTCTGTCTCAGCAGCATCAGTGGGTCCCTCTCCTGTGCAGCTAATTAGCTTCCTTTCCAATATGAAGAATCTTATATATAGCTTTGTCTTT-GGGGTATTAC----ATAAATGAAGATTAAGCTATCTGAATTTCTCCTTCTCCTAAAAATGCACATCCTATGACTGAAAAGACAGGTAAAAGAGATGCTTTTAATTACAAAACTTTCCCTGTCGTGGTTGCTTCTCTCTATCCTTCTAAACTCCCTTTCAATTTCTTCTCTTCTGTAACATATTTGTGCCCAAAATCTTCTGCTTTCTGAAATATTTT--ATCTTTTTCTTCCACACTATCTC----TTATTTTCCAATTTTAATCATTAAATTATATTATGTCTTATAAAACTAATCCCACATATAAACCCCTATGATA--ATTTCAGTTTG--TCCCTAGTATGAAG-TTCTTTAAAGATGTGTAGTTTTCTAACTTTCATGCTCTCCAATTAATTATAAACTTCATTTTCCACTCTGAAAAGGAGATGTCTGATCTCAGCTATTTCCATCCTATTTGAAAACCAGATTTAGTTTTAAACCAGAGGAAGGGAATCTCAAGTCTTTACCTCCCACAGTCTGGTGTGATTCTCTCTCTTTTGGTATTACCTTCCTCCACATTGGAACACTCCAGCCAATGCATAGGCTGAGAGGCTATCTC-AGATTCAGAAAGATTTGGCCTCATCCCAGGGGAGGGTACAGAGGAGCTGATGACTATGAATTC--TGAAATGGAACTGTTCCAG-------------GTTGAAGAAATAAGAAAGGGAATTGGGAAGAGCAAT-----GCCCAGTGAAAAAGAAGAAATAA-TATTTTAGGAAGT-GAATGC-TAATTTTATTTTAAACAAAATAAGAACTCAAGGAATAAGAGGGTTCTTCCAATAGGTTAGAGTGATCCTGTCAAACATATATGCTTCT-AGATTTTTTTAAAGACTGTTTCTACTAAGAAAGCATAGACCGCTATTGAGAAAGATCATTAAACTGGAATTTAGGAGGTCTGCCTTCTGATTCTGACTTCTTGAATGTATTGTTAGCCAT----TTAACCACACTGTGTTGTTTC--------TCA--TTCTACCTGTAGAATCTCAAAGTTCTTTCCCACTTCTATACAAAACTATAATTCTGAACATCCTTTTTGTTTAATATAAGTCTGCATTTCCTGTTTGAA--GATATGTGTCCC-AGACCCTAAATGACTGACAAATTTTAAATCTCC---AATAGGAAAGATGACAAACTCTATGGAAACTTGGCTTCTGAAGAACTCCTAGAAGCTTTCCAAAGTCATCAGTGTTTCCTAAGAAGGCAGAGAAATCAAACAC-----------------------------------ATGG----------------------------TCTTTTCCTCCAGACAAGCTCCTTTGGGTCATCAGGATTTCTTCAACAATA---AAATGTAATAATTCCAAATGTTTGTAACAGAATGGGTAGGACTTTCTTCACTTATTTAAATACTCCCTTTTT
+cacattgtattgta--ctctattatgttt-tattgtattatattatTGTTGTTTTTCAAAAATT----TTGGTTAAACTAGCATCCCTTCTTTTTCTGTTGACCTAAGAAGAAACCCTTTCCTTCTTT-TGAACAAGATAAAATGAAGTGCAGATTTCTAAACAACACAGCTTTAAAGAAGCACACTTATAAACAAAGGTAGAGCTTTCACTGTTTCA-------ATGA-AACCTCAGTGAGATCAGATT-----ATGACTCTACATAAATGACAAAG------------------ACCCACCGAGACTGGTACCATGTTTTCATTCATATGGTGTTA--AATGATGGTCTC---CTCGGGTATCCAGACCCTTCATTTAAGTAACTCAAAACAACT----------------ATCTATAT-----CTTCCAAAATTTCTAAACAAATTGACCCGATGACT-TACAAGTTTAACTTATAATAGATCAACTCA--AATGATAAAA--TAGTGATTTTCAGATATACCTATATCCTCTGG---------TTTTGTAGAGCATTCAGGCTTTCTTGGACAAACATTTGTCA-AAATGA-AACAATAAGAACTTTTATCTTTTTCCATACTAACAAGTGAAG----TGTATTTTCAGATAATTAGTTTTAGACT-ATTTTT---AATTTGATATATGAATCCA-GAGTAAAAATACAGCTATCCACTTTTGGAATATTTTTTATTCT-----------ATTTCAAGCAATTCATAAAAAAAGATTATAACTCCTCAA-GGAGGTTATTTTAAATT---TAATACATTACACAGAATATTTTTATTTTTTCCCTT-TTATATAACCAGACAATTCTTTTGATACTTCTCTCTTGGGGAAACCA-ACAGCTCAT-GATCCAATTCCCAATAGAAACTATTAATGAACTGGGTATTGGACACCTTCACAGTGCCAATGGGTCACTCTCCTGAGCAAATAATTGGCTTCTTTGCCACTATAAACAGTCATACATATATCTTTGTCTTCAGGGGCATTGCTTATAGAAATGAATGATAACCTACTTAAATTT-TCTTTTTCTTCAAAGCGTACCTGCTGTTACTTTAGAGA-AGGT--AAGGGGTGGTTTACATTTAAAACCTG--CCGATTATAGTTG----TTTCAATCTTGCTAA------CTCTAAT---CTCCCATCTGTAAAATAATTATGTCAGACAT-GTCACCTTTCAAGAGTATTTTTACCCTTTTAATTTTAAACTATCACAGAATCGTTTTGTGATTTTATTTA--AAAATAT----TGCTTTATATAATTAATCTCGTGCTCACAACCTTTTGATATTTTTTTAATTTGCTTCTTTGGTATGAAGATTTTTCAAGAACGTGTG--TTTCTGCTTTTTGTAGCCCTCAGACAATTGTGCAATTCATTTCCAACTATGCCAAGCAGATGTCTGGTCTCAGATATTTCCTGCATA-TTAAAGATCATATTACAATCTCAAT-----------AATCTCAAGCCTTGTCTGCCAATACTCTGGAGTAATTCTTACCTTT----TATT-------TCAATATTTGAATACTGTAAGCAGTGAATACACTGAGAGACTATTCCAAGACTTAGATATATT-----CTAGCCCACAGGATTCTAAAAAAGTGC-ATTAAATAGAAATTCTTTTTATTGCAACTGTTCAAGTAGTGGTCTAGATGTTTGAAAAA-AAGAAAAAAAATTGGCAAAGTCTATTAAGGGCACAGGGTAGGGAAAGGACTAGTTTTTTTACGAAGTAGGATGTGTAGTTTTATGCCAAACTGAGTATGAGTTCAAAGACTAACACAATCCTTTCAGTAAAGCAAAGTGATCATATCAAATATATAGTATTCTGAGATTTT----ACAACTGTTTCTCCTAATCATTTGTAGAGTAATACTGACGAA---CAGTACACTAGAGTTTAGGACACCTACCCTCTGA-TCTGTAGTTCTGTATGTTTTGCTCTTGATGCTGTTAA--ACACTAGGCTGTTTTATGCAGAATCAAGTGTTAAATGCGTTTTCTCACAGTTGTTCCCAGTTTTCATGTAAATCTACGATTCCATTAGTATGCTTTGTTTAACACATGTCTATGTATCTTGTTTGAAGTGATACTTATCCCTAGACCTTGAATAATAGACAAATTTTAAGTCACCACAACCAGGAAAACCATCAAACACTATGGGGACTTGGTTTCTGATGCACTCCTTGAAGCTCCATGCTGTTATCAACAGCTCT---GAAGGGAAAGGAATAAAGCACTATattttgcttttgttttgattttatattttgaGATGGAGCTGAGAAGTTGTTTTGTTGTATTTTTACTATTTTTACACATAAATTCTCTAGAAACATGTGGATTtaat-aataatatataaaaataataaCCCAAAATGCTTGTAA-------GATAAAAAGACCTTCATTTATTTAAGTTCTCATTCTTT
+
+2 chr1 60917 61125 chr2 111306441 111306644 + 8501
+TTAATATTTCCCACTTCATCATTACTAACCTCACTCACTCTGAACTTGATGAGAGCACCTGAGCATTAATTTTTCTTATAATTATTTAATGATTACCAGAATTCGTTCAGTATGGCCAGCTCTGGTCAAAGTGAGGCAGGCAAGATGCTTTGTCAACTGCCTGGATGGAATGTCTCAAAAGGTTTCCATTTCATGGTAGCATTATGCAA
+ttAATAT--CCCAGTGCACC-TCACTACTCTGGCTCACGCTGAGCCTGATGAGGTCATA-GGGCATCCATTTTTCTTGTAGTTATTTTATTATTACCAGAATTCATTCAGAATGGCCACCTCTAGTCAACACAAAATAAGCAGCGTGCTTTGTC-ACTATTTGAGTAGACTTCCTTAGGAAGTTTTCATCTTAGGGTAGTTTTACATAA
+
+3 chr1 61126 61836 chr2 111307411 111308031 + 9500
+AGTTCAAGACGTTTAATCAAGACCCTTCACTTACTTAACTATACCTCCTTGAGA-ATCCCATCTATGAAAAAATTCTAGTCATTATAAAAATGATTGATTAAATGAGGGAAGTAGTAGAGTTCTTCATTTCTTTAGTTGGTTTAGTCTCCTATGAGTCAATCCTA-TTTTCAAA-ATTCTTAATAAACCATTTATTCCTTCAACTTTCTATGCCATTTGATGTTTTGTAAAAAAAAAAATATAA------TATGTATACAAAAAGATATTTCAAAATCTAGAAAGAGAGCTTTAGAGCTTTGTAAAGCTCTTTTAAAAATCAAAAACAACTACTGTTAATTAACATGTTGTACTATGC-AATTTGTTTACCATTATTACTCTTGGTATTTTTAAGAAAAGTCTT----TCCATTGTTATTATAAATGCTTCTATTGATATTTATTTTAATAACTGTTATTACAGTCCGTCATGTACATACACTATACTTAAAcctaatgtttggtatttaaatcgtttcaagattttatc----actgtcaacaaagtatgatgaatattttta--tgctgaaaacttctgtaaaaatagaattccaagagtattattgcaccaaaaggcatggacttaaaattcttgatacatgatttcaaaatattttctttaaggtttgaatcagtctatattccctccagcagcgtataaaagtgccaatttctctgatccttagcc
+aGCCCAAGAAAATTAAACAAATCCCTTTACTAATTTAAATGTATCTTGCTACTAGATATCATTTGTGA---------------CATAAATATTTGCAATAAAAT--------CACTAACATTATTTATTTCATCAGTG-------------ATGGGTTAACCCTAGTTTTCAAACAGCTTTGATAAATCTGTCATCTCTTTAGATCACTAGATAATTTGATATTTGAGGGGAAAATAGATATGAATGCACTATGTGCATTAAAATATCCCTTAAA-TCTAAAAATAGAA-TTAGAAGCTCTG------------AAACCTGAAATGCTATCATTGTAACCGGGAATGATGGGATATGCTAATTACTTTACAACAAT----------GTTTTAAGCAAGAATCTTAAAGTCCA------------------------ACATCTAGTTT------TGTTATTATAGCCAACTGTGTATATTTGATATATTTATACCTAATTGCTTTCATTTAAACTGCCTTAAAGCTTTACTTAAAACTATCAATAAAGTCTTGCTAGTATTTGTGACTGGAGATATTATCTGTACAAGTAGTTATTTCAGAGAAGTACTTTACAACAAGGTATGGAGATAAAATTATTGACATAT---------------TGTTTAAGGGTTAAA-----ATATCTTCCCTCTTGTGAATTATAAATAAACCAATTTCATTGAGCTTTTGCT
+
+4 chr1 61944 64435 chr2 111308032 111310602 + 69061
+ctccgcctcccggggtcaagctattctcctgcctcagcctcccaagtagctgggactacaggcatgcaccaccatgcccagctaatttttgttatttttagtagagatggagtttccccatgttggacaggatggtctcgatctcttgacctcgtgatccaccctcctcggcctcccaaagtgctgggataacaggcgtgaacaaccatgcccggcctgtaaaactttttcctaatttaacagaaaaataatagtattatattttatcatatttctttgatttctaAGacacacatacacacaca---cacacacatatctgtatatacaaatacacgtatagc---------------------------------------------ttacaTTTT--AATTCTTCATTTCATTTGTTCATTTATTAGGTCTTGGAGATTTTGTGAAAC---------TGTTTAAATTCTTTTTTATACTATGAAGATATCAACCTT-TTGTCTCTACAGCATTTCAAATTCAAGTATGAT----TCACGTGTTGGTTTGGGGTAGATCATTATAGGCACATGTAGGAAACAGCTTT-----------------------------------------------------------------------CAGAGA----------------TGC----------CTTAACCGT-----------------------------------AATTATGCATTTGTATTC--------------TAATTTTTATTTAATGTTATTATT----GATTGCATTTTTAAAG--ATTCTGT--ATTTTTTAAACCATTTATTTGTATATGTTGGTATACAATCTTGCCATTTTCTGGGATTTCATATTTCCTTATTTTTGTTTTT--TACCTTTTTTGGCTTGAATT---TTTTGAGTTTTTATGCATTCTTTTCCAGTTTCTTAAGATGCTAATAAGTTCATGTATTTGAGCAATTGAGAACATTTAAAGCAATAGACTGCCTCTGAGCACAGCTTTGTCCATATTACATTAACCTTTTATACCCTGGGTTCCCACTAGTTTTTAAATAATCTACTATCAAATAAAAG-ATTTGTTAATAATAA-------------------------------------------------------ATTTTAAATCATTAACACTTAACGCATTATTTTCAGTCACACTAAGTTGATTCCTTCGTTTCTTTCAGGTTGCTTCAGAGTCTTCCCTTCTATCTGATTCAGTGGACCAAGTAAATGACTCTCTGGTAACAGAATTTGTATTACTTGGACTTGCACAATCCTTGGAAATGCAGTTTTTCCTTTTTCTCTTCTTCTCTTTATTCTATGTGGGAATTATCCTGGGAAAACTCTTCATTGTGTTCACAGTGATCTTTGATCCTCACTTACACTCCCCCATGTATATTCTGCTGGCCAACCTATCGCTCATTGACTTGAGCCTTTCATCTACCACAGTTCCTAGGTTGATCTACGATCTTTTTACTGATTGTAAAGTTATTTCCTTCCATAATTGCATGATACAAAAGTTCTTTATCCATGTTATGGGAGGAGTTGAAATGGTGCTGCTGATAGTCATGGCATATGATAGGTACACTGCGATCTGCAAGCCTCTCCACTATCCAACTATTATGAATCCCAAAATGTGCATGTTTTTGGTAGCAGCAGCTTGGGTCATTGGGGTGATTCATGCTATGTCTCAGTTTGTTTTTGTCATAAATTTACCCTTCTGTGGCCCTAATAATGTGGGGAGCTTTTATTGTGATTTTCCTCGGGTTATTAAACTTGCATGCATGGACACTTATGGGCTAGAATTTGTGGTCACTGCCAACAGTGGATTCATATCGATGGGCACCTTCTTTTTCTTAATTGTATCATACATTTTTATTCTGGTCACTGTCCAACGACATTCCTCAAATGATTTATCCAAAGCATTCTTCACTTCGTCGGCTCACATCACCGTAGTGGTTTTGTTTTTTGCTCCATGCATGTTTCTCTACGTGTGGCCTTTCCCTACTAAGTCATTGGATAAATTTTTTGCCATCATGAACTTTGTTGTCACCCCTGTCGTAAATCCTGCCATCTATACTTTAAGGAACAAAGATATGAAGTTTGCAATGAGAAGGCTGAATCAACATATTTTAAATTCTATGGAGACGACATAACACATTTGGTTGATGAGAGCACAGGATAAATGCCATGGACCATCAAGACTCCTGTGATCACCATGATCACTATGGAACGCGCACATTTTTAGTATTGCCTGAAAAAACTGAAAAATCTGCAAAAAGGATGCATTAAATCTAAGAATTGTATTTCAGATAAAGTTGCAACATTTTTTGTTAATCATA----AAAAGTA-----------------------------------------TATATTTCTATCT--------AATGTGTGTATCTAATTAA-----------CAGCAATGACTAC-------------CTTT----------------AATTTTGATGTAGTTAT-TTTATATCTGTATATAAGCACATACACATATATATGACCTAGGTTTATTTATCAGTATTTTTATGCTGATAATAAGCATCACTGGAAATTAAT-----TTTCTTATGGAAATTATGTGGATCCAATGGATAAAATATGAGTTTATATAAATTAGTAAATGCCAAAATCAAGGAAGAAACAATTTTTATTTTAATTGTACTTTAAGTTAGATAAATGGTAAGGTCAACAGCTTGTTACAACCCTTAAGTATTATTTTCAGGCTGATTGTCAATATGTTTTGTACAatgttctcac
+CTCTGCTTTGTGTGGAGAAG-TATTGTCC--------ACTCTGAATGATTTGGTAATA-------ATAATAATATATTTTGCTAATT--------------------------------ATATT---------------------------------------------------------------------------------------------TGTAA----TTTTTCTTATTTAACA-AGAAATGAGA-------ATTTTCTTATATTTCACTGATTTCTAacacacacacatatacacatcacatacacacaaagagagagacagagacacagagagacacagagagacagacagacagacagacagacagacagatacacagtcaCATTTCTCAATTCTCTATATCATT-GTTCACTT----TGCCTGATGGGTTTTTAGTAGCAATCATGTATATTTTAAT-CATTTTAATATTATAAAGATATCAGCTTTATTCTCTCTA-AACATTG-AAATTCAAGTACAAGATAAGCATGAGTTAGTTTTGTG---------ACAAGCATGTGTAAGAAATAATTCTTtctctctctctctctctctctctctctctctctctctctctctctccatttttctttctttctttTGGTACAGAGGATGAAAGTTCCACATGTGCTCTTAAAGCACTTTATCATTGAGTCTATTTTTTCAGTTGGCATAAGTAAAAATAAGTTAAGTGTTTTGACTCACCATTCTAATGCTTGATATTCACTTAATTTTATTAGTTTTAAATTTCAGTTTTAAAATAATTTTTTTAAGTTTTGAAAACAAT-----GTTAATGTCCTTACAGAGTCTTTTCATTTTCTGGACTACTGCATTCATTTAGGATTGTTCCCAATATCTCTTTTTATTTCACCTGCACTTGAGAATTTAATACATTTTATCCTACTACAT--AAATCGTGTCATGTTTATGT-TTTTATCAATTGCTATAATTTAATGCAGTATATCAT-TCTGAGTAGAGCTTTTTTCAAACTCCATAAATCTTATATACACTGGATTCCTCACATTTTGTAAATTGTCTAC-ACCAATTAAAAATACTTGTTAATAGAAATTGTTTTGATAAACAAATTGTCTAGTGTTAAACAATATCTCTGGTACAGTGACTGATTTTAAATGACTAACATTTAAT--CTTACTTT--GATGCCTTAAAATAATTCAT-CTTGTCTTTCAGGATTTTTATGTATTTTCCCAACTTTCTGATCCAATGGACCAAGTTAATGCTTCTGCTCTACCTGAATTTGTTTTGCTGGGACTTGCACAATCGTTTGGAACACAGATTTTCTTTGGCCTCTTCTTCTCCTTATTTTATGTGGGGATTCTTTTTGGAAACCTCTTCATTGTGTTCATAGTGATTGTTGATTCTCATTTACACTTCCCCATGTATATTCTATTGGCCAACCTTTCGCTCATTGACTTGGGCCTTTCATCTACAACAATTCCTAGGACAATATCTGATCTTTTTACTGGCTGTAAAGTCATTTCTTTCCACAGCTGCATGACACAAATGTTCTTCATTCATGTGATGGGTGGAGTTGAGATGGTACTGCTCATAGCCATGGCATATGACAGATATATAGCAATCTGCAAGCCTCTTCACTACCTGATGATCATGAATCCCAAAAAATGTATAATTTTGGTAATAGCAGCTTGGGTCATAGGGATGATTCATGCAGTGTCTCAGTTTCTGTTTGTTGTAAATTTACCCTTCTGTGGTCCCTACAATGTAGGAAGTTTTTATTGTGATTTTCCAAGGGTCATTAAACTTGCATGCATGGACACTTATAAACTAGAATTTGTGGTCTCTGCCAACAGTGGCTTTATTTCTATGTGTACCTTCTTTTTTCTGATTACATCATACATTTTTATCCTGGCCAGTGTACGACAACATTCTTCAACTGATTTATCCAAAGCATTTGTCACCTTGTCAGCTCACATCACTGTAGTGGTTTTGTTTTTCATACCATGCATGTTTCTGTATGTATGGCCATTTCCGACCAAGTCACTTGATAATTTCTTTGCTATTGTTGACTTTGTTCTCACTCCTGTCTTAAATCCTACTATCTATACTTTAAGGAATAAAGATATGAGGTTGGCCATCAGAAGGCTAAGTAGACAGGTTTTAAGTTCTAGGGAATTTATATAGTAAATTTTATTAGTATCAACACTGA--AAATGTGATAAACTATCAA---------------TATTAACACTATAGAATAAAAACATTATT-TTATTGGGTTTAGAAACATAAGAATGTAC--------------CTATCAAAGAGTTTCAATTAATAAGGAGTTACAATAACTTCTGCTGGTTACAAAATAAAAGTGTTATATGTTTTCAAATCAACATAACTAAATCTTGTTGGTTTTATATTTTTGTATTGAATTGAAGTATTCATATTTATTTAAGTTATTATAACCAGCAATTATTGCACAAATGTTCATGCTTTTTGGTTTGTATAAATAAATGTGCatatatatatatatatatatatatatatatatatatatatatatataAAATGAACC--TTTATCAGCATCTATATGCAGATAATA--CAACACTGGTTACTAATATATATTTCTTGTGGAAATTATGTGGATCCAATGGATAAA-----GGTTTATGTAAACCAATA------------------------------ATTTTAA------TTTAAGACTTATAAGTAGGA------------------------TAACCATCACTATTAAGAT-------------TTTTGTGTCCTTCTCTTAC
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/hg38.noprefix.fasta.fai	Thu Sep 26 16:52:37 2024 +0000
@@ -0,0 +1,24 @@
+chr1	248956422	11	50	51
+chr2	242193529	253935573	50	51
+chr3	198295559	500972984	50	51
+chr4	190214555	703234466	50	51
+chr5	181538259	897253324	50	51
+chr6	170805979	1082422360	50	51
+chr7	159345973	1256644470	50	51
+chr8	145138636	1419177374	50	51
+chr9	138394717	1567218794	50	51
+chr10	133797422	1708381418	50	51
+chr11	135086622	1844854801	50	51
+chr12	133275309	1982643168	50	51
+chr13	114364328	2118583996	50	51
+chr14	107043718	2235235623	50	51
+chr15	101991189	2344420228	50	51
+chr16	90338345	2448451253	50	51
+chr17	83257441	2540596377	50	51
+chr18	80373285	2625518979	50	51
+chr19	58617616	2707499742	50	51
+chr20	64444167	2767289723	50	51
+chr21	46709983	2833022786	50	51
+chr22	50818468	2880666981	50	51
+chrX	156040895	2932501830	50	51
+chrY	57227415	3091663554	50	51
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/mm39.noprefix.fasta.fai	Thu Sep 26 16:52:37 2024 +0000
@@ -0,0 +1,21 @@
+chr1	195154279	11	50	51
+chr10	130530862	199057388	50	51
+chr11	121973369	332198880	50	51
+chr12	120092757	456611729	50	51
+chr13	120883175	579106354	50	51
+chr14	125139656	702407205	50	51
+chr15	104073951	830049667	50	51
+chr16	98008968	936205110	50	51
+chr17	95294699	1036174270	50	51
+chr18	90720763	1133374875	50	51
+chr19	61420004	1225910066	50	51
+chr2	181755017	1288558482	50	51
+chr3	159745316	1473948611	50	51
+chr4	156860686	1636888845	50	51
+chr5	151758149	1796886756	50	51
+chr6	149588044	1951680079	50	51
+chr7	144995196	2104259895	50	51
+chr8	130127694	2252155006	50	51
+chr9	124359700	2384885265	50	51
+chrX	169476592	2511732170	50	51
+chrY	91455967	2684598305	50	51