cluster: gops_cluster.py comparison

comparison gops_cluster.py @ 3:765ceb06c3e2 draft

planemo upload for repository https://github.com/galaxyproject/tools-devteam/tree/master/tool_collections/gops/cluster commit a1517c9d22029095120643bbe2c8fa53754dd2b7

author	devteam
date	Wed, 11 Nov 2015 12:47:24 -0500
parents	d5677eecbad4
children	05696474ee89

comparison

equal deleted inserted replaced

-:520de69b107a
+:765ceb06c3e2
 -d, --distance=N: Maximum distance between clustered intervals
 -v, --overlap=N: Minimum overlap require (negative distance)
 -m, --minregions=N: Minimum regions per cluster
 -o, --output=N: 1)merged 2)filtered 3)clustered 4) minimum 5) maximum
 """
-import sys, traceback, fileinput
+import fileinput
-from warnings import warn
+import sys
-from bx.intervals import *
+from bx.intervals.io import GenomicInterval, NiceReaderWrapper
-from bx.intervals.io import *
+from bx.intervals.operations.find_clusters import find_clusters
-from bx.intervals.operations.find_clusters import *
 from bx.cookbook import doc_optparse
-from galaxy.tools.util.galaxyops import *
+from bx.tabular.io import ParseError
+from galaxy.tools.util.galaxyops import fail, parse_cols_arg, skipped
 assert sys.version_info[:2] >= ( 2, 4 )
 def main():
 distance = 0
 minregions = 2
 output = 1
-upstream_pad = 0
-downstream_pad = 0
 options, args = doc_optparse.parse( __doc__ )
 try:
 chr_col_1, start_col_1, end_col_1, strand_col_1 = parse_cols_arg( options.cols1 )
-if options.distance: distance = int( options.distance )
+if options.distance:
-if options.overlap: distance = -1 * int( options.overlap )
+distance = int( options.distance )
-if options.output: output = int( options.output )
+if options.overlap:
-if options.minregions: minregions = int( options.minregions )
+distance = -1 * int( options.overlap )
+if options.output:
+output = int( options.output )
+if options.minregions:
+minregions = int( options.minregions )
 in_fname, out_fname = args
 except:
 doc_optparse.exception()
 g1 = NiceReaderWrapper( fileinput.FileInput( in_fname ),
 except ParseError, exc:
 fail( "Invalid file format: %s" % str( exc ) )
 f1 = open( in_fname, "r" )
 out_file = open( out_fname, "w" )
 # If "merge"
 if output == 1:
-fields = ["."  for x in range(max(g1.chrom_col, g1.start_col, g1.end_col)+1)]
+fields = ["." for x in range(max(g1.chrom_col, g1.start_col, g1.end_col) + 1)]
 for chrom, tree in clusters.items():
 for start, end, lines in tree.getregions():
 fields[g1.chrom_col] = chrom
 fields[g1.start_col] = str(start)
 fields[g1.end_col] = str(end)
 if output == 4 or output == 5:
 linenums = list()
 f1.seek(0)
 fileLines = f1.readlines()
 for chrom, tree in clusters.items():
-regions = tree.getregions()
 for start, end, lines in tree.getregions():
 outsize = -1
 outinterval = None
 for line in lines:
 # three nested for loops?
 # should only execute this code once per line
 fileline = fileLines[line].rstrip("\n\r")
 try:
 cluster_interval = GenomicInterval( g1, fileline.split("\t"),
 g1.chrom_col,
 g1.start_col,
 g1.end_col,
 g1.strand_col,
 g1.default_strand,
 g1.fix_strand )
 except Exception, exc:
 print >> sys.stderr, str( exc )
 f1.close()
 sys.exit()
 interval_size = cluster_interval.end - cluster_interval.start
 if outsize == -1 or \
 ( outsize > interval_size and output == 4 ) or \
-( outsize < interval_size and output == 5 ) :
+( outsize < interval_size and output == 5 ):
 outinterval = cluster_interval
 outsize = interval_size
 out_file.write( "%s\n" % outinterval )
 f1.close()
 out_file.close()
 if g1.skipped > 0:
 print skipped( g1, filedesc="" )
 if __name__ == "__main__":
 main()

Mercurial > repos > devteam > cluster

comparison gops_cluster.py @ 3:765ceb06c3e2 draft