s_mart: SMART/Java/Python/plotCoverage.py annotate

annotate SMART/Java/Python/plotCoverage.py @ 31:0ab839023fe4

Uploaded

author	m-zytnicki
date	Tue, 30 Apr 2013 14:33:21 -0400
parents	94ab73e8a190
children

rev	line source
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	1 #! /usr/bin/env python
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	2 #
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	3 # Copyright INRA-URGI 2009-2010
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	4 #
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	5 # This software is governed by the CeCILL license under French law and
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	6 # abiding by the rules of distribution of free software. You can use,
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	7 # modify and/ or redistribute the software under the terms of the CeCILL
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	8 # license as circulated by CEA, CNRS and INRIA at the following URL
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	9 # "http://www.cecill.info".
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	10 #
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	11 # As a counterpart to the access to the source code and rights to copy,
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	12 # modify and redistribute granted by the license, users are provided only
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	13 # with a limited warranty and the software's author, the holder of the
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	14 # economic rights, and the successive licensors have only limited
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	15 # liability.
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	16 #
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	17 # In this respect, the user's attention is drawn to the risks associated
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	18 # with loading, using, modifying and/or developing or reproducing the
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	19 # software by the user in light of its specific status of free software,
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	20 # that may mean that it is complicated to manipulate, and that also
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	21 # therefore means that it is reserved for developers and experienced
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	22 # professionals having in-depth computer knowledge. Users are therefore
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	23 # encouraged to load and test the software's suitability as regards their
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	24 # requirements in conditions enabling the security of their systems and/or
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	25 # data to be ensured and, more generally, to use and operate it in the
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	26 # same conditions as regards security.
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	27 #
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	28 # The fact that you are presently reading this means that you have had
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	29 # knowledge of the CeCILL license and that you accept its terms.
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	30 #
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	31 import os, os.path, subprocess, glob, random
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	32 from optparse import OptionParser
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	33 from SMART.Java.Python.structure.Interval import Interval
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	34 from SMART.Java.Python.structure.Transcript import Transcript
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	35 from commons.core.parsing.ParserChooser import ParserChooser
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	36 from SMART.Java.Python.misc.RPlotter import RPlotter
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	37 from SMART.Java.Python.misc.Progress import Progress
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	38 from commons.core.parsing.FastaParser import FastaParser
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	39
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	40 strands = [-1, 1]
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	41 colors = {-1: "blue", 1: "red", 0: "black"}
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	42 colorLine = "black"
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	43
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	44 def parseTargetField(field):
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	45 strand = "+"
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	46 splittedFieldSpace = field.split()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	47 splittedFieldPlus = field.split("+", 4)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	48 if len(splittedFieldSpace) == 3:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	49 id, start, end = splittedFieldSpace
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	50 elif len(splittedFieldSpace) == 4:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	51 id, start, end, strand = splittedFieldSpace
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	52 elif len(splittedFieldPlus) == 3:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	53 id, start, end = splittedFieldPlus
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	54 elif len(splittedFieldPlus) == 4:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	55 id, start, end, strand = splittedFieldPlus
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	56 else:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	57 raise Exception("Cannot parse Target field '%s'." % (field))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	58 return (id, int(start), int(end), strand)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	59
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	60
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	61 class SimpleTranscript(object):
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	62 def __init__(self, transcript1, transcript2, color = None):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	63 self.start = max(0, transcript1.getStart() - transcript2.getStart())
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	64 self.end = min(transcript2.getEnd() - transcript2.getStart(), transcript1.getEnd() - transcript2.getStart())
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	65 self.strand = transcript1.getDirection() * transcript2.getDirection()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	66 self.exons = []
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	67 for exon in transcript1.getExons():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	68 if exon.getEnd() >= transcript2.getStart() and exon.getStart() <= transcript2.getEnd():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	69 start = max(0, exon.getStart() - transcript2.getStart())
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	70 end = min(transcript2.getEnd() - transcript2.getStart(), exon.getEnd() - transcript2.getStart())
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	71 self.addExon(start, end, self.strand, color)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	72
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	73 def addExon(self, start, end, strand, color):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	74 exon = SimpleExon(start, end, strand, color)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	75 self.exons.append(exon)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	76
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	77 def getRScript(self, yOffset, height):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	78 rString = ""
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	79 previousEnd = None
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	80 for exon in sorted(self.exons, key=lambda exon: exon.start):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	81 if previousEnd != None:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	82 rString += "segments(%.1f, %.1f, %.1f, %.1f, col = \"%s\")\n" % (previousEnd, yOffset + height / 4.0, exon.start, yOffset + height / 4.0, colorLine)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	83 rString += exon.getRScript(yOffset, height)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	84 previousEnd = exon.end
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	85 return rString
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	86
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	87
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	88 class SimpleExon(object):
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	89 def __init__(self, start, end, strand, color = None):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	90 self.start = start
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	91 self.end = end
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	92 self.strand = strand
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	93 self.color = color
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	94
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	95 def getRScript(self, yOffset, height):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	96 color = self.color if self.color != None else colors[self.strand]
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	97 return "rect(%.1f, %.1f, %.1f, %.1f, col=\"%s\", border = \"%s\")\n" % (self.start, yOffset, self.end, yOffset + height / 2.0, color, colorLine)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	98
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	99
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	100 class Plotter(object):
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	101
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	102 def __init__(self, seed, index, verbosity):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	103 self.seed = seed
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	104 self.index = index
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	105 self.verbosity = verbosity
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	106 self.maxCoverage = 0
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	107 self.maxOverlap = 0
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	108 self.log = ""
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	109 self.merge = False
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	110 self.width = 1500
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	111 self.heigth = 1000
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	112 self.xLabel = ""
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	113 self.yLabel = ""
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	114 self.title = None
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	115 self.absPath = os.getcwd()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	116 self.coverageDataFileName = "tmpFile_%d_%s.dat" % (seed, index)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	117 self.coverageScript = ""
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	118 self.overlapScript = ""
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	119 self.outputFileName = None
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	120
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	121 def setOutputFileName(self, fileName):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	122 self.outputFileName = fileName
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	123
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	124 def setTranscript(self, transcript):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	125 self.transcript = transcript
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	126 self.name = transcript.getName()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	127 self.size = transcript.getEnd() - transcript.getStart() + 1
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	128 if self.title == None:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	129 self.title = self.name
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	130 else:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	131 self.title += " " + self.name
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	132
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	133 def setTitle(self, title):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	134 self.title = title + " " + self.name
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	135
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	136 def setPlotSize(self, width, height):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	137 self.width = width
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	138 self.height = height
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	139
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	140 def setLabels(self, xLabel, yLabel):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	141 self.xLabel = xLabel
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	142 self.yLabel = yLabel
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	143
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	144 def setMerge(self, merge):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	145 self.merge = merge
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	146
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	147 def setCoverageData(self, coverage):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	148 outputCoveragePerStrand = dict([strand, 0] for strand in strands)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	149 outputCoverage = 0
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	150 dataFile = open(os.path.abspath(self.coverageDataFileName), "w")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	151 for position in range(self.size+1):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	152 sumValue = 0
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	153 found = False
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	154 dataFile.write("%d\t" % (position))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	155 for strand in strands:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	156 value = coverage[strand].get(position, 0)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	157 sumValue += value
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	158 dataFile.write("%d\t" % (value))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	159 if value > 0:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	160 found = True
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	161 outputCoveragePerStrand[strand] += 1
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	162 self.maxCoverage = max(self.maxCoverage, sumValue)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	163 dataFile.write("%d\n" % (sumValue))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	164 if found:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	165 outputCoverage += 1
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	166 dataFile.close()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	167 self.log += "%s (%d nt):\n - both strands: %d (%.0f%%)\n - (+) strand: %d (%.0f%%)\n - (-) strand: %d (%.0f%%)\n" % (self.name, self.size, outputCoverage, float(outputCoverage) / self.size * 100, outputCoveragePerStrand[1], float(outputCoveragePerStrand[1]) / self.size * 100, outputCoveragePerStrand[-1], float(outputCoveragePerStrand[-1]) / self.size * 100)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	168 self.coverageScript += "data = scan(\"%s\", list(pos = -666, minus = -666, plus = -666, sumValue = -666), sep=\"\t\")\n" % (os.path.abspath(self.coverageDataFileName))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	169 self.coverageScript += "lines(x = data$pos, y = data$minus, col = \"%s\")\n" % (colors[-1])
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	170 self.coverageScript += "lines(x = data$pos, y = data$plus, col = \"%s\")\n" % (colors[1])
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	171 self.coverageScript += "lines(x = data$pos, y = data$sumValue, col = \"%s\")\n" % (colors[0])
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	172
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	173 def setOverlapData(self, overlap):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	174 height = 1
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	175 self.maxOverlap = (len(overlap) + 1) * height
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	176 thisElement = SimpleTranscript(self.transcript, self.transcript, "black")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	177 self.overlapScript += thisElement.getRScript(0, height)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	178 for cpt, transcript in enumerate(sorted(overlap, cmp=lambda c1, c2: c1.start - c2.start if c1.start != c2.start else c1.end - c2.end)):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	179 self.overlapScript += transcript.getRScript((cpt + 1) * height, height)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	180
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	181 def getFirstLine(self, suffix = None):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	182 return "png(file = \"%s_%s%s.png\", width = %d, height = %d, bg = \"white\")\n" % (self.outputFileName, self.name, "" if suffix == None or self.merge else "_%s" % (suffix), self.width, self.height)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	183
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	184 def getLastLine(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	185 return "dev.off()\n"
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	186
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	187 def startR(self, fileName, script):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	188 scriptFile = open(fileName, "w")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	189 scriptFile.write(script)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	190 scriptFile.close()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	191 command = "R CMD BATCH %s" % (fileName)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	192 status = subprocess.call(command, shell=True)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	193 if status != 0:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	194 raise Exception("Problem with the execution of script file %s, status is: %s" % (fileName, status))
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	195
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	196 def plot(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	197 if self.merge:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	198 fileName = "%s_%d_%s.R" % (self.outputFileName, self.seed, self.index)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	199 plotLine = "plot(x = NA, y = NA, xlab=\"%s\", ylab=\"%s\", panel.first = grid(lwd = 1.0), xlim = c(0, %d), ylim = c(0, %d), cex.axis = 2, cex.lab = 2, cex.main=2, main = \"%s\")\n" % (self.xLabel, self.yLabel, self.size, max(self.maxCoverage, self.maxOverlap), self.title)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	200 script = self.getFirstLine() + plotLine + self.overlapScript + self.coverageScript + self.getLastLine()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	201 self.startR(fileName, script)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	202 else:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	203 fileName = "%s_%d_%s_overlap.R" % (self.outputFileName, self.seed, self.index)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	204 plotLine = "plot(x = NA, y = NA, xlab=\"%s\", ylab=\"%s\", panel.first = grid(lwd = 1.0), xlim = c(0, %d), ylim = c(0, %d), cex.axis = 2, cex.lab = 2, cex.main=2, main = \"%s\")\n" % (self.xLabel, self.yLabel, self.size, self.maxOverlap, self.title)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	205 script = self.getFirstLine("overlap") + plotLine + self.overlapScript + self.getLastLine()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	206 self.startR(fileName, script)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	207 fileName = "%s_%d_%s_coverage.R" % (self.outputFileName, self.seed, self.index)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	208 plotLine = "plot(x = NA, y = NA, xlab=\"%s\", ylab=\"%s\", panel.first = grid(lwd = 1.0), xlim = c(0, %d), ylim = c(0, %d), cex.axis = 2, cex.lab = 2, cex.main=2, main = \"%s\")\n" % (self.xLabel, self.yLabel, self.size, self.maxCoverage, self.title)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	209 script = self.getFirstLine("coverage") + plotLine + self.coverageScript + self.getLastLine()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	210 self.startR(fileName, script)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	211
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	212
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	213 class PlotParser(object):
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	214
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	215 def __init__(self, verbosity):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	216 self.verbosity = verbosity
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	217 self.parsers = [None, None]
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	218 self.sequenceParser = None
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	219 self.seed = random.randint(0, 10000)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	220 self.title = ""
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	221 self.merge = False
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	222
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	223 def __del__(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	224 for fileName in glob.glob("tmpFile_%d*.dat" % (self.seed)):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	225 os.remove(fileName)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	226 for fileName in glob.glob("%s*.R" % (os.path.abspath(self.outputFileName))):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	227 os.remove(fileName)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	228 for fileName in glob.glob("%s*.Rout" % (os.path.abspath(self.outputFileName))):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	229 os.remove(fileName)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	230
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	231 def addInput(self, inputNb, fileName, fileFormat):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	232 if fileName == None:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	233 return
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	234 chooser = ParserChooser(self.verbosity)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	235 chooser.findFormat(fileFormat)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	236 self.parsers[inputNb] = chooser.getParser(fileName)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	237 if inputNb == 0:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	238 self.parsers[1] = self.parsers[0]
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	239
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	240 def addSequence(self, fileName):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	241 if fileName == None:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	242 return
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	243 self.sequenceParser = FastaParser(fileName, self.verbosity)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	244
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	245 def setOutput(self, fileName):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	246 self.outputFileName = fileName
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	247
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	248 def setPlotSize(self, width, height):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	249 self.width = width
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	250 self.height = height
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	251
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	252 def setLabels(self, xLabel, yLabel):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	253 self.xLabel = xLabel
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	254 self.yLabel = yLabel
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	255
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	256 def setTitle(self, title):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	257 self.title = title
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	258
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	259 def setMerge(self, merge):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	260 self.merge = merge
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	261
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	262 def initializeDataFromSequences(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	263 self.sizes = {}
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	264 self.coverage = {}
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	265 self.overlap = {}
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	266 for region in self.sequenceParser.getRegions():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	267 self.sizes[region] = self.sequenceParser.getSizeOfRegion(region)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	268 self.coverage[region] = {}
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	269 self.overlap[region] = []
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	270 for strand in strands:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	271 self.coverage[region][strand] = {}
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	272 self.coverage[region][strand][1] = 0
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	273 self.coverage[region][strand][self.sizes[region]] = 0
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	274
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	275 def initializeDataFromTranscripts(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	276 self.coverage = dict([i, None] for i in range(self.parsers[1].getNbTranscripts()))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	277 self.overlap = dict([i, None] for i in range(self.parsers[1].getNbTranscripts()))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	278 self.sizes = dict([i, 0] for i in range(self.parsers[1].getNbTranscripts()))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	279 progress = Progress(self.parsers[1].getNbTranscripts(), "Reading regions", self.verbosity)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	280 for cpt, transcript in enumerate(self.parsers[1].getIterator()):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	281 self.coverage[cpt] = {}
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	282 self.overlap[cpt] = []
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	283 for strand in strands:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	284 self.coverage[cpt][strand] = {}
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	285 self.coverage[cpt][strand][0] = 0
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	286 self.coverage[cpt][strand][transcript.getEnd() - transcript.getStart()] = 0
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	287 for exon in transcript.getExons():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	288 self.sizes[cpt] += exon.getSize()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	289 progress.inc()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	290 progress.done()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	291
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	292 def initialize(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	293 if self.sequenceParser == None:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	294 self.initializeDataFromTranscripts()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	295 else:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	296 self.initializeDataFromSequences()
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	297
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	298 def computeCoverage(self, transcript1, transcript2, id):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	299 strand = transcript1.getDirection() * transcript2.getDirection()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	300 for exon1 in transcript1.getExons():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	301 for exon2 in transcript2.getExons():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	302 if exon1.overlapWith(exon2):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	303 for position in range(max(exon1.getStart(), exon2.getStart()), min(exon1.getEnd(), exon2.getEnd()) + 1):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	304 relativePosition = position - transcript2.getStart() + 1
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	305 self.coverage[id][strand][relativePosition] = self.coverage[id][strand].get(relativePosition, 0) + 1
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	306
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	307 def computeOverlap(self, transcript1, transcript2, id):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	308 simpleTranscript = SimpleTranscript(transcript1, transcript2)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	309 self.overlap[id].append(simpleTranscript)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	310
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	311 def compute2TranscriptFiles(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	312 progress = Progress(self.parsers[1].getNbTranscripts(), "Comparing regions", self.verbosity)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	313 for cpt2, transcript2 in enumerate(self.parsers[1].getIterator()):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	314 for transcript1 in self.parsers[0].getIterator():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	315 if transcript1.overlapWithExon(transcript2):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	316 self.computeCoverage(transcript1, transcript2, cpt2)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	317 self.computeOverlap(transcript1, transcript2, cpt2)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	318 progress.inc()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	319 progress.done()
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	320
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	321 def extractReferenceQueryMapping(self, mapping):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	322 queryTranscript = mapping.getTranscript()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	323 referenceTranscript = Transcript()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	324 referenceTranscript.setChromosome(queryTranscript.getChromosome())
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	325 referenceTranscript.setName(queryTranscript.getChromosome())
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	326 referenceTranscript.setDirection("+")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	327 referenceTranscript.setEnd(self.sizes[queryTranscript.getChromosome()])
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	328 referenceTranscript.setStart(1)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	329 return (referenceTranscript, queryTranscript)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	330
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	331 def extractReferenceQuery(self, inputTranscript):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	332 if "Target" not in inputTranscript.getTagNames():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	333 raise Exception("Cannot extract Target field in line '%s'." % (inputTranscript))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	334 id, start, end, strand = parseTargetField(inputTranscript.getTagValue("Target"))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	335 if id not in self.sizes:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	336 raise Exception("Target id '%s' of transcript '%s' does not correspond to anything in FASTA file." % (id, inputTranscript))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	337 referenceTranscript = Transcript()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	338 referenceTranscript.setChromosome(id)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	339 referenceTranscript.setName(id)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	340 referenceTranscript.setDirection("+")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	341 referenceTranscript.setEnd(self.sizes[id])
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	342 referenceTranscript.setStart(1)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	343 queryTranscript = Transcript()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	344 queryTranscript.setChromosome(id)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	345 queryTranscript.setName(id)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	346 queryTranscript.setStart(start)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	347 queryTranscript.setEnd(end)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	348 queryTranscript.setDirection(strand)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	349 if inputTranscript.getNbExons() > 1:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	350 factor = float(end - start) / (inputTranscript.getEnd() - inputTranscript.getStart())
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	351 for exon in inputTranscript.getExons():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	352 newExon = Interval()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	353 newExon.setChromosome(id)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	354 newExon.setDirection(strand)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	355 if "Target" in inputTranscript.getTagNames():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	356 id, start, end, strand = parseTargetField(exon.getTagValue("Target"))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	357 newExon.setStart(start)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	358 newExon.setEnd(end)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	359 else:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	360 newExon.setStart(int(round((exon.getStart() - inputTranscript.getStart()) * factor)) + start)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	361 newExon.setEnd( int(round((exon.getEnd() - inputTranscript.getStart()) * factor)) + start)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	362 queryTranscript.addExon(newExon)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	363 return (referenceTranscript, queryTranscript)
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	364
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	365 def compute1TranscriptFiles(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	366 progress = Progress(self.parsers[1].getNbItems(), "Comparing regions", self.verbosity)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	367 for transcript in self.parsers[1].getIterator():
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	368 if transcript.__class__.__name__ == "Mapping":
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	369 referenceTranscript, queryTranscript = self.extractReferenceQueryMapping(transcript)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	370 else:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	371 referenceTranscript, queryTranscript = self.extractReferenceQuery(transcript)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	372 self.computeCoverage(queryTranscript, referenceTranscript, referenceTranscript.getName())
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	373 self.computeOverlap(queryTranscript, referenceTranscript, referenceTranscript.getName())
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	374 progress.inc()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	375 progress.done()
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	376
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	377 def compute(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	378 if self.sequenceParser == None:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	379 self.compute2TranscriptFiles()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	380 else:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	381 self.compute1TranscriptFiles()
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	382
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	383 def plotTranscript(self, index, transcript):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	384 plotter = Plotter(self.seed, index, self.verbosity)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	385 plotter.setOutputFileName(self.outputFileName)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	386 plotter.setTranscript(transcript)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	387 plotter.setTitle(self.title)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	388 plotter.setLabels(self.xLabel, self.yLabel)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	389 plotter.setPlotSize(self.width, self.height)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	390 plotter.setCoverageData(self.coverage[index])
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	391 plotter.setOverlapData(self.overlap[index])
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	392 plotter.setMerge(self.merge)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	393 plotter.plot()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	394 output = plotter.log
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	395 return output
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	396
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	397 def plot1TranscriptFile(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	398 self.outputCoverage = {}
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	399 self.outputCoveragePerStrand = {}
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	400 output = ""
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	401 progress = Progress(len(self.sequenceParser.getRegions()), "Plotting regions", self.verbosity)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	402 for cpt2, region in enumerate(self.sequenceParser.getRegions()):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	403 transcript = Transcript()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	404 transcript.setName(region)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	405 transcript.setDirection("+")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	406 transcript.setEnd(self.sizes[region])
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	407 transcript.setStart(1)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	408 output += self.plotTranscript(region, transcript)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	409 progress.inc()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	410 progress.done()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	411 if self.verbosity > 0:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	412 print output
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	413
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	414 def plot2TranscriptFiles(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	415 self.outputCoverage = [0] * self.parsers[1].getNbTranscripts()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	416 self.outputCoveragePerStrand = [None] * self.parsers[1].getNbTranscripts()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	417 for cpt in range(self.parsers[1].getNbTranscripts()):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	418 self.outputCoveragePerStrand[cpt] = dict([strand, 0] for strand in strands)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	419 progress = Progress(self.parsers[1].getNbTranscripts(), "Plotting regions", self.verbosity)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	420 output = ""
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	421 for cpt2, transcript2 in enumerate(self.parsers[1].getIterator()):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	422 output += self.plotTranscript(cpt2, transcript2)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	423 progress.inc()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	424 progress.done()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	425 if self.verbosity > 0:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	426 print output
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	427
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	428 def plot(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	429 if self.sequenceParser == None:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	430 self.plot2TranscriptFiles()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	431 else:
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	432 self.plot1TranscriptFile()
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	433
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	434 def start(self):
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	435 self.initialize()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	436 self.compute()
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	437 self.plot()
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	438
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	439
769e306b7933 Change the repository level. yufei-luo parents: diff changeset	440 if __name__ == "__main__":
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	441
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	442 # parse command line
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	443 description = "Plot Coverage v1.0.1: Plot the coverage of the first data with respect to the second one. [Category: Visualization]"
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	444
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	445 parser = OptionParser(description = description)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	446 parser.add_option("-i", "--input1", dest="inputFileName1", action="store", type="string", help="input file 1 [compulsory] [format: file in transcript or mapping format given by -f]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	447 parser.add_option("-f", "--inputFormat1", dest="inputFormat1", action="store", type="string", help="format of input file 1 [compulsory] [format: transcript or mapping file format]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	448 parser.add_option("-j", "--input2", dest="inputFileName2", action="store", type="string", help="input file 2 [compulsory] [format: file in transcript format given by -g]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	449 parser.add_option("-g", "--inputFormat2", dest="inputFormat2", action="store", type="string", help="format of input file 2 [compulsory] [format: transcript file format]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	450 parser.add_option("-q", "--sequence", dest="inputSequence", action="store", default=None, type="string", help="input sequence file [format: file in FASTA format] [default: None]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	451 parser.add_option("-o", "--output", dest="outputFileName", action="store", type="string", help="output file [compulsory] [format: output file in PNG format]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	452 parser.add_option("-w", "--width", dest="width", action="store", default=1500, type="int", help="width of the plots (in px) [format: int] [default: 1500]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	453 parser.add_option("-e", "--height", dest="height", action="store", default=1000, type="int", help="height of the plots (in px) [format: int] [default: 1000]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	454 parser.add_option("-t", "--title", dest="title", action="store", default="", type="string", help="title of the plots [format: string]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	455 parser.add_option("-x", "--xlab", dest="xLabel", action="store", default="", type="string", help="label on the x-axis [format: string]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	456 parser.add_option("-y", "--ylab", dest="yLabel", action="store", default="", type="string", help="label on the y-axis [format: string]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	457 parser.add_option("-p", "--plusColor", dest="plusColor", action="store", default="red", type="string", help="color for the elements on the plus strand [format: string] [default: red]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	458 parser.add_option("-m", "--minusColor", dest="minusColor", action="store", default="blue", type="string", help="color for the elements on the minus strand [format: string] [default: blue]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	459 parser.add_option("-s", "--sumColor", dest="sumColor", action="store", default="black", type="string", help="color for 2 strands coverage line [format: string] [default: black]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	460 parser.add_option("-l", "--lineColor", dest="lineColor", action="store", default="black", type="string", help="color for the lines [format: string] [default: black]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	461 parser.add_option("-1", "--merge", dest="merge", action="store_true", default=False, help="merge the 2 plots in 1 [format: boolean] [default: false]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	462 parser.add_option("-D", "--directory", dest="working_Dir", action="store", default=os.getcwd(), type="string", help="the directory to store the results [format: directory]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	463 parser.add_option("-v", "--verbosity", dest="verbosity", action="store", default=1, type="int", help="trace level [format: int]")
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	464 (options, args) = parser.parse_args()
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	465
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	466 colors[1] = options.plusColor
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	467 colors[-1] = options.minusColor
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	468 colors[0] = options.sumColor
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	469 colorLine = options.lineColor
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	470
18 94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	471 pp = PlotParser(options.verbosity)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	472 pp.addInput(0, options.inputFileName1, options.inputFormat1)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	473 pp.addInput(1, options.inputFileName2, options.inputFormat2)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	474 pp.addSequence(options.inputSequence)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	475 pp.setOutput(options.outputFileName if os.path.isabs(options.outputFileName) else os.path.join(options.working_Dir, options.outputFileName))
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	476 pp.setPlotSize(options.width, options.height)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	477 pp.setLabels(options.xLabel, options.yLabel)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	478 pp.setTitle(options.title)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	479 pp.setMerge(options.merge)
94ab73e8a190 Uploaded m-zytnicki parents: 6 diff changeset	480 pp.start()
6 769e306b7933 Change the repository level. yufei-luo parents: diff changeset	481

Mercurial > repos > yufei-luo > s_mart

annotate SMART/Java/Python/plotCoverage.py @ 31:0ab839023fe4