profile_cl: profile_cl/profileCLs.py annotate

annotate profile_cl/profileCLs.py @ 0:8547aedf1350 draft

Uploaded

author	immport-devteam
date	Mon, 27 Feb 2017 13:03:19 -0500
parents
children

rev	line source
0 8547aedf1350 Uploaded immport-devteam parents: diff changeset	1 #!/usr/bin/env python
8547aedf1350 Uploaded immport-devteam parents: diff changeset	2
8547aedf1350 Uploaded immport-devteam parents: diff changeset	3 ######################################################################
8547aedf1350 Uploaded immport-devteam parents: diff changeset	4 # Copyright (c) 2016 Northrop Grumman.
8547aedf1350 Uploaded immport-devteam parents: diff changeset	5 # All rights reserved.
8547aedf1350 Uploaded immport-devteam parents: diff changeset	6 ######################################################################
8547aedf1350 Uploaded immport-devteam parents: diff changeset	7 from __future__ import print_function
8547aedf1350 Uploaded immport-devteam parents: diff changeset	8 import sys
8547aedf1350 Uploaded immport-devteam parents: diff changeset	9 import os
8547aedf1350 Uploaded immport-devteam parents: diff changeset	10 from argparse import ArgumentParser
8547aedf1350 Uploaded immport-devteam parents: diff changeset	11 from jinja2 import Environment, FileSystemLoader
8547aedf1350 Uploaded immport-devteam parents: diff changeset	12
8547aedf1350 Uploaded immport-devteam parents: diff changeset	13 profile_key = {
8547aedf1350 Uploaded immport-devteam parents: diff changeset	14 "1": "-",
8547aedf1350 Uploaded immport-devteam parents: diff changeset	15 "2": "lo",
8547aedf1350 Uploaded immport-devteam parents: diff changeset	16 "3": "+",
8547aedf1350 Uploaded immport-devteam parents: diff changeset	17 "4": "hi"
8547aedf1350 Uploaded immport-devteam parents: diff changeset	18 }
8547aedf1350 Uploaded immport-devteam parents: diff changeset	19
8547aedf1350 Uploaded immport-devteam parents: diff changeset	20
8547aedf1350 Uploaded immport-devteam parents: diff changeset	21 def run_flowCL(phenotype, output_txt, output_pdf, tool):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	22 run_command = " ". join(["Rscript --slave --vanilla", tool, "--args", output_txt, phenotype])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	23 os.system(run_command)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	24 get_graph = " ".join(["mv flowCL_results/*.pdf", output_pdf])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	25 os.system(get_graph)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	26 return
8547aedf1350 Uploaded immport-devteam parents: diff changeset	27
8547aedf1350 Uploaded immport-devteam parents: diff changeset	28
8547aedf1350 Uploaded immport-devteam parents: diff changeset	29 def generate_flowCL_query(list_markers, list_types):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	30 if (len(list_markers) != len(list_types)):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	31 return("pb with headers")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	32 query = []
8547aedf1350 Uploaded immport-devteam parents: diff changeset	33 # go through both lists, remove fsc/ssc
8547aedf1350 Uploaded immport-devteam parents: diff changeset	34 for i in range(1, len(list_markers)):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	35 if not list_markers[i].startswith("FSC") and not list_markers[i].startswith("SSC"):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	36 query.append(list_markers[i].upper())
8547aedf1350 Uploaded immport-devteam parents: diff changeset	37 query.append(profile_key[list_types[i]])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	38 # return concatenated string
8547aedf1350 Uploaded immport-devteam parents: diff changeset	39 return("".join(query))
8547aedf1350 Uploaded immport-devteam parents: diff changeset	40
8547aedf1350 Uploaded immport-devteam parents: diff changeset	41
8547aedf1350 Uploaded immport-devteam parents: diff changeset	42 def translate_profiles(input_file, tool_dir, output, html_dir):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	43 os.mkdir(html_dir)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	44
8547aedf1350 Uploaded immport-devteam parents: diff changeset	45 tool = "/".join([tool_dir, "getOntology.R"])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	46 html_table = "".join([html_dir, "/CLprofiles.txt"])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	47 score_table = "".join(["cp ", input_file, " ", html_dir, "/scores.txt"])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	48 os.system(score_table)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	49
8547aedf1350 Uploaded immport-devteam parents: diff changeset	50 # read profile
8547aedf1350 Uploaded immport-devteam parents: diff changeset	51 with open(input_file, "r") as flock_profiles, open(html_table, "w") as out:
8547aedf1350 Uploaded immport-devteam parents: diff changeset	52 headers = flock_profiles.readline()
8547aedf1350 Uploaded immport-devteam parents: diff changeset	53 headers = headers.strip()
8547aedf1350 Uploaded immport-devteam parents: diff changeset	54 # get all headers except for last 2 (count + percentage)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	55 markers = headers.split("\t")[:-2]
8547aedf1350 Uploaded immport-devteam parents: diff changeset	56 counter = 0
8547aedf1350 Uploaded immport-devteam parents: diff changeset	57
8547aedf1350 Uploaded immport-devteam parents: diff changeset	58 out.write("Population\tFlowCL Query\tNb Results\tLink to PDF\t")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	59 out.write("Top Result Label\tTop Result Score\tTop Result CL\n")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	60 queries = {}
8547aedf1350 Uploaded immport-devteam parents: diff changeset	61 # create marker query for each population
8547aedf1350 Uploaded immport-devteam parents: diff changeset	62 for lines in flock_profiles:
8547aedf1350 Uploaded immport-devteam parents: diff changeset	63 lines = lines.strip("\n")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	64 pop_profile = lines.split("\t")[:-2]
8547aedf1350 Uploaded immport-devteam parents: diff changeset	65 flowcl_query = generate_flowCL_query(markers, pop_profile)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	66 counter += 1
8547aedf1350 Uploaded immport-devteam parents: diff changeset	67 nb_results = "0"
8547aedf1350 Uploaded immport-devteam parents: diff changeset	68 top_label = "no_match"
8547aedf1350 Uploaded immport-devteam parents: diff changeset	69 top_score = "NA"
8547aedf1350 Uploaded immport-devteam parents: diff changeset	70 top_CL = "NA"
8547aedf1350 Uploaded immport-devteam parents: diff changeset	71 pdf_link = "NA"
8547aedf1350 Uploaded immport-devteam parents: diff changeset	72 # check if query was run before
8547aedf1350 Uploaded immport-devteam parents: diff changeset	73 if flowcl_query not in queries:
8547aedf1350 Uploaded immport-devteam parents: diff changeset	74 # create filenames for results & graphs
8547aedf1350 Uploaded immport-devteam parents: diff changeset	75 txt = "".join(["flowcl_pop", str(counter).zfill(2), ".txt"])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	76 text_result = "/".join([html_dir, txt])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	77 graph = "".join(["flowcl_pop", str(counter).zfill(2), ".pdf"])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	78 graph_output = "/".join([html_dir, graph])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	79 # run flowCL for each marker profile
8547aedf1350 Uploaded immport-devteam parents: diff changeset	80 run_flowCL(flowcl_query, text_result, graph_output, tool)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	81
8547aedf1350 Uploaded immport-devteam parents: diff changeset	82 # test that text file exists if not results are all NAs:
8547aedf1350 Uploaded immport-devteam parents: diff changeset	83 if os.path.isfile(text_result):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	84 with open(text_result, "r") as res:
8547aedf1350 Uploaded immport-devteam parents: diff changeset	85 for line in res:
8547aedf1350 Uploaded immport-devteam parents: diff changeset	86 if line.startswith("Score"):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	87 data = line.split(") ")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	88 top_score = data[2][:-2]
8547aedf1350 Uploaded immport-devteam parents: diff changeset	89 tot_results = len(data) - 2
8547aedf1350 Uploaded immport-devteam parents: diff changeset	90 nb_results = str(tot_results)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	91 if tot_results == 5:
8547aedf1350 Uploaded immport-devteam parents: diff changeset	92 if len(data[6].split("+")) > 1:
8547aedf1350 Uploaded immport-devteam parents: diff changeset	93 nb_results = "5+"
8547aedf1350 Uploaded immport-devteam parents: diff changeset	94 elif line.startswith("Cell ID"):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	95 prep_link = line.split(") ")[1][:-2]
8547aedf1350 Uploaded immport-devteam parents: diff changeset	96 cl = prep_link.replace("_", ":")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	97 link = "".join(['<a href="http://www.immport-labs.org/immport-ontology/public/home/home/', cl, '" target="_blank">'])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	98 top_CL = "".join([link, prep_link, "</a>"])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	99 elif line.startswith("Cell Label"):
8547aedf1350 Uploaded immport-devteam parents: diff changeset	100 top_label = line.split(") ")[1][:-2]
8547aedf1350 Uploaded immport-devteam parents: diff changeset	101 pdf_link = "".join(['<a href="', graph, '" target="_blank">PDF</a>'])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	102 tmpflowcl_query = "".join(['<a href="', txt, '" target="_blank">', flowcl_query, '</a>'])
8547aedf1350 Uploaded immport-devteam parents: diff changeset	103
8547aedf1350 Uploaded immport-devteam parents: diff changeset	104 queries[flowcl_query] = {
8547aedf1350 Uploaded immport-devteam parents: diff changeset	105 "query": tmpflowcl_query,
8547aedf1350 Uploaded immport-devteam parents: diff changeset	106 "results": nb_results,
8547aedf1350 Uploaded immport-devteam parents: diff changeset	107 "pdf": pdf_link,
8547aedf1350 Uploaded immport-devteam parents: diff changeset	108 "label": top_label,
8547aedf1350 Uploaded immport-devteam parents: diff changeset	109 "score": top_score,
8547aedf1350 Uploaded immport-devteam parents: diff changeset	110 "CL": top_CL
8547aedf1350 Uploaded immport-devteam parents: diff changeset	111 }
8547aedf1350 Uploaded immport-devteam parents: diff changeset	112 # write query results to CLprofiles.txt
8547aedf1350 Uploaded immport-devteam parents: diff changeset	113 out.write("\t".join([pop_profile[0],
8547aedf1350 Uploaded immport-devteam parents: diff changeset	114 queries[flowcl_query]["query"],
8547aedf1350 Uploaded immport-devteam parents: diff changeset	115 queries[flowcl_query]["results"],
8547aedf1350 Uploaded immport-devteam parents: diff changeset	116 queries[flowcl_query]["pdf"],
8547aedf1350 Uploaded immport-devteam parents: diff changeset	117 queries[flowcl_query]["label"],
8547aedf1350 Uploaded immport-devteam parents: diff changeset	118 queries[flowcl_query]["score"],
8547aedf1350 Uploaded immport-devteam parents: diff changeset	119 queries[flowcl_query]["CL"]]) + "\n")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	120
8547aedf1350 Uploaded immport-devteam parents: diff changeset	121 env = Environment(loader=FileSystemLoader(tool_dir + "/templates"))
8547aedf1350 Uploaded immport-devteam parents: diff changeset	122 template = env.get_template("profileCLs.template")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	123
8547aedf1350 Uploaded immport-devteam parents: diff changeset	124 real_directory = html_dir.replace("/job_working_directory", "")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	125 context = {'outputDirectory': real_directory}
8547aedf1350 Uploaded immport-devteam parents: diff changeset	126 overview = template.render(**context)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	127 with open(output, "w") as outf:
8547aedf1350 Uploaded immport-devteam parents: diff changeset	128 outf.write(overview)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	129
8547aedf1350 Uploaded immport-devteam parents: diff changeset	130
8547aedf1350 Uploaded immport-devteam parents: diff changeset	131 if __name__ == "__main__":
8547aedf1350 Uploaded immport-devteam parents: diff changeset	132 parser = ArgumentParser(
8547aedf1350 Uploaded immport-devteam parents: diff changeset	133 prog="getCLs_from_profile",
8547aedf1350 Uploaded immport-devteam parents: diff changeset	134 description="runs flowCL on a each population defined by FLOCK.")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	135
8547aedf1350 Uploaded immport-devteam parents: diff changeset	136 parser.add_argument(
8547aedf1350 Uploaded immport-devteam parents: diff changeset	137 '-i',
8547aedf1350 Uploaded immport-devteam parents: diff changeset	138 dest="input_file",
8547aedf1350 Uploaded immport-devteam parents: diff changeset	139 required=True,
8547aedf1350 Uploaded immport-devteam parents: diff changeset	140 help="File location for the profile.txt from FLOCK.")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	141
8547aedf1350 Uploaded immport-devteam parents: diff changeset	142 parser.add_argument(
8547aedf1350 Uploaded immport-devteam parents: diff changeset	143 '-o',
8547aedf1350 Uploaded immport-devteam parents: diff changeset	144 dest="output",
8547aedf1350 Uploaded immport-devteam parents: diff changeset	145 required=True,
8547aedf1350 Uploaded immport-devteam parents: diff changeset	146 help="Name of the output html file.")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	147
8547aedf1350 Uploaded immport-devteam parents: diff changeset	148 parser.add_argument(
8547aedf1350 Uploaded immport-devteam parents: diff changeset	149 '-d',
8547aedf1350 Uploaded immport-devteam parents: diff changeset	150 dest="html_dir",
8547aedf1350 Uploaded immport-devteam parents: diff changeset	151 required=True,
8547aedf1350 Uploaded immport-devteam parents: diff changeset	152 help="Path to html supporting directory.")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	153
8547aedf1350 Uploaded immport-devteam parents: diff changeset	154 parser.add_argument(
8547aedf1350 Uploaded immport-devteam parents: diff changeset	155 '-t',
8547aedf1350 Uploaded immport-devteam parents: diff changeset	156 dest="tool_dir",
8547aedf1350 Uploaded immport-devteam parents: diff changeset	157 required=True,
8547aedf1350 Uploaded immport-devteam parents: diff changeset	158 help="Path to the tool directory")
8547aedf1350 Uploaded immport-devteam parents: diff changeset	159
8547aedf1350 Uploaded immport-devteam parents: diff changeset	160 args = parser.parse_args()
8547aedf1350 Uploaded immport-devteam parents: diff changeset	161
8547aedf1350 Uploaded immport-devteam parents: diff changeset	162 translate_profiles(args.input_file, args.tool_dir, args.output, args.html_dir)
8547aedf1350 Uploaded immport-devteam parents: diff changeset	163 sys.exit(0)

Mercurial > repos > immport-devteam > profile_cl

annotate profile_cl/profileCLs.py @ 0:8547aedf1350 draft