associate_phenotypes: filter_by_mouse_knockout

annotate filter_by_mouse_knockout_pipe @ 0:6411ca16916e default tip

initial commit

author	Yusuf Ali <ali@yusuf.email>
date	Wed, 25 Mar 2015 13:23:29 -0600
parents
children

rev	line source
0 6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	1 #!/usr/bin/env perl
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	2
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	3 use strict;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	4 use warnings;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	5
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	6 my $quiet = 0;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	7 if(@ARGV and $ARGV[0] =~ /^-q/){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	8 $quiet = 1;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	9 shift @ARGV;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	10 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	11
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	12 @ARGV == 4 or die "Usage: $0 [-q(uiet)] <MGI knockout pheno data dir> <hgvs_annotated.txt> <output.txt> <query>\n",
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	13 "Where query has the format \"this or that\", \"this and that\", etc.\n",
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	14 "Knockout files are available from ftp://ftp.informatics.jax.org/pub/reports/MPheno_OBO.ontology and ftp://ftp.informatics.jax.org/pub/reports/HMD_HumanPhenotype.rpt\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	15
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	16 my $mgi_dir = shift @ARGV;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	17 my $obo_file = "$mgi_dir/MPheno_OBO.ontology";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	18 my $human_mouse_file = "$mgi_dir/HMD_HumanPhenotype.rpt";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	19 my $geno_pheno_file = "$mgi_dir/MGI_PhenoGenoMP.rpt";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	20 my $hgvs_file = shift @ARGV;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	21 my $out_file = shift @ARGV;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	22 my $query = shift @ARGV;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	23
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	24 #$query = quotemeta($query); # in case there are meta characters in the query, treat them as literals
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	25 my %problematic_terms = ();
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	26
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	27 # convert the query to a regex
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	28 my $orig_query = $query;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	29 my $and_query = 0;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	30 $query =~ s/$\s.+?\s$/my $s=$&;$s=~s(\s+or\s+)(\|)g; $s/eg;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	31 if($query =~ s/(\S+)\s+and\s+(\S+)/(?:$1.?$2\|$2.?$1)/gi){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	32 $and_query = 1;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	33 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	34 $query =~ s/\s+or\s+/\|/gi;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	35 $query =~ s/\b([a-z])([a-z]+\b)/"[".uc($1)."$1]$2"/eg; # allow title case match in regex for letter only lower case words, otherwise make case sensitive as assuming gene name
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	36 #print STDERR "Query regex is $query\n" unless $quiet;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	37
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	38 open(OBO, $obo_file)
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	39 or die "Cannot open $obo_file for reading: $!\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	40 my %matched_pheno_ids;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	41 my %pheno_id2subtypes;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	42 my %pheno_id2name;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	43 my $record_count;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	44 $/ = "\n[Term]\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	45 <OBO>; # chuck header
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	46 while(<OBO>){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	47 next unless /^id:\s*(MP:\d+)/s;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	48 my $id = $1;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	49 next unless /\nname:\s(.+?)\s\n/s;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	50 my $name = $1;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	51 $pheno_id2name{$id} = $name;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	52 $record_count++;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	53 while(/\nis_a:\s*(MP:\d+)/g){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	54 my $parent_id = $1;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	55 $pheno_id2subtypes{$parent_id} = [] unless exists $pheno_id2subtypes{$parent_id};
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	56 push @{$pheno_id2subtypes{$parent_id}}, $id;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	57 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	58 if(exists $problematic_terms{$id}){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	59 if($name =~ /\b($query)/o){ # strict matching of name only if an entry with problematic free text
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	60 my $match = $1;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	61 $match =~ tr/\t\n/ /;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	62 $match =~ s/ {2,}/ /g;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	63 if(not exists $matched_pheno_ids{$id}){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	64 $matched_pheno_ids{$id} = $match;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	65 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	66 elsif($matched_pheno_ids{$id} !~ /$match/){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	67 $matched_pheno_ids{$id} .= "; $match";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	68 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	69 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	70 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	71 elsif(/\b($query)/o){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	72 my $match = $1;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	73 $match =~ tr/\t\n/ /;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	74 $match =~ s/ {2,}/ /g;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	75 if(not exists $matched_pheno_ids{$id}){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	76 $matched_pheno_ids{$id} = $match;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	77 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	78 elsif($matched_pheno_ids{$id} !~ /$match/){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	79 $matched_pheno_ids{$id} .= "; $match";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	80 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	81 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	82 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	83 close(OBO);
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	84 #print STDERR "Found ", scalar(keys %matched_pheno_ids), "/$record_count phenotype ontology terms matching the query\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	85
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	86 open(OUT, ">$out_file")
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	87 or die "Cannot open $out_file for writing: $!\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	88
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	89 # Implements term subsumption
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	90 my @matched_pheno_ids = keys %matched_pheno_ids;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	91 for(my $i = 0; $i <= $#matched_pheno_ids; $i++){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	92 my $pheno_id = $matched_pheno_ids[$i];
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	93 next unless exists $pheno_id2subtypes{$pheno_id};
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	94 for my $sub_type_id (@{$pheno_id2subtypes{$pheno_id}}){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	95 if(not exists $matched_pheno_ids{$sub_type_id}){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	96 $matched_pheno_ids{$sub_type_id} = $matched_pheno_ids{$pheno_id};
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	97 push @matched_pheno_ids, $sub_type_id;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	98 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	99 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	100 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	101
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	102 $/="\n"; # record separator
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	103 my %human2mouse;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	104 # example line:
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	105 # WNT3A 89780 Wnt3a MGI:98956 MP:0003012 MP:0003631 ... MP:0010768
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	106 open(HUMAN2MOUSE, $human_mouse_file)
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	107 or die "Cannot open $human_mouse_file for reading: $!\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	108 while(<HUMAN2MOUSE>){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	109 my @F = split /\t/, $_;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	110 $human2mouse{$F[0]} = $F[2];
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	111 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	112 close(HUMAN2MOUSE);
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	113
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	114 my %gene2pheno_ids;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	115 # example line:
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	116 # Rbpj<tm1Kyo>/Rbpj<tm1Kyo> Rbpj<tm1Kyo> involves: 129S2/SvPas * C57BL/6 MP:0001614 15466160 MGI:96522
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	117 open(PHENO, $geno_pheno_file)
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	118 or die "Cannot open $geno_pheno_file for reading: $!\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	119 while(<PHENO>){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	120 chomp;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	121 my @F = split /\t/, $_;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	122 next unless $#F > 2; # does it have the phenotype id field?
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	123 my $knockout = $F[0];
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	124 next if $knockout =~ /,/; # ignore double knockouts etc.
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	125 $knockout =~ s/^(\S+?)<.*/$1/; # keep only first gene name bit of knockout description
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	126 my $pheno_id = $F[3];
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	127 $gene2pheno_ids{$knockout} = [] unless exists $gene2pheno_ids{$knockout};
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	128 push @{$gene2pheno_ids{$knockout}}, [$pheno_id,$F[4]];
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	129 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	130
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	131 # remove genes if they don't have a matching phenotype
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	132 for my $gene (keys %gene2pheno_ids){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	133 my $keep = 0;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	134 for my $pheno_id (@{$gene2pheno_ids{$gene}}){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	135 if(exists $matched_pheno_ids{$pheno_id->[0]}){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	136 $keep = 1;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	137 last;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	138 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	139 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	140 delete $gene2pheno_ids{$gene} unless $keep;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	141 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	142 #print STDERR "Found ", scalar(keys %gene2pheno_ids), " genes with knockout phenotype ontology terms matching the query\n" unless $quiet;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	143
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	144 $/ = "\n"; # one line at, a time from the HGVS file please!
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	145 open(HGVS, $hgvs_file)
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	146 or die "Cannot open $hgvs_file for reading: $!\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	147 my $header = <HGVS>;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	148 chomp $header;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	149 my @header_columns = split /\t/, $header;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	150 my $gene_name_column;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	151 for(my $i = 0; $i <= $#header_columns; $i++){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	152 if($header_columns[$i] eq "Gene Name"){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	153 $gene_name_column = $i;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	154 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	155 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	156 if(not defined $gene_name_column){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	157 die "Could not find 'Gene Name' column in the input header, aborting\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	158 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	159 print OUT "$header\tMouse Knockout Phenotypes (matching $orig_query)\tMouse Phenotypes (other)\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	160
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	161 # Check if any of the variants in the annotated HGVS table are in knockout genes matching the target phenotypes list
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	162 while(<HGVS>){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	163 chomp;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	164 my @F = split /\t/, $_, -1;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	165 my (%target_phenos, %other_phenos);
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	166 for my $gene_name (split /\s;\s/, $F[$gene_name_column]){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	167 next unless exists $human2mouse{$gene_name};
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	168 next unless exists $gene2pheno_ids{$human2mouse{$gene_name}};
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	169 for my $pheno_id (@{$gene2pheno_ids{$human2mouse{$gene_name}}}){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	170 my ($id, $pmid) = @$pheno_id;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	171 if(exists $matched_pheno_ids{$id}){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	172 $target_phenos{$pmid} = [] unless exists $target_phenos{$pmid};
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	173 push @{$target_phenos{$pmid}}, $pheno_id2name{$id}."($matched_pheno_ids{$id})";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	174 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	175 else{
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	176 $other_phenos{$pmid} = [] unless exists $other_phenos{$pmid};
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	177 push @{$other_phenos{$pmid}}, $pheno_id2name{$id};
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	178 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	179 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	180 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	181 if(%target_phenos){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	182 print OUT join("\t", @F);
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	183 print OUT "\t";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	184 my $count = 0;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	185 for my $pmid (keys %target_phenos){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	186 print OUT " // " if $count++;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	187 print OUT "PubMed $pmid: ", join("; ", @{$target_phenos{$pmid}});
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	188 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	189 print OUT "\t";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	190 $count = 0;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	191 for my $pmid (keys %other_phenos){
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	192 print OUT " // " if $count++;
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	193 print OUT "PubMed $pmid: ", join("; ", @{$other_phenos{$pmid}});
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	194 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	195 print OUT "\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	196 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	197 else{
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	198 print OUT join("\t", @F, "", ""), "\n";
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	199 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	200 }
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	201 close(HGVS);
6411ca16916e initial commit Yusuf Ali <ali@yusuf.email> parents: diff changeset	202 close(OUT);

Mercurial > repos > yusuf > associate_phenotypes

annotate filter_by_mouse_knockout_pipe @ 0:6411ca16916e default tip