downloader_bank_hmdb: lib/hmdb

author	fgiacomoni
date	Tue, 14 Jan 2020 05:21:23 -0500
parents
children	be504ccbc41c

rev	line source
0 7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	1 package hmdb_api ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	2
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	3 use strict;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	4 use warnings ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	5 use Exporter ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	6 use Carp ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	7
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	8 use Data::Dumper ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	9 use XML::Twig ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	10
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	11 use csv ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	12
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	13 use vars qw($VERSION @ISA @EXPORT %EXPORT_TAGS);
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	14
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	15 our $VERSION = "1.0";
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	16 our @ISA = qw(Exporter);
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	17 our @EXPORT = qw( getMetaboliteFeatures cowmetdb_handle cowmetdb_hash cowmetdb_hash_to_inhouse_format buildMetabolitesArray setMetaboliteAcurrateMzToModesMz);
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	18 our %EXPORT_TAGS = ( ALL => [qw( getMetaboliteFeatures cowmetdb_handle cowmetdb_hash cowmetdb_hash_to_inhouse_format buildMetabolitesArray setMetaboliteAcurrateMzToModesMz)] );
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	19
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	20 =head1 NAME
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	21
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	22 My::Module - An example module
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	23
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	24 =head1 SYNOPSIS
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	25
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	26 use My::Module;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	27 my $object = My::Module->new();
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	28 print $object->as_string;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	29
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	30 =head1 DESCRIPTION
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	31
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	32 This module does not really exist, it
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	33 was made for the sole purpose of
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	34 demonstrating how POD works.
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	35
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	36 =head1 METHODS
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	37
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	38 Methods are :
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	39
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	40 =head2 METHOD new
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	41
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	42 ## Description : new
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	43 ## Input : $self
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	44 ## Ouput : bless $self ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	45 ## Usage : new() ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	46
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	47 =cut
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	48
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	49 sub new {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	50 ## Variables
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	51 my $self={};
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	52 bless($self) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	53 return $self ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	54 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	55 ### END of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	56
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	57
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	58 =head2 METHOD cowmetdb_handle
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	59
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	60 ## Description : open a flat file and push the contains in memory - compute entries number.
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	61 ## Input : $flat
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	62 ## Output : $handler, $entries
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	63 ## Usage : my ( $handler ) = cowmetdb_handle( $flat ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	64
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	65 =cut
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	66 ## START of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	67 sub cowmetdb_handle {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	68 ## Retrieve Values
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	69 my $self = shift ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	70 my ( $flat ) = @_ ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	71
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	72 my @handle = () ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	73 my $entries = 0 ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	74 my ( $begin, $end ) = ( 0, 0 ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	75
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	76 if ( -e $flat ) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	77 open(FILE, "<$flat") or die "Cant' read the file $flat\n" ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	78 while (my $line = <FILE>){
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	79 chomp $line ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	80 push(@handle, $line) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	81 if ( $line =~ /^#BEGIN_METABOCARD/ ) { $begin = 1 ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	82 elsif ( ( $line =~ /^#END_METABOCARD/ ) and ( $begin == 1 ) ){ $end = 1 ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	83 ## count entries
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	84 if ( ( $end == 1 ) and ( $begin == 1 ) ){ $entries++ ; ( $begin, $end ) = ( 0, 0 ) ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	85 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	86 close(FILE) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	87 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	88 else {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	89 croak "Can't find the source file $flat\n" ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	90 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	91
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	92 return(\@handle, \$entries) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	93 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	94 ## END of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	95
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	96 =head2 METHOD cowmetdb_hash
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	97
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	98 ## Description : work on a hmdb flat text handler and field data (selected fields), build a hash for each found entry
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	99 ## Input : $handler
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	100 ## Output : $entries
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	101 ## Usage : my ( $entries ) = hmdb_hash( $handler ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	102
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	103 =cut
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	104 ## START of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	105 sub cowmetdb_hash {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	106 ## Retrieve Values
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	107 my $self = shift ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	108 my ( $handle ) = @_ ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	109
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	110 my @entries = () ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	111 my %entry = () ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	112 my $pos = 0 ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	113
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	114 if ( ( defined $handle ) ) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	115 foreach my $data ( @$handle ) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	116
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	117 if( $data =~ /^#BEGIN_METABOCARD/ ) { %entry = () ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	118 elsif( $data =~ /^#END_METABOCARD/ ) { my %temp = %entry ; push (@entries, \%temp) ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	119 elsif( $data =~ /^# name:/ ) { $entry{'COMMON_NAME'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	120 elsif( $data =~ /^# iupac:/ ) { $entry{'IUPAC'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	121 elsif( $data =~ /^# kegg_compound_id:/ ) { $entry{'KEGG_ID'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	122 elsif( $data =~ /^# chemical_formula:/ ) { $entry{'FORMULA'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	123 elsif( $data =~ /^# taxonomy_super_class:/ ) { $entry{'TAXONOMY'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	124 elsif( $data =~ /^# cas_number:/ ) { $entry{'CAS'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	125 elsif( $data =~ /^# biofluid_location:/ ) { $entry{'LOCATION'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	126 elsif( $data =~ /^# inchi_identifier:/ ) { $entry{'INCHI'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	127 elsif( $data =~ /^# weight_average:/ ) { $entry{'MZ_AVERAGE'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	128 elsif( $data =~ /^# weight_mono:/ ) { $entry{'MZ_MONO'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	129 elsif( $data =~ /^# biocyc_id:/ ) { $entry{'BIOCYC_ID'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	130 elsif( $data =~ /^# hmdb_id:/ ) { $entry{'HMDB_ID'} = $handle->[$pos+1] ; }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	131
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	132 $pos++ ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	133 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	134 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	135 else {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	136 croak "Handle is not defined : parsing step impossible\n" ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	137 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	138
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	139 return(\@entries) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	140 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	141 ## END of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	142
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	143
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	144
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	145 =head2 METHOD getMetaboliteFeatures
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	146
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	147 ## Description : get metabolites features from a xml file
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	148 ## Input : $xmlFile,
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	149 ## Output : $metabolites
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	150 ## Usage : $metabolites = getMetaboliteFeatures($xmlFile) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	151
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	152 =cut
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	153 sub getMetaboliteFeatures {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	154 ## Retrieve Values
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	155 my $self = shift ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	156 my ( $xmlFile ) = @_ ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	157
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	158 my %metabolites = () ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	159 my $twig = undef ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	160 my $id = undef ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	161
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	162 if (-e $xmlFile) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	163
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	164 $twig = XML::Twig->nparse_ppe(
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	165
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	166 twig_handlers => {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	167 'metabolite/accession' => sub {$id = $_ -> text_only ; $metabolites{$id} = undef ; } ,
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	168 # metabolite name
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	169 'metabolite/name' => sub { $metabolites{$id}{'metabolite_name'} = $_ -> text_only ; } ,
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	170 # metabolite chemical_formula
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	171 'metabolite/chemical_formula' => sub { $metabolites{$id}{'chemical_formula'} = $_ -> text_only ; } ,
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	172 # metabolite monisotopic_molecular_weight
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	173 'metabolite/monisotopic_molecular_weight' => sub { $metabolites{$id}{'monisotopic_molecular_weight'} = $_ -> text_only ; } , ## general case
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	174 'metabolite/monisotopic_moleculate_weight' => sub { $metabolites{$id}{'monisotopic_molecular_weight'} = $_ -> text_only ; } , ##
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	175 # metabolite inchikey
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	176 'metabolite/inchikey' => sub { $metabolites{$id}{'inchikey'} = $_ -> text_only ; } ,
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	177 },
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	178 pretty_print => 'indented',
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	179 error_context => 1, $xmlFile
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	180 );
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	181
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	182 # $twig->print;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	183 $twig->purge ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	184 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	185
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	186 ## get number of entries:
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	187 my $X = keys %metabolites ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	188
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	189 return (\%metabolites, $X) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	190
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	191
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	192 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	193 ### END of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	194
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	195 =head2 METHOD setMetaboliteAcurrateMzToModesMz
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	196
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	197 ## Description : set M+H and M-H masses from a metabolite (M) accurate mass
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	198 ## Input : $metabolites, $proton_mass, $electron_mass
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	199 ## Output : $mzsMetabolites
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	200 ## Usage : my ( $mzsMetabolites ) = setMetaboliteAcurrateMzToModesMz ( $metabolites, $proton_mass, $electron_mass ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	201
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	202 =cut
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	203 ## START of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	204 sub setMetaboliteAcurrateMzToModesMz {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	205 ## Retrieve Values
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	206 my $self = shift ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	207 my ( $format, $metabolites, $proton_mass, $electron_mass, $charge ) = @_;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	208
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	209 if ($format eq 'XML') {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	210 foreach my $id (sort keys %{$metabolites}) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	211 if ( $metabolites->{$id}{'monisotopic_molecular_weight'} ) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	212 my $tmp_mass = $metabolites->{$id}{'monisotopic_molecular_weight'} ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	213 $metabolites->{$id}{'[M+H]+'} = ( $tmp_mass + $proton_mass - $electron_mass) * $charge ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	214 $metabolites->{$id}{'[M-H]-'} = ( $tmp_mass - $proton_mass + $electron_mass) * $charge ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	215 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	216 else {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	217 warn "No monisotopic_molecular_weight field exists with metabolite $id\n " ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	218 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	219 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	220 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	221 elsif ( ($format eq 'CARD') ) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	222 foreach my $entry (@$metabolites) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	223 if ( $entry->{'MZ_MONO'} ) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	224 my $tmp_mass = $entry->{'MZ_MONO'} ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	225 $entry->{'MZ_[M+H]+'} = ( $tmp_mass + $proton_mass - $electron_mass) * $charge ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	226 $entry->{'MZ_[M-H]-'} = ( $tmp_mass - $proton_mass + $electron_mass) * $charge ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	227 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	228 else {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	229 warn "No MZ_MONO field exists with metabolite $entry->{'HMDB_ID'}\n " ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	230 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	231 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	232 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	233
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	234
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	235 return ($metabolites) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	236 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	237 ### END of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	238
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	239 =head2 METHOD buildMetabolitesArray
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	240
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	241 ## Description : build a metabolite list from xml extraction
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	242 ## Input : $metabolites, $headers
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	243 ## Output : $metabolitesSorted
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	244 ## Usage : my ( $metabolitesSorted ) = buildMetabolitesArray ( $metabolites, $headers ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	245
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	246 =cut
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	247 ## START of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	248 sub buildMetabolitesArray {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	249 ## Retrieve Values
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	250 my $self = shift ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	251 my ( $metabolites, $headers ) = @_;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	252 my ( @metabolitesSorted ) = ( () ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	253
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	254 ## header format is ['HMDB_ID','MzBank', 'MetName', 'ChemFormula', 'INChIkey']
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	255 if (defined $headers) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	256 push ( @metabolitesSorted, $headers ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	257 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	258 else {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	259 push ( @metabolitesSorted, ['HMDB_ID','MzBank', '[M+H]+', '[M-H]-', 'MetName', 'ChemFormula', 'INChIkey'] ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	260 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	261
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	262 foreach my $id (sort keys %{$metabolites}) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	263 my @tmp = () ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	264 push (@tmp, $id) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	265 push (@tmp, $metabolites->{$id}{'monisotopic_molecular_weight'}) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	266 push (@tmp, $metabolites->{$id}{'[M+H]+'}) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	267 push (@tmp, $metabolites->{$id}{'[M-H]-'}) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	268 push (@tmp, $metabolites->{$id}{'metabolite_name'}) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	269 push (@tmp, $metabolites->{$id}{'chemical_formula'}) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	270 push (@tmp, $metabolites->{$id}{'inchikey'}) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	271
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	272 # merge
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	273 push (@metabolitesSorted, \@tmp) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	274 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	275
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	276 return (\@metabolitesSorted) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	277 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	278 ### END of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	279
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	280 =head2 METHOD cowmetdb_hash_to_inhouse_format
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	281
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	282 ## Description : adaptator from hash cowmetdb entry to inhouse format
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	283 ## Input : $entries
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	284 ## Output : $tsv_handler
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	285 ## Usage : my ( $tsv_handler ) = cowmetdb_hash_to_inhouse_format( $entries ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	286
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	287 =cut
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	288 ## START of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	289 sub cowmetdb_hash_to_inhouse_format {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	290 ## Retrieve Values
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	291 my $self = shift ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	292 my ( $entries ) = @_ ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	293
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	294 my @fields_name = ('HMDB_ID', 'COMMON_NAME', 'CAS', 'FORMULA', 'MZ_MONO', 'MZ_AVERAGE', 'MZ_[M+H]+', 'MZ_[M-H]-', 'KEGG_ID', 'BIOCYC_ID', 'INCHI', 'LOCATION', 'TAXONOMY', 'IUPAC') ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	295 my @tsv_handler = () ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	296 push (@tsv_handler, \@fields_name) ; ## first line
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	297
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	298 foreach my $entry (@$entries) {
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	299 my @tmp = ( $entry->{'HMDB_ID'}, $entry->{'COMMON_NAME'}, $entry->{'CAS'}, $entry->{'FORMULA'}, $entry->{'MZ_MONO'}, $entry->{'MZ_AVERAGE'}, $entry->{'MZ_[M+H]+'}, $entry->{'MZ_[M-H]-'}, $entry->{'KEGG_ID'}, $entry->{'BIOCYC_ID'},
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	300 $entry->{'INCHI'}, $entry->{'LOCATION'}, $entry->{'TAXONOMY'}, $entry->{'IUPAC'} ) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	301 push (@tsv_handler, \@tmp) ; ## one entry by one line
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	302 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	303
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	304 return(\@tsv_handler) ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	305 }
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	306 ## END of SUB
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	307
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	308
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	309 1 ;
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	310
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	311
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	312 __END__
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	313
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	314 =head1 SUPPORT
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	315
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	316 You can find documentation for this module with the perldoc command.
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	317
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	318 perldoc XXX.pm
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	319
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	320 =head1 Exports
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	321
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	322 =over 4
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	323
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	324 =item :ALL is ...
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	325
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	326 =back
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	327
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	328 =head1 AUTHOR
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	329
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	330 Franck Giacomoni E<lt>franck.giacomoni@clermont.inra.frE<gt>
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	331
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	332 =head1 LICENSE
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	333
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	334 This program is free software; you can redistribute it and/or modify it under the same terms as Perl itself.
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	335
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	336 =head1 VERSION
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	337
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	338 version 1 : xx / xx / 201x
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	339
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	340 version 2 : ??
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	341
7c9269bded0e Init repository for [downloader_bank_hmdb] fgiacomoni parents: diff changeset	342 =cut

0

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

1 package hmdb_api ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

2

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

3 use strict;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

4 use warnings ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

5 use Exporter ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

6 use Carp ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

7

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

8 use Data::Dumper ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

9 use XML::Twig ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

10

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

11 use csv ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

12

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

13 use vars qw($VERSION @ISA @EXPORT %EXPORT_TAGS);

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

14

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

15 our $VERSION = "1.0";

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

16 our @ISA = qw(Exporter);

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

17 our @EXPORT = qw( getMetaboliteFeatures cowmetdb_handle cowmetdb_hash cowmetdb_hash_to_inhouse_format buildMetabolitesArray setMetaboliteAcurrateMzToModesMz);

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

18 our %EXPORT_TAGS = ( ALL => [qw( getMetaboliteFeatures cowmetdb_handle cowmetdb_hash cowmetdb_hash_to_inhouse_format buildMetabolitesArray setMetaboliteAcurrateMzToModesMz)] );

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

19

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

20 =head1 NAME

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

21

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

22 My::Module - An example module

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

23

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

24 =head1 SYNOPSIS

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

25

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

26 use My::Module;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

27 my $object = My::Module->new();

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

28 print $object->as_string;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

29

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

30 =head1 DESCRIPTION

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

31

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

32 This module does not really exist, it

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

33 was made for the sole purpose of

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

34 demonstrating how POD works.

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

35

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

36 =head1 METHODS

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

37

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

38 Methods are :

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

39

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

40 =head2 METHOD new

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

41

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

42 ## Description : new

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

43 ## Input : $self

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

44 ## Ouput : bless $self ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

45 ## Usage : new() ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

46

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

47 =cut

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

48

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

49 sub new {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

50 ## Variables

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

51 my $self={};

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

52 bless($self) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

53 return $self ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

54 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

55 ### END of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

56

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

57

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

58 =head2 METHOD cowmetdb_handle

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

59

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

60 ## Description : open a flat file and push the contains in memory - compute entries number.

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

61 ## Input : $flat

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

62 ## Output : $handler, $entries

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

63 ## Usage : my ( $handler ) = cowmetdb_handle( $flat ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

64

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

65 =cut

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

66 ## START of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

67 sub cowmetdb_handle {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

68 ## Retrieve Values

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

69 my $self = shift ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

70 my ( $flat ) = @_ ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

71

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

72 my @handle = () ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

73 my $entries = 0 ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

74 my ( $begin, $end ) = ( 0, 0 ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

75

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

76 if ( -e $flat ) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

77 open(FILE, "<$flat") or die "Cant' read the file $flat\n" ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

78 while (my $line = <FILE>){

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

79 chomp $line ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

80 push(@handle, $line) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

81 if ( $line =~ /^#BEGIN_METABOCARD/ ) { $begin = 1 ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

82 elsif ( ( $line =~ /^#END_METABOCARD/ ) and ( $begin == 1 ) ){ $end = 1 ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

83 ## count entries

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

84 if ( ( $end == 1 ) and ( $begin == 1 ) ){ $entries++ ; ( $begin, $end ) = ( 0, 0 ) ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

85 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

86 close(FILE) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

87 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

88 else {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

89 croak "Can't find the source file $flat\n" ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

90 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

91

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

92 return(\@handle, \$entries) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

93 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

94 ## END of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

95

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

96 =head2 METHOD cowmetdb_hash

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

97

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

98 ## Description : work on a hmdb flat text handler and field data (selected fields), build a hash for each found entry

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

99 ## Input : $handler

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

100 ## Output : $entries

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

101 ## Usage : my ( $entries ) = hmdb_hash( $handler ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

102

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

103 =cut

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

104 ## START of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

105 sub cowmetdb_hash {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

106 ## Retrieve Values

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

107 my $self = shift ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

108 my ( $handle ) = @_ ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

109

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

110 my @entries = () ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

111 my %entry = () ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

112 my $pos = 0 ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

113

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

114 if ( ( defined $handle ) ) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

115 foreach my $data ( @$handle ) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

116

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

117 if( $data =~ /^#BEGIN_METABOCARD/ ) { %entry = () ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

118 elsif( $data =~ /^#END_METABOCARD/ ) { my %temp = %entry ; push (@entries, \%temp) ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

119 elsif( $data =~ /^# name:/ ) { $entry{'COMMON_NAME'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

120 elsif( $data =~ /^# iupac:/ ) { $entry{'IUPAC'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

121 elsif( $data =~ /^# kegg_compound_id:/ ) { $entry{'KEGG_ID'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

122 elsif( $data =~ /^# chemical_formula:/ ) { $entry{'FORMULA'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

123 elsif( $data =~ /^# taxonomy_super_class:/ ) { $entry{'TAXONOMY'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

124 elsif( $data =~ /^# cas_number:/ ) { $entry{'CAS'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

125 elsif( $data =~ /^# biofluid_location:/ ) { $entry{'LOCATION'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

126 elsif( $data =~ /^# inchi_identifier:/ ) { $entry{'INCHI'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

127 elsif( $data =~ /^# weight_average:/ ) { $entry{'MZ_AVERAGE'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

128 elsif( $data =~ /^# weight_mono:/ ) { $entry{'MZ_MONO'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

129 elsif( $data =~ /^# biocyc_id:/ ) { $entry{'BIOCYC_ID'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

130 elsif( $data =~ /^# hmdb_id:/ ) { $entry{'HMDB_ID'} = $handle->[$pos+1] ; }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

131

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

132 $pos++ ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

133 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

134 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

135 else {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

136 croak "Handle is not defined : parsing step impossible\n" ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

137 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

138

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

139 return(\@entries) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

140 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

141 ## END of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

142

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

143

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

144

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

145 =head2 METHOD getMetaboliteFeatures

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

146

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

147 ## Description : get metabolites features from a xml file

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

148 ## Input : $xmlFile,

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

149 ## Output : $metabolites

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

150 ## Usage : $metabolites = getMetaboliteFeatures($xmlFile) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

151

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

152 =cut

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

153 sub getMetaboliteFeatures {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

154 ## Retrieve Values

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

155 my $self = shift ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

156 my ( $xmlFile ) = @_ ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

157

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

158 my %metabolites = () ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

159 my $twig = undef ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

160 my $id = undef ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

161

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

162 if (-e $xmlFile) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

163

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

164 $twig = XML::Twig->nparse_ppe(

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

165

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

166 twig_handlers => {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

167 'metabolite/accession' => sub {$id = $_ -> text_only ; $metabolites{$id} = undef ; } ,

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

168 # metabolite name

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

169 'metabolite/name' => sub { $metabolites{$id}{'metabolite_name'} = $_ -> text_only ; } ,

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

170 # metabolite chemical_formula

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

171 'metabolite/chemical_formula' => sub { $metabolites{$id}{'chemical_formula'} = $_ -> text_only ; } ,

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

172 # metabolite monisotopic_molecular_weight

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

173 'metabolite/monisotopic_molecular_weight' => sub { $metabolites{$id}{'monisotopic_molecular_weight'} = $_ -> text_only ; } , ## general case

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

174 'metabolite/monisotopic_moleculate_weight' => sub { $metabolites{$id}{'monisotopic_molecular_weight'} = $_ -> text_only ; } , ##

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

175 # metabolite inchikey

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

176 'metabolite/inchikey' => sub { $metabolites{$id}{'inchikey'} = $_ -> text_only ; } ,

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

177 },

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

178 pretty_print => 'indented',

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

179 error_context => 1, $xmlFile

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

180 );

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

181

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

182 # $twig->print;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

183 $twig->purge ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

184 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

185

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

186 ## get number of entries:

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

187 my $X = keys %metabolites ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

188

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

189 return (\%metabolites, $X) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

190

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

191

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

192 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

193 ### END of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

194

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

195 =head2 METHOD setMetaboliteAcurrateMzToModesMz

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

196

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

197 ## Description : set M+H and M-H masses from a metabolite (M) accurate mass

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

198 ## Input : $metabolites, $proton_mass, $electron_mass

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

199 ## Output : $mzsMetabolites

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

200 ## Usage : my ( $mzsMetabolites ) = setMetaboliteAcurrateMzToModesMz ( $metabolites, $proton_mass, $electron_mass ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

201

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

202 =cut

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

203 ## START of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

204 sub setMetaboliteAcurrateMzToModesMz {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

205 ## Retrieve Values

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

206 my $self = shift ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

207 my ( $format, $metabolites, $proton_mass, $electron_mass, $charge ) = @_;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

208

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

209 if ($format eq 'XML') {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

210 foreach my $id (sort keys %{$metabolites}) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

211 if ( $metabolites->{$id}{'monisotopic_molecular_weight'} ) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

212 my $tmp_mass = $metabolites->{$id}{'monisotopic_molecular_weight'} ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

213 $metabolites->{$id}{'[M+H]+'} = ( $tmp_mass + $proton_mass - $electron_mass) * $charge ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

214 $metabolites->{$id}{'[M-H]-'} = ( $tmp_mass - $proton_mass + $electron_mass) * $charge ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

215 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

216 else {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

217 warn "No monisotopic_molecular_weight field exists with metabolite $id\n " ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

218 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

219 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

220 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

221 elsif ( ($format eq 'CARD') ) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

222 foreach my $entry (@$metabolites) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

223 if ( $entry->{'MZ_MONO'} ) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

224 my $tmp_mass = $entry->{'MZ_MONO'} ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

225 $entry->{'MZ_[M+H]+'} = ( $tmp_mass + $proton_mass - $electron_mass) * $charge ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

226 $entry->{'MZ_[M-H]-'} = ( $tmp_mass - $proton_mass + $electron_mass) * $charge ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

227 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

228 else {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

229 warn "No MZ_MONO field exists with metabolite $entry->{'HMDB_ID'}\n " ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

230 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

231 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

232 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

233

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

234

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

235 return ($metabolites) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

236 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

237 ### END of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

238

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

239 =head2 METHOD buildMetabolitesArray

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

240

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

241 ## Description : build a metabolite list from xml extraction

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

242 ## Input : $metabolites, $headers

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

243 ## Output : $metabolitesSorted

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

244 ## Usage : my ( $metabolitesSorted ) = buildMetabolitesArray ( $metabolites, $headers ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

245

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

246 =cut

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

247 ## START of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

248 sub buildMetabolitesArray {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

249 ## Retrieve Values

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

250 my $self = shift ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

251 my ( $metabolites, $headers ) = @_;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

252 my ( @metabolitesSorted ) = ( () ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

253

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

254 ## header format is ['HMDB_ID','MzBank', 'MetName', 'ChemFormula', 'INChIkey']

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

255 if (defined $headers) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

256 push ( @metabolitesSorted, $headers ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

257 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

258 else {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

259 push ( @metabolitesSorted, ['HMDB_ID','MzBank', '[M+H]+', '[M-H]-', 'MetName', 'ChemFormula', 'INChIkey'] ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

260 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

261

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

262 foreach my $id (sort keys %{$metabolites}) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

263 my @tmp = () ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

264 push (@tmp, $id) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

265 push (@tmp, $metabolites->{$id}{'monisotopic_molecular_weight'}) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

266 push (@tmp, $metabolites->{$id}{'[M+H]+'}) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

267 push (@tmp, $metabolites->{$id}{'[M-H]-'}) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

268 push (@tmp, $metabolites->{$id}{'metabolite_name'}) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

269 push (@tmp, $metabolites->{$id}{'chemical_formula'}) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

270 push (@tmp, $metabolites->{$id}{'inchikey'}) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

271

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

272 # merge

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

273 push (@metabolitesSorted, \@tmp) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

274 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

275

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

276 return (\@metabolitesSorted) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

277 }

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

278 ### END of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

279

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

280 =head2 METHOD cowmetdb_hash_to_inhouse_format

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

281

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

282 ## Description : adaptator from hash cowmetdb entry to inhouse format

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

283 ## Input : $entries

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

284 ## Output : $tsv_handler

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

285 ## Usage : my ( $tsv_handler ) = cowmetdb_hash_to_inhouse_format( $entries ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

286

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

287 =cut

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

288 ## START of SUB

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

289 sub cowmetdb_hash_to_inhouse_format {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

290 ## Retrieve Values

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

291 my $self = shift ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

292 my ( $entries ) = @_ ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

293

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

294 my @fields_name = ('HMDB_ID', 'COMMON_NAME', 'CAS', 'FORMULA', 'MZ_MONO', 'MZ_AVERAGE', 'MZ_[M+H]+', 'MZ_[M-H]-', 'KEGG_ID', 'BIOCYC_ID', 'INCHI', 'LOCATION', 'TAXONOMY', 'IUPAC') ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

295 my @tsv_handler = () ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

296 push (@tsv_handler, \@fields_name) ; ## first line

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

297

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

298 foreach my $entry (@$entries) {

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

299 my @tmp = ( $entry->{'HMDB_ID'}, $entry->{'COMMON_NAME'}, $entry->{'CAS'}, $entry->{'FORMULA'}, $entry->{'MZ_MONO'}, $entry->{'MZ_AVERAGE'}, $entry->{'MZ_[M+H]+'}, $entry->{'MZ_[M-H]-'}, $entry->{'KEGG_ID'}, $entry->{'BIOCYC_ID'},

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

300 $entry->{'INCHI'}, $entry->{'LOCATION'}, $entry->{'TAXONOMY'}, $entry->{'IUPAC'} ) ;

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni

parents:

diff changeset

301 push (@tsv_handler, \@tmp) ; ## one entry by one line

7c9269bded0e Init repository for [downloader_bank_hmdb]

fgiacomoni