2dnmrannotation: nmr_annotation2d/annotationRmn2DGlobale.R annotate

annotate nmr_annotation2d/annotationRmn2DGlobale.R @ 0:8035235e46c7 draft

Uploaded

author	marie-tremblay-metatoul
date	Mon, 23 Dec 2019 09:26:20 -0500
parents
children

rev	line source
0 8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	1 ###########################################################################################################################################
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	2 # ANNOTATION SPECTRE 2D MATRICE COMPLEXE BASEE SUR UNE (OU PLUSIEURS) SEQUENCE(s) RMN #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	3 # template : dataframe contenant la liste des couples de deplacements chimiques de la matrice complexe a annoter #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	4 # cosy : 1 si sequence a utiliser / 0 sinon #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	5 # hmbc : 1 si sequence a utiliser / 0 sinon #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	6 # hsqc : 1 si sequence a utiliser / 0 sinon #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	7 # jres : 1 si sequence a utiliser / 0 sinon #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	8 # tocsy : 1 si sequence a utiliser / 0 sinon #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	9 # tolPpm1 : tolerance autorisee autour de la valeur1 du couple de deplacements chimiques #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	10 # tolPpm2HJRes : tolerance autorisee autour de la valeur2 du couple de deplacements chimiques si H dans dimension 2 #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	11 # tolPpm2C : tolerance autorisee autour de la valeur2 du couple de deplacements chimiques si C dans dimension 2 #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	12 # seuil : valeur du score de presence en deça de laquelle les metabolites annotes ne sont pas retenus #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	13 # unicite : boolean pour ne retenir que les ... #
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	14 ###########################################################################################################################################
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	15 ## CALCUL MOYENNE SANS VALEUR(S) MANQUANTE(S)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	16 mean.rmNa <- function(x)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	17 {
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	18 mean(x, na.rm=TRUE)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	19 }
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	20
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	21 annotationRmn2DGlobale <- function(template, tolPpm1=0.01, tolPpm2HJRes=0.002, tolPpm2C=0.5, cosy=1, hmbc=1, hsqc=1, jres=1, tocsy=1,
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	22 seuil, unicite="NO")
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	23 {
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	24 ## Initialisation
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	25 options (max.print=999999999)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	26 annotationCOSY <- data.frame()
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	27 annotationHMBC <- data.frame()
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	28 annotationHSQC <- data.frame()
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	29 annotationJRES <- data.frame()
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	30 annotationTOCSY <- data.frame()
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	31
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	32 dataCOSY <- "NA"
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	33 dataHMBC <- "NA"
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	34 dataHSQC <- "NA"
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	35 dataJRES <- "NA"
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	36 dataTOCSY <- "NA"
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	37
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	38 ## Application seuil seulement si annotation avec 1 seule sequence
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	39 ## seuilPls2D <- 0
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	40 ## if ((sum(cosy, hmbc, hsqc, jres, tocsy)) == 1)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	41 ## seuilPls2D <- seuil
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	42 seuilPls2D <- seuil
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	43
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	44 if (cosy == 1)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	45 {
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	46 matrice.cosy <- read.xlsx(template, sheet="COSY", startRow=2, colNames=TRUE, rowNames=FALSE, cols=1:3, na.strings="NA")
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	47 matrice.cosy <- matrice.cosy[matrice.cosy$peak.index != "x", ]
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	48 annotationCOSY <- annotationRmn2D(matrice.cosy, BdDReference_COSY, "COSY", ppm1Tol=tolPpm1, ppm2Tol=tolPpm1, seuil=seuilPls2D,
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	49 unicite=unicite)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	50 dataCOSY <- data.frame(Metabolite=str_to_lower(annotationCOSY$liste_resultat$Metabolite), score.COSY=annotationCOSY$liste_resultat$score)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	51 dataCOSY <- unique.data.frame(dataCOSY)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	52 }
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	53
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	54 if (hmbc == 1)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	55 {
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	56 matrice.hmbc <- read.xlsx(template, sheet="HMBC", startRow=2, colNames=TRUE, rowNames=FALSE, cols=1:3, na.strings="NA")
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	57 matrice.hmbc <- matrice.hmbc[matrice.hmbc$peak.index != "x", ]
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	58 annotationHMBC <- annotationRmn2D(matrice.hmbc, BdDReference_HMBC, "HMBC", ppm1Tol=tolPpm1, ppm2Tol=tolPpm2C, seuil=seuilPls2D,
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	59 unicite=unicite)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	60 dataHMBC <- data.frame(Metabolite=str_to_lower(annotationHMBC$liste_resultat$Metabolite), score.HMBC=annotationHMBC$liste_resultat$score)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	61 dataHMBC <- unique.data.frame(dataHMBC)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	62 }
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	63
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	64 if (hsqc == 1)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	65 {
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	66 matrice.hsqc <- read.xlsx(template, sheet="HSQC", startRow=2, colNames=TRUE, rowNames=FALSE, cols=1:3, na.strings="NA")
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	67 matrice.hsqc <- matrice.hsqc[matrice.hsqc$peak.index != "x", ]
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	68 annotationHSQC <- annotationRmn2D(matrice.hsqc, BdDReference_HSQC, "HSQC", ppm1Tol=tolPpm1, ppm2Tol=tolPpm2C, seuil=seuilPls2D,
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	69 unicite=unicite)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	70 dataHSQC <- data.frame(Metabolite=str_to_lower(annotationHSQC$liste_resultat$Metabolite), score.HSQC=annotationHSQC$liste_resultat$score)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	71 dataHSQC <- unique.data.frame(dataHSQC)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	72 }
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	73
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	74 if (jres == 1)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	75 {
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	76 matrice.jres <- read.xlsx(template, sheet="JRES", startRow=2, colNames=TRUE, rowNames=FALSE, cols=1:3, na.strings="NA")
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	77 matrice.jres <- matrice.jres[matrice.jres$peak.index != "x", ]
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	78 annotationJRES <- annotationRmn2D(matrice.jres, BdDReference_JRES, "JRES", ppm1Tol=tolPpm1, ppm2Tol=tolPpm2HJRes, seuil=seuilPls2D,
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	79 unicite=unicite)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	80 dataJRES <- data.frame(Metabolite=str_to_lower(annotationJRES$liste_resultat$Metabolite), score.JRES=annotationJRES$liste_resultat$score)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	81 dataJRES <- unique.data.frame(dataJRES)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	82 }
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	83
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	84 if (tocsy == 1)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	85 {
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	86 matrice.tocsy <- read.xlsx(template, sheet="TOCSY", startRow=2, colNames=TRUE, rowNames=FALSE, cols=1:3, na.strings="NA")
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	87 matrice.tocsy <- matrice.tocsy[matrice.tocsy$peak.index != "x", ]
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	88 annotationTOCSY <- annotationRmn2D(matrice.tocsy, BdDReference_TOCSY, "TOCSY", ppm1Tol=tolPpm1, ppm2Tol=tolPpm1, seuil=seuilPls2D,
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	89 unicite=unicite)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	90 dataTOCSY <- data.frame(Metabolite=str_to_lower(annotationTOCSY$liste_resultat$Metabolite), score.TOCSY=annotationTOCSY$liste_resultat$score)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	91 dataTOCSY <- unique.data.frame(dataTOCSY)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	92 }
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	93
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	94 sequencesCombinationAverageScoreSeuil <- data.frame()
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	95 sequencesCombinationAverageScoreSeuilFiltre <- data.frame()
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	96
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	97 ## CONCATENATION RESULTATS DIFFERENTES SEQUENCES
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	98 data2D <- list(dataCOSY, dataHMBC, dataHSQC, dataJRES, dataTOCSY)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	99 whichSequenceNaN <- which((data2D != "NA"))
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	100 data2D <- data2D[whichSequenceNaN]
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	101 sequencesCombination <- data.frame(data2D[1])
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	102 sequencesCombinationAverageScore <- sequencesCombination
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	103
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	104 ## Si une seule sequence et seuil sur score = filtre applique dans la fonction annotationRmn2D
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	105 if (length(data2D) >= 2)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	106 {
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	107 ## CONCATENATION SCORE PAR SEQUENCE
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	108 for (l in 2:length(data2D))
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	109 sequencesCombination <- merge.data.frame(sequencesCombination, data2D[l], by="Metabolite", all.x=TRUE, all.y=TRUE)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	110
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	111 ## SCORE MOYEN (sans prise en compte valeurs manquantes)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	112 meanScore <- apply(sequencesCombination[, -1], 1, FUN=mean.rmNa)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	113 sequencesCombinationAverageScore <- cbind.data.frame(sequencesCombination, averageScore=meanScore)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	114 ## SUPPRESSION METABOLITE AVEC SCORE MOYEN < SEUIL
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	115 ## sequencesCombinationAverageScoreSeuilFiltre <- filter(sequencesCombinationAverageScore, averageScore >= seuil)
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	116 sequencesCombinationAverageScoreSeuilFiltre <- sequencesCombinationAverageScore[sequencesCombinationAverageScore$averageScore > seuil, ]
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	117 }
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	118
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	119 return(list(COSY=annotationCOSY, HMBC=annotationHMBC, HSQC=annotationHSQC, JRES=annotationJRES, TOCSY=annotationTOCSY,
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	120 combination=sequencesCombinationAverageScoreSeuilFiltre))
8035235e46c7 Uploaded marie-tremblay-metatoul parents: diff changeset	121 }

Mercurial > repos > marie-tremblay-metatoul > 2dnmrannotation

annotate nmr_annotation2d/annotationRmn2DGlobale.R @ 0:8035235e46c7 draft