oghma: aggregation.R annotate

annotate aggregation.R @ 50:271484f95ede draft

Uploaded

author	nicolas
date	Wed, 26 Oct 2016 17:58:08 -0400
parents
children

rev	line source
50 271484f95ede Uploaded nicolas parents: diff changeset	1 ########################################################
271484f95ede Uploaded nicolas parents: diff changeset	2 #
271484f95ede Uploaded nicolas parents: diff changeset	3 # creation date : 25/10/16
271484f95ede Uploaded nicolas parents: diff changeset	4 # last modification : 25/10/16
271484f95ede Uploaded nicolas parents: diff changeset	5 # author : Dr Nicolas Beaume
271484f95ede Uploaded nicolas parents: diff changeset	6 #
271484f95ede Uploaded nicolas parents: diff changeset	7 ########################################################
271484f95ede Uploaded nicolas parents: diff changeset	8
271484f95ede Uploaded nicolas parents: diff changeset	9 suppressWarnings(suppressMessages(library(GA)))
271484f95ede Uploaded nicolas parents: diff changeset	10 library("miscTools")
271484f95ede Uploaded nicolas parents: diff changeset	11 library(rpart)
271484f95ede Uploaded nicolas parents: diff changeset	12 suppressWarnings(suppressMessages(library(randomForest)))
271484f95ede Uploaded nicolas parents: diff changeset	13 library(e1071)
271484f95ede Uploaded nicolas parents: diff changeset	14 suppressWarnings(suppressMessages(library(glmnet)))
271484f95ede Uploaded nicolas parents: diff changeset	15 options(warn=-1)
271484f95ede Uploaded nicolas parents: diff changeset	16 ############################ helper functions #######################
271484f95ede Uploaded nicolas parents: diff changeset	17
271484f95ede Uploaded nicolas parents: diff changeset	18 ##### Genetic algorithm
271484f95ede Uploaded nicolas parents: diff changeset	19
271484f95ede Uploaded nicolas parents: diff changeset	20 # compute r2 by computing the classic formula
271484f95ede Uploaded nicolas parents: diff changeset	21 # compare the sum of square difference from target to prediciton
271484f95ede Uploaded nicolas parents: diff changeset	22 # to the sum of square difference from target to the mean of the target
271484f95ede Uploaded nicolas parents: diff changeset	23 r2 <- function(target, prediction) {
271484f95ede Uploaded nicolas parents: diff changeset	24 sst <- sum((target-mean(target))^2)
271484f95ede Uploaded nicolas parents: diff changeset	25 ssr <- sum((target-prediction)^2)
271484f95ede Uploaded nicolas parents: diff changeset	26 return(1-ssr/sst)
271484f95ede Uploaded nicolas parents: diff changeset	27 }
271484f95ede Uploaded nicolas parents: diff changeset	28
271484f95ede Uploaded nicolas parents: diff changeset	29 optimizeOneIndividual <- function(values, trueValue) {
271484f95ede Uploaded nicolas parents: diff changeset	30 # change the value into a function
271484f95ede Uploaded nicolas parents: diff changeset	31 f <- function(w) {sum(values * w/sum(w))}
271484f95ede Uploaded nicolas parents: diff changeset	32 fitness <- function(x) {1/abs(trueValue-f(x))}
271484f95ede Uploaded nicolas parents: diff changeset	33 resp <- ga(type = "real-valued", fitness = fitness, min = rep(0, length(values)), max = rep(1, length(values)),
271484f95ede Uploaded nicolas parents: diff changeset	34 maxiter = 1000, monitor = NULL, keepBest = T)
271484f95ede Uploaded nicolas parents: diff changeset	35 resp@solution <- resp@solution/sum(resp@solution)
271484f95ede Uploaded nicolas parents: diff changeset	36 return(resp)
271484f95ede Uploaded nicolas parents: diff changeset	37 }
271484f95ede Uploaded nicolas parents: diff changeset	38
271484f95ede Uploaded nicolas parents: diff changeset	39 optimizeWeight <- function(values, trueValue, n=1000) {
271484f95ede Uploaded nicolas parents: diff changeset	40 fitnessAll <- function(w) {
271484f95ede Uploaded nicolas parents: diff changeset	41 predicted <- apply(values, 1, weightedPrediction.vec, w)
271484f95ede Uploaded nicolas parents: diff changeset	42 return(mean(r2(trueValue, predicted)))
271484f95ede Uploaded nicolas parents: diff changeset	43 #return(mean(1/abs(trueValue-predicted)))
271484f95ede Uploaded nicolas parents: diff changeset	44 }
271484f95ede Uploaded nicolas parents: diff changeset	45 resp <- ga(type = "real-valued", fitness = fitnessAll, min = rep(0, ncol(values)), max = rep(1, ncol(values)),
271484f95ede Uploaded nicolas parents: diff changeset	46 maxiter = n, monitor = NULL, keepBest = T)
271484f95ede Uploaded nicolas parents: diff changeset	47 resp@solution <- resp@solution/sum(resp@solution)
271484f95ede Uploaded nicolas parents: diff changeset	48 return(resp)
271484f95ede Uploaded nicolas parents: diff changeset	49 }
271484f95ede Uploaded nicolas parents: diff changeset	50
271484f95ede Uploaded nicolas parents: diff changeset	51 weightedPrediction <- function(classifiers, w) {
271484f95ede Uploaded nicolas parents: diff changeset	52 if(length(w) > ncol(classifiers)) {
271484f95ede Uploaded nicolas parents: diff changeset	53 warning("more weights than classifiers, extra weigths are ignored")
271484f95ede Uploaded nicolas parents: diff changeset	54 w <- w[1:ncol(classifiers)]
271484f95ede Uploaded nicolas parents: diff changeset	55 } else if(length(w) < ncol(classifiers)) {
271484f95ede Uploaded nicolas parents: diff changeset	56 warning("less weights than classifiers, extra classifiers are ignored")
271484f95ede Uploaded nicolas parents: diff changeset	57 classifiers <- classifiers[,1:length(w)]
271484f95ede Uploaded nicolas parents: diff changeset	58 }
271484f95ede Uploaded nicolas parents: diff changeset	59 prediction <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	60 prediction <- c(prediction, apply(classifiers, 1, weightedPrediction.vec, w))
271484f95ede Uploaded nicolas parents: diff changeset	61 return(prediction)
271484f95ede Uploaded nicolas parents: diff changeset	62 }
271484f95ede Uploaded nicolas parents: diff changeset	63
271484f95ede Uploaded nicolas parents: diff changeset	64 weightedPrediction.vec <- function(values, w) {
271484f95ede Uploaded nicolas parents: diff changeset	65 return(sum(values * w/sum(w)))
271484f95ede Uploaded nicolas parents: diff changeset	66 }
271484f95ede Uploaded nicolas parents: diff changeset	67
271484f95ede Uploaded nicolas parents: diff changeset	68 ##### meta-decision tree
271484f95ede Uploaded nicolas parents: diff changeset	69
271484f95ede Uploaded nicolas parents: diff changeset	70 tuneTree <- function(data, target) {
271484f95ede Uploaded nicolas parents: diff changeset	71 data <- data.frame(data, target=target)
271484f95ede Uploaded nicolas parents: diff changeset	72 size <- nrow(data)
271484f95ede Uploaded nicolas parents: diff changeset	73 xerror <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	74 split <- 1:ceiling(size/5)
271484f95ede Uploaded nicolas parents: diff changeset	75 leafSize <- 1:ceiling(size/10)
271484f95ede Uploaded nicolas parents: diff changeset	76 xerror <- matrix(rep(-1, length(split)*length(leafSize)), ncol=length(leafSize))
271484f95ede Uploaded nicolas parents: diff changeset	77 cp <- matrix(rep(-1, length(split)*length(leafSize)), ncol=length(leafSize))
271484f95ede Uploaded nicolas parents: diff changeset	78 for(i in 1:length(split)) {
271484f95ede Uploaded nicolas parents: diff changeset	79 for(j in 1:length(leafSize)) {
271484f95ede Uploaded nicolas parents: diff changeset	80 op <- list(minsplit=split[i], minbucket=leafSize[j])
271484f95ede Uploaded nicolas parents: diff changeset	81 tree <- rpart(target ~., data=data, control=op, method="anova")
271484f95ede Uploaded nicolas parents: diff changeset	82 xerror[i,j] <- tree$cptable[which.min(tree$cptable[,"xerror"]),"xerror"]
271484f95ede Uploaded nicolas parents: diff changeset	83 cp[i,j] <- tree$cptable[which.min(tree$cptable[,"xerror"]),"CP"]
271484f95ede Uploaded nicolas parents: diff changeset	84 }
271484f95ede Uploaded nicolas parents: diff changeset	85 }
271484f95ede Uploaded nicolas parents: diff changeset	86 index <- which(xerror==min(xerror), arr.ind = T)
271484f95ede Uploaded nicolas parents: diff changeset	87 op <- list(minsplit=split[index[1]], minbucket=leafSize[index[2]], cp=cp[index[1], index[2]])
271484f95ede Uploaded nicolas parents: diff changeset	88 return(op)
271484f95ede Uploaded nicolas parents: diff changeset	89 }
271484f95ede Uploaded nicolas parents: diff changeset	90
271484f95ede Uploaded nicolas parents: diff changeset	91 ###### meta-LASSO
271484f95ede Uploaded nicolas parents: diff changeset	92 # create fold by picking at random row indexes
271484f95ede Uploaded nicolas parents: diff changeset	93 createFolds <- function(nbObs, n) {
271484f95ede Uploaded nicolas parents: diff changeset	94 # pick indexes
271484f95ede Uploaded nicolas parents: diff changeset	95 index <- sample(1:n, size=nbObs, replace = T)
271484f95ede Uploaded nicolas parents: diff changeset	96 # populate folds
271484f95ede Uploaded nicolas parents: diff changeset	97 folds <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	98 for(i in 1:n) {
271484f95ede Uploaded nicolas parents: diff changeset	99 folds <- c(folds, list(which(index==i)))
271484f95ede Uploaded nicolas parents: diff changeset	100 }
271484f95ede Uploaded nicolas parents: diff changeset	101 return(folds)
271484f95ede Uploaded nicolas parents: diff changeset	102 }
271484f95ede Uploaded nicolas parents: diff changeset	103
271484f95ede Uploaded nicolas parents: diff changeset	104 searchParamLASSO <- function(genotype, phenotype, alpha=seq(0,1,0.1), n=7) {
271484f95ede Uploaded nicolas parents: diff changeset	105 folds <- createFolds(nrow(genotype), n = n)
271484f95ede Uploaded nicolas parents: diff changeset	106 acc <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	107 indexAlpha <- 1
271484f95ede Uploaded nicolas parents: diff changeset	108 for(a in alpha) {
271484f95ede Uploaded nicolas parents: diff changeset	109 curAcc <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	110 for(i in 1:n) {
271484f95ede Uploaded nicolas parents: diff changeset	111 train <- genotype[-folds[[i]],]
271484f95ede Uploaded nicolas parents: diff changeset	112 test <- genotype[folds[[i]],]
271484f95ede Uploaded nicolas parents: diff changeset	113 phenoTrain <- phenotype[-folds[[i]]]
271484f95ede Uploaded nicolas parents: diff changeset	114 phenoTest <- phenotype[folds[[i]]]
271484f95ede Uploaded nicolas parents: diff changeset	115 cv <- cv.glmnet(x=as.matrix(train), y=phenoTrain, alpha=a)
271484f95ede Uploaded nicolas parents: diff changeset	116 model <- glmnet(x=as.matrix(train), y=phenoTrain, alpha=a, lambda = cv$lambda.1se)
271484f95ede Uploaded nicolas parents: diff changeset	117 pred <- predict(model, test, type = "response")
271484f95ede Uploaded nicolas parents: diff changeset	118 curAcc <- c(curAcc, r2(phenoTest, pred))
271484f95ede Uploaded nicolas parents: diff changeset	119 }
271484f95ede Uploaded nicolas parents: diff changeset	120 acc <- c(acc, mean(curAcc))
271484f95ede Uploaded nicolas parents: diff changeset	121 }
271484f95ede Uploaded nicolas parents: diff changeset	122 names(acc) <- alpha
271484f95ede Uploaded nicolas parents: diff changeset	123 return(as.numeric(names(acc)[which.max(acc)]))
271484f95ede Uploaded nicolas parents: diff changeset	124 }
271484f95ede Uploaded nicolas parents: diff changeset	125
271484f95ede Uploaded nicolas parents: diff changeset	126 ###### meta-random forest
271484f95ede Uploaded nicolas parents: diff changeset	127
271484f95ede Uploaded nicolas parents: diff changeset	128 searchParamRF <- function(genotype, phenotype, rangeNtree, mtry=ncol(genotype)) {
271484f95ede Uploaded nicolas parents: diff changeset	129 n <- ceiling(nrow(genotype)/3)
271484f95ede Uploaded nicolas parents: diff changeset	130 indexTest <- sample(1:nrow(genotype), size=n)
271484f95ede Uploaded nicolas parents: diff changeset	131 train <- genotype[-indexTest,]
271484f95ede Uploaded nicolas parents: diff changeset	132 test <- genotype[indexTest,]
271484f95ede Uploaded nicolas parents: diff changeset	133 phenoTrain <- phenotype[-indexTest]
271484f95ede Uploaded nicolas parents: diff changeset	134 phenoTest <- phenotype[indexTest]
271484f95ede Uploaded nicolas parents: diff changeset	135 acc <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	136 indexNtree <- 1
271484f95ede Uploaded nicolas parents: diff changeset	137 for(ntree in rangeNtree) {
271484f95ede Uploaded nicolas parents: diff changeset	138 model <- randomForest(x=train, y=phenoTrain, ntree = ntree, mtry = mtry)
271484f95ede Uploaded nicolas parents: diff changeset	139 pred <- predict(model, test)
271484f95ede Uploaded nicolas parents: diff changeset	140 acc <- c(acc, r2(phenoTest, pred))
271484f95ede Uploaded nicolas parents: diff changeset	141 }
271484f95ede Uploaded nicolas parents: diff changeset	142 names(acc) <- rangeNtree
271484f95ede Uploaded nicolas parents: diff changeset	143 best <- which.max(acc)
271484f95ede Uploaded nicolas parents: diff changeset	144 return(as.numeric(names(acc)[best]))
271484f95ede Uploaded nicolas parents: diff changeset	145 }
271484f95ede Uploaded nicolas parents: diff changeset	146
271484f95ede Uploaded nicolas parents: diff changeset	147 ###### meta-SVM
271484f95ede Uploaded nicolas parents: diff changeset	148 searchParamSVM <- function(train, target, kernel="radial") {
271484f95ede Uploaded nicolas parents: diff changeset	149 # tuning parameters then train
271484f95ede Uploaded nicolas parents: diff changeset	150 model <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	151 switch(kernel,
271484f95ede Uploaded nicolas parents: diff changeset	152 sigmoid={
271484f95ede Uploaded nicolas parents: diff changeset	153 tune <- tune.svm(train, target, gamma = 10^(-6:-1), cost = 10^(0:2), kernel="sigmoid");
271484f95ede Uploaded nicolas parents: diff changeset	154 g <- tune$best.parameters[[1]];
271484f95ede Uploaded nicolas parents: diff changeset	155 c <- tune$best.parameters[[2]];
271484f95ede Uploaded nicolas parents: diff changeset	156 model <- svm(x=train, y=target, gamma = g, cost = c, kernel = "sigmoid")},
271484f95ede Uploaded nicolas parents: diff changeset	157 linear={
271484f95ede Uploaded nicolas parents: diff changeset	158 tune <- tune.svm(train, target, cost = 10^(0:2), kernel="linear");
271484f95ede Uploaded nicolas parents: diff changeset	159 c <- tune$best.parameters[[1]];
271484f95ede Uploaded nicolas parents: diff changeset	160 model <- svm(x=train, y=target, cost = c, kernel = "linear")},
271484f95ede Uploaded nicolas parents: diff changeset	161 polynomial={
271484f95ede Uploaded nicolas parents: diff changeset	162 tune <- tune.svm(train, target, gamma = 10^(-6:-1), cost = 10^(0:2), degree = 0:4, coef0 = 0:3, kernel="polynomial");
271484f95ede Uploaded nicolas parents: diff changeset	163 d <- tune$best.parameters[[1]];
271484f95ede Uploaded nicolas parents: diff changeset	164 g <- tune$best.parameters[[2]];
271484f95ede Uploaded nicolas parents: diff changeset	165 coef <- tune$best.parameters[[3]];
271484f95ede Uploaded nicolas parents: diff changeset	166 c <- tune$best.parameters[[4]];
271484f95ede Uploaded nicolas parents: diff changeset	167 model <- svm(x=train, y=target, gamma = g, cost = c, kernel = "polynomial", degree = d, coef0 = coef)},
271484f95ede Uploaded nicolas parents: diff changeset	168 {
271484f95ede Uploaded nicolas parents: diff changeset	169 tune <- tune.svm(train, target, gamma = 10^(-6:-1), cost = 10^(0:3), kernel="radial");
271484f95ede Uploaded nicolas parents: diff changeset	170 g <- tune$best.parameters[[1]];
271484f95ede Uploaded nicolas parents: diff changeset	171 c <- tune$best.parameters[[2]];
271484f95ede Uploaded nicolas parents: diff changeset	172 model <- svm(x=train, y=target, gamma = g, cost = c, kernel = "radial")}
271484f95ede Uploaded nicolas parents: diff changeset	173 )
271484f95ede Uploaded nicolas parents: diff changeset	174 return(model)
271484f95ede Uploaded nicolas parents: diff changeset	175 }
271484f95ede Uploaded nicolas parents: diff changeset	176
271484f95ede Uploaded nicolas parents: diff changeset	177 #################### upper level functions #####################
271484f95ede Uploaded nicolas parents: diff changeset	178
271484f95ede Uploaded nicolas parents: diff changeset	179 aggregateDT <- function(classifiers, target=NULL, prediction=F, model=NULL, out) {
271484f95ede Uploaded nicolas parents: diff changeset	180 if(!prediction) {
271484f95ede Uploaded nicolas parents: diff changeset	181 treeParam <- tuneTree(classifiers, target)
271484f95ede Uploaded nicolas parents: diff changeset	182 data <- data.frame(classifiers, target)
271484f95ede Uploaded nicolas parents: diff changeset	183 model <- rpart(target ~., data=data, method = "anova", control = treeParam)
271484f95ede Uploaded nicolas parents: diff changeset	184 model <- prune(model, cp=treeParam["cp"])
271484f95ede Uploaded nicolas parents: diff changeset	185 saveRDS(model, out)
271484f95ede Uploaded nicolas parents: diff changeset	186 } else {
271484f95ede Uploaded nicolas parents: diff changeset	187 saveRDS(predict(model, data.frame(classifiers)), out)
271484f95ede Uploaded nicolas parents: diff changeset	188 }
271484f95ede Uploaded nicolas parents: diff changeset	189 }
271484f95ede Uploaded nicolas parents: diff changeset	190
271484f95ede Uploaded nicolas parents: diff changeset	191 aggregateGeneticMean <- function(classifiers, target=NULL, prediction=F, model=NULL, out){
271484f95ede Uploaded nicolas parents: diff changeset	192 if(!prediction) {
271484f95ede Uploaded nicolas parents: diff changeset	193 opt <- optimizeWeight(values = classifiers, trueValue = target)
271484f95ede Uploaded nicolas parents: diff changeset	194 saveRDS(opt@solution, out)
271484f95ede Uploaded nicolas parents: diff changeset	195 # evaluation of the method
271484f95ede Uploaded nicolas parents: diff changeset	196 } else {
271484f95ede Uploaded nicolas parents: diff changeset	197 saveRDS(weightedPrediction.vec(classifiers, model), out)
271484f95ede Uploaded nicolas parents: diff changeset	198 }
271484f95ede Uploaded nicolas parents: diff changeset	199 }
271484f95ede Uploaded nicolas parents: diff changeset	200
271484f95ede Uploaded nicolas parents: diff changeset	201 aggregateLASSO <- function(classifiers, target=NULL, prediction=F, model=NULL, alpha=NULL, out) {
271484f95ede Uploaded nicolas parents: diff changeset	202 if(!prediction) {
271484f95ede Uploaded nicolas parents: diff changeset	203 alpha <- searchParamLASSO(classifiers, target)
271484f95ede Uploaded nicolas parents: diff changeset	204 cv <- cv.glmnet(x=as.matrix(classifiers), y=target, alpha=alpha)
271484f95ede Uploaded nicolas parents: diff changeset	205 model <- glmnet(x=as.matrix(classifiers), y=target, alpha=alpha, lambda = cv$lambda.1se)
271484f95ede Uploaded nicolas parents: diff changeset	206 saveRDS(model, out)
271484f95ede Uploaded nicolas parents: diff changeset	207 } else {
271484f95ede Uploaded nicolas parents: diff changeset	208 saveRDS(predict(model, classifiers), out)
271484f95ede Uploaded nicolas parents: diff changeset	209 }
271484f95ede Uploaded nicolas parents: diff changeset	210 }
271484f95ede Uploaded nicolas parents: diff changeset	211
271484f95ede Uploaded nicolas parents: diff changeset	212 aggregateRF <- function(classifiers, target=NULL, model=NULL, ntree=NULL, prediction=F, out) {
271484f95ede Uploaded nicolas parents: diff changeset	213 if(!prediction) {
271484f95ede Uploaded nicolas parents: diff changeset	214 ntree <- searchParamRF(genotype = classifiers, phenotype = target,
271484f95ede Uploaded nicolas parents: diff changeset	215 rangeNtree = seq(100, 1000, 100))
271484f95ede Uploaded nicolas parents: diff changeset	216 model <- randomForest(x=classifiers, y=target, ntree = ntree, mtry = ncol(classifiers))
271484f95ede Uploaded nicolas parents: diff changeset	217 saveRDS(model, out)
271484f95ede Uploaded nicolas parents: diff changeset	218 } else {
271484f95ede Uploaded nicolas parents: diff changeset	219 saveRDS(predict(model, classifiers), out)
271484f95ede Uploaded nicolas parents: diff changeset	220 }
271484f95ede Uploaded nicolas parents: diff changeset	221 }
271484f95ede Uploaded nicolas parents: diff changeset	222
271484f95ede Uploaded nicolas parents: diff changeset	223 aggregateSVM <- function(classifiers, target=NULL, prediction=F,
271484f95ede Uploaded nicolas parents: diff changeset	224 model=NULL, c=NULL, g=NULL, d=NULL, coef=NULL, kernel="radial", out) {
271484f95ede Uploaded nicolas parents: diff changeset	225 if(!prediction) {
271484f95ede Uploaded nicolas parents: diff changeset	226 model <- searchParamSVM(train = classifiers, target = target, kernel = kernel)
271484f95ede Uploaded nicolas parents: diff changeset	227 saveRDS(model, out)
271484f95ede Uploaded nicolas parents: diff changeset	228 } else {
271484f95ede Uploaded nicolas parents: diff changeset	229 saveRDS(predict(model, classifiers), out)
271484f95ede Uploaded nicolas parents: diff changeset	230 }
271484f95ede Uploaded nicolas parents: diff changeset	231 }
271484f95ede Uploaded nicolas parents: diff changeset	232
271484f95ede Uploaded nicolas parents: diff changeset	233 ################################### main #############################
271484f95ede Uploaded nicolas parents: diff changeset	234 # # load argument
271484f95ede Uploaded nicolas parents: diff changeset	235 cmd <- commandArgs(T)
271484f95ede Uploaded nicolas parents: diff changeset	236 source(cmd[1])
271484f95ede Uploaded nicolas parents: diff changeset	237 # check if evaluation is required
271484f95ede Uploaded nicolas parents: diff changeset	238 evaluation <- F
271484f95ede Uploaded nicolas parents: diff changeset	239 if(as.integer(doEvaluation) == 1) {
271484f95ede Uploaded nicolas parents: diff changeset	240 evaluation <- T
271484f95ede Uploaded nicolas parents: diff changeset	241 con = file(folds)
271484f95ede Uploaded nicolas parents: diff changeset	242 folds <- readLines(con = con, n = 1, ok=T)
271484f95ede Uploaded nicolas parents: diff changeset	243 close(con)
271484f95ede Uploaded nicolas parents: diff changeset	244 folds <- readRDS(folds)
271484f95ede Uploaded nicolas parents: diff changeset	245 }
271484f95ede Uploaded nicolas parents: diff changeset	246 # check for model
271484f95ede Uploaded nicolas parents: diff changeset	247 if(model == "None") {
271484f95ede Uploaded nicolas parents: diff changeset	248 model <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	249 prediction <- F
271484f95ede Uploaded nicolas parents: diff changeset	250 } else {
271484f95ede Uploaded nicolas parents: diff changeset	251 prediction <- T
271484f95ede Uploaded nicolas parents: diff changeset	252 con = file(model)
271484f95ede Uploaded nicolas parents: diff changeset	253 model <- readLines(con = con, n = 1, ok=T)
271484f95ede Uploaded nicolas parents: diff changeset	254 close(con)
271484f95ede Uploaded nicolas parents: diff changeset	255 model <- readRDS(model)
271484f95ede Uploaded nicolas parents: diff changeset	256 }
271484f95ede Uploaded nicolas parents: diff changeset	257 # load classifiers and phenotype
271484f95ede Uploaded nicolas parents: diff changeset	258 classifiers <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	259 classifNames <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	260 if(lassoPred !="None"){
271484f95ede Uploaded nicolas parents: diff changeset	261 classifiers <- c(classifiers, lassoPred)
271484f95ede Uploaded nicolas parents: diff changeset	262 classifNames <- c(classifNames, "lasso")
271484f95ede Uploaded nicolas parents: diff changeset	263 }
271484f95ede Uploaded nicolas parents: diff changeset	264 if(rrBLUPPred !="None"){
271484f95ede Uploaded nicolas parents: diff changeset	265 classifiers <- c(classifiers, rrBLUPPred)
271484f95ede Uploaded nicolas parents: diff changeset	266 classifNames <- c(classifNames, "rrBLUP")
271484f95ede Uploaded nicolas parents: diff changeset	267 }
271484f95ede Uploaded nicolas parents: diff changeset	268 if(rfPred !="None"){
271484f95ede Uploaded nicolas parents: diff changeset	269 classifiers <- c(classifiers, rfPred)
271484f95ede Uploaded nicolas parents: diff changeset	270 classifNames <- c(classifNames, "rf")
271484f95ede Uploaded nicolas parents: diff changeset	271 }
271484f95ede Uploaded nicolas parents: diff changeset	272 if(svmPred !="None"){
271484f95ede Uploaded nicolas parents: diff changeset	273 classifiers <- c(classifiers, svmPred)
271484f95ede Uploaded nicolas parents: diff changeset	274 classifNames <- c(classifNames, "svm")
271484f95ede Uploaded nicolas parents: diff changeset	275 }
271484f95ede Uploaded nicolas parents: diff changeset	276 classifPrediction <- NULL
271484f95ede Uploaded nicolas parents: diff changeset	277 for(classif in classifiers) {
271484f95ede Uploaded nicolas parents: diff changeset	278 classifPrediction <- c(classifPrediction, list(read.table(classif, sep="\t", h=T)))
271484f95ede Uploaded nicolas parents: diff changeset	279 }
271484f95ede Uploaded nicolas parents: diff changeset	280 classifPrediction <- data.frame(classifPrediction)
271484f95ede Uploaded nicolas parents: diff changeset	281 colnames(classifPrediction) <- classifNames
271484f95ede Uploaded nicolas parents: diff changeset	282 # phenotype is written as a table (in columns) but it must be sent as a vector for mixed.solve
271484f95ede Uploaded nicolas parents: diff changeset	283 phenotype <- read.table(phenotype, sep="\t", h=T)[,1]
271484f95ede Uploaded nicolas parents: diff changeset	284 out <- paste(out, ".rds", sep = "")
271484f95ede Uploaded nicolas parents: diff changeset	285 # aggregate !
271484f95ede Uploaded nicolas parents: diff changeset	286 switch(method,
271484f95ede Uploaded nicolas parents: diff changeset	287 geneticMean={
271484f95ede Uploaded nicolas parents: diff changeset	288 aggregateGeneticMean(classifiers = classifPrediction, target = phenotype,
271484f95ede Uploaded nicolas parents: diff changeset	289 out = out, prediction = prediction, model=model)
271484f95ede Uploaded nicolas parents: diff changeset	290 },
271484f95ede Uploaded nicolas parents: diff changeset	291 dt={
271484f95ede Uploaded nicolas parents: diff changeset	292 aggregateDT(classifiers = classifPrediction, target = phenotype,
271484f95ede Uploaded nicolas parents: diff changeset	293 out = out, prediction = prediction, model=model)
271484f95ede Uploaded nicolas parents: diff changeset	294 },
271484f95ede Uploaded nicolas parents: diff changeset	295 lasso={
271484f95ede Uploaded nicolas parents: diff changeset	296 aggregateLASSO(classifiers = data.matrix(classifPrediction), target = phenotype,
271484f95ede Uploaded nicolas parents: diff changeset	297 out = out, prediction = prediction, model=model)
271484f95ede Uploaded nicolas parents: diff changeset	298 },
271484f95ede Uploaded nicolas parents: diff changeset	299 rf={
271484f95ede Uploaded nicolas parents: diff changeset	300 aggregateRF(classifiers = classifPrediction, target = phenotype,
271484f95ede Uploaded nicolas parents: diff changeset	301 out = out, prediction = prediction, model=model)
271484f95ede Uploaded nicolas parents: diff changeset	302 },
271484f95ede Uploaded nicolas parents: diff changeset	303 # svm
271484f95ede Uploaded nicolas parents: diff changeset	304 {aggregateSVM(classifiers = classifPrediction, target = phenotype, kernel = kernel,
271484f95ede Uploaded nicolas parents: diff changeset	305 out = out, prediction = prediction, model = model)}
271484f95ede Uploaded nicolas parents: diff changeset	306 )
271484f95ede Uploaded nicolas parents: diff changeset	307 # return path of the result file to galaxy
271484f95ede Uploaded nicolas parents: diff changeset	308 cat(paste(out, "\n", sep=""))

Mercurial > repos > nicolas > oghma

annotate aggregation.R @ 50:271484f95ede draft