cobraxy: COBRAxy/utils/general

annotate COBRAxy/utils/general_utils.py @ 415:4a248b45273c draft

Uploaded

author	francesco_lapi
date	Mon, 08 Sep 2025 21:56:19 +0000
parents	5086145cfb96
children	ed2c1f9e20ba

rev	line source
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	1 import math
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	2 import re
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	3 import sys
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	4 import csv
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	5 import pickle
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	6 import lxml.etree as ET
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	7
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	8 from enum import Enum
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	9 from itertools import count
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	10 from typing import Any, Callable, Dict, Generic, List, Literal, Optional, TypeVar, Union, Set, Tuple
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	11
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	12 import pandas as pd
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	13 import cobra
409 71850bdf9e1e Uploaded francesco_lapi parents: 408 diff changeset	14 from cobra import Model as cobraModel, Reaction, Metabolite
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	15
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	16 import zipfile
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	17 import gzip
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	18 import bz2
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	19 from io import StringIO
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	20
394 a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	21
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	22
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	23 class ValueErr(Exception):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	24 def __init__(self, param_name, expected, actual):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	25 super().__init__(f"Invalid value for {param_name}: expected {expected}, got {actual}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	26
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	27 class PathErr(Exception):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	28 def __init__(self, path, message):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	29 super().__init__(f"Path error for '{path}': {message}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	30
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	31 class FileFormat(Enum):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	32 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	33 Encodes possible file extensions to conditionally save data in a different format.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	34 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	35 DAT = ("dat",) # this is how galaxy treats all your files!
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	36 CSV = ("csv",) # this is how most editable input data is written
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	37 TSV = ("tsv",) # this is how most editable input data is ACTUALLY written TODO:more support pls!!
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	38 SVG = ("svg",) # this is how most metabolic maps are written
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	39 PNG = ("png",) # this is a common output format for images (such as metabolic maps)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	40 PDF = ("pdf",) # this is also a common output format for images, as it's required in publications.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	41
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	42 # Updated to include compressed variants
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	43 XML = ("xml", "xml.gz", "xml.zip", "xml.bz2") # SBML files are XML files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	44 JSON = ("json", "json.gz", "json.zip", "json.bz2") # COBRA models can be stored as JSON files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	45 MAT = ("mat", "mat.gz", "mat.zip", "mat.bz2") # COBRA models can be stored as MAT files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	46 YML = ("yml", "yml.gz", "yml.zip", "yml.bz2") # COBRA models can be stored as YML files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	47
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	48 TXT = ("txt",) # this is how most output data is written
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	49 PICKLE = ("pickle", "pk", "p") # this is how all runtime data structures are saved
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	50
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	51 def __init__(self, *extensions):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	52 self.extensions = extensions
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	53 # Store original extension when set via fromExt
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	54 self._original_extension = None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	55
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	56 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	57 def fromExt(cls, ext: str) -> "FileFormat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	58 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	59 Converts a file extension string to a FileFormat instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	60 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	61 ext : The file extension as a string.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	62 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	63 FileFormat: The FileFormat instance corresponding to the file extension.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	64 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	65 variantName = ext.upper()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	66 if variantName in FileFormat.__members__:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	67 instance = FileFormat[variantName]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	68 instance._original_extension = ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	69 return instance
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	70
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	71 variantName = ext.lower()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	72 for member in cls:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	73 if variantName in member.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	74 # Create a copy-like behavior by storing the original extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	75 member._original_extension = ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	76 return member
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	77
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	78 raise ValueErr("ext", "a valid FileFormat file extension", ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	79
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	80 def __str__(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	81 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	82 (Private) converts to str representation. Good practice for usage with argparse.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	83 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	84 str : the string representation of the file extension.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	85 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	86 # If we have an original extension stored (for compressed files only), use it
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	87 if hasattr(self, '_original_extension') and self._original_extension:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	88 return self._original_extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	89
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	90 # For XML, JSON, MAT and YML without original extension, use the base extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	91 if self == FileFormat.XML:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	92 return "xml"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	93 elif self == FileFormat.JSON:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	94 return "json"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	95 elif self == FileFormat.MAT:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	96 return "mat"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	97 elif self == FileFormat.YML:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	98 return "yml"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	99
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	100 return self.value[-1]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	101
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	102 class FilePath():
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	103 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	104 Represents a file path. View this as an attempt to standardize file-related operations by expecting
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	105 values of this type in any process requesting a file path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	106 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	107 def __init__(self, filePath: str, ext: FileFormat, *, prefix="") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	108 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	109 (Private) Initializes an instance of FilePath.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	110 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	111 path : the end of the path, containing the file name.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	112 ext : the file's extension.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	113 prefix : anything before path, if the last '/' isn't there it's added by the code.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	114 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	115 None : practically, a FilePath instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	116 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	117 self.ext = ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	118 self.filePath = filePath
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	119
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	120 if prefix and prefix[-1] != '/':
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	121 prefix += '/'
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	122 self.prefix = prefix
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	123
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	124 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	125 def fromStrPath(cls, path: str) -> "FilePath":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	126 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	127 Factory method to parse a string from which to obtain, if possible, a valid FilePath instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	128 It detects double extensions such as .json.gz and .xml.bz2, which are common in COBRA models.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	129 These double extensions are not supported for other file types such as .csv.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	130 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	131 path : the string containing the path
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	132 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	133 PathErr : if the provided string doesn't represent a valid path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	134 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	135 FilePath : the constructed instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	136 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	137 result = re.search(r"^(?P<prefix>.\/)?(?P<name>.)\.(?P<ext>[^.]*)$", path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	138 if not result or not result["name"] or not result["ext"]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	139 raise PathErr(path, "cannot recognize folder structure or extension in path")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	140
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	141 prefix = result["prefix"] if result["prefix"] else ""
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	142 name, ext = result["name"], result["ext"]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	143
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	144 # Check for double extensions (json.gz, xml.zip, etc.)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	145 parts = path.split(".")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	146 if len(parts) >= 3:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	147 penultimate = parts[-2]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	148 last = parts[-1]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	149 double_ext = f"{penultimate}.{last}"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	150
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	151 # Try the double extension first
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	152 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	153 ext_format = FileFormat.fromExt(double_ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	154 name = ".".join(parts[:-2])
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	155 # Extract prefix if it exists
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	156 if '/' in name:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	157 prefix = name[:name.rfind('/') + 1]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	158 name = name[name.rfind('/') + 1:]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	159 return cls(name, ext_format, prefix=prefix)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	160 except ValueErr:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	161 # If double extension doesn't work, fall back to single extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	162 pass
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	163
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	164 # Single extension fallback (original logic)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	165 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	166 ext_format = FileFormat.fromExt(ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	167 return cls(name, ext_format, prefix=prefix)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	168 except ValueErr:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	169 raise PathErr(path, f"unsupported file extension: {ext}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	170
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	171 def show(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	172 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	173 Shows the path as a string.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	174 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	175 str : the path shown as a string.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	176 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	177 return f"{self.prefix}{self.filePath}.{self.ext}"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	178
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	179 def __str__(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	180 return self.show()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	181
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	182 # ERRORS
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	183 def terminate(msg :str) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	184 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	185 Terminate the execution of the script with an error message.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	186
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	187 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	188 msg (str): The error message to be displayed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	189
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	190 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	191 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	192 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	193 sys.exit(f"Execution aborted: {msg}\n")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	194
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	195 def logWarning(msg :str, loggerPath :str) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	196 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	197 Log a warning message to an output log file and print it to the console. The final period and a
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	198 newline is added by the function.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	199
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	200 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	201 s (str): The warning message to be logged and printed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	202 loggerPath : The file path of the output log file. Given as a string, parsed to a FilePath and
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	203 immediately read back (beware relative expensive operation, log with caution).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	204
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	205 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	206 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	207 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	208 # building the path and then reading it immediately seems useless, but it's actually a way of
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	209 # validating that reduces repetition on the caller's side. Besides, logging a message by writing
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	210 # to a file is supposed to be computationally expensive anyway, so this is also a good deterrent from
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	211 # mindlessly logging whenever something comes up, log at the very end and tell the user everything
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	212 # that went wrong. If you don't like it: implement a persistent runtime buffer that gets dumped to
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	213 # the file only at the end of the program's execution.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	214 with open(FilePath.fromStrPath(loggerPath).show(), 'a') as log: log.write(f"{msg}.\n")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	215
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	216 class CustomErr(Exception):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	217 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	218 Custom error class to handle exceptions in a structured way, with a unique identifier and a message.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	219 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	220 __idGenerator = count()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	221 errName = "Custom Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	222 def __init__(self, msg :str, details = "", explicitErrCode = -1) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	223 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	224 (Private) Initializes an instance of CustomErr.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	225
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	226 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	227 msg (str): Error message to be displayed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	228 details (str): Informs the user more about the error encountered. Defaults to "".
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	229 explicitErrCode (int): Explicit error code to be used. Defaults to -1.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	230
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	231 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	232 None : practically, a CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	233 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	234 self.msg = msg
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	235 self.details = details
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	236
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	237 self.id = max(explicitErrCode, next(CustomErr.__idGenerator))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	238
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	239 def throw(self, loggerPath = "") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	240 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	241 Raises the current CustomErr instance, logging a warning message before doing so.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	242
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	243 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	244 self: The current CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	245
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	246 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	247 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	248 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	249 if loggerPath: logWarning(str(self), loggerPath)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	250 raise self
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	251
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	252 def abort(self) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	253 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	254 Aborts the execution of the script.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	255
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	256 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	257 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	258 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	259 terminate(str(self))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	260
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	261 def __str__(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	262 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	263 (Private) Returns a string representing the current CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	264
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	265 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	266 str: A string representing the current CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	267 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	268 return f"{CustomErr.errName} #{self.id}: {self.msg}, {self.details}."
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	269
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	270 class ArgsErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	271 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	272 CustomErr subclass for UI arguments errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	273 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	274 errName = "Args Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	275 def __init__(self, argName :str, expected :Any, actual :Any, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	276 super().__init__(f"argument \"{argName}\" expected {expected} but got {actual}", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	277
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	278 class DataErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	279 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	280 CustomErr subclass for data formatting errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	281 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	282 errName = "Data Format Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	283 def __init__(self, fileName :str, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	284 super().__init__(f"file \"{fileName}\" contains malformed data", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	285
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	286 class PathErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	287 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	288 CustomErr subclass for filepath formatting errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	289 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	290 errName = "Path Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	291 def __init__(self, path :FilePath, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	292 super().__init__(f"path \"{path}\" is invalid", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	293
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	294 class ValueErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	295 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	296 CustomErr subclass for any value error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	297 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	298 errName = "Value Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	299 def __init__(self, valueName: str, expected :Any, actual :Any, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	300 super().__init__("value " + f"\"{valueName}\" " * bool(valueName) + f"was supposed to be {expected}, but got {actual} instead", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	301
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	302 # RESULT
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	303 T = TypeVar('T')
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	304 E = TypeVar('E', bound = CustomErr) # should bind to Result.ResultErr but python happened!
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	305 class Result(Generic[T, E]):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	306 class ResultErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	307 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	308 CustomErr subclass for all Result errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	309 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	310 errName = "Result Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	311 def __init__(self, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	312 super().__init__(msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	313 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	314 Class to handle the result of an operation, with a value and a boolean flag to indicate
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	315 whether the operation was successful or not.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	316 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	317 def __init__(self, value :Union[T, E], isOk :bool) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	318 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	319 (Private) Initializes an instance of Result.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	320
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	321 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	322 value (Union[T, E]): The value to be stored in the Result instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	323 isOk (bool): A boolean flag to indicate whether the operation was successful or not.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	324
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	325 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	326 None : practically, a Result instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	327 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	328 self.isOk = isOk
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	329 self.isErr = not isOk
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	330 self.value = value
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	331
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	332 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	333 def Ok(cls, value :T) -> "Result":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	334 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	335 Constructs a new Result instance with a successful operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	336
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	337 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	338 value (T): The value to be stored in the Result instance, set as successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	339
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	340 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	341 Result: A new Result instance with a successful operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	342 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	343 return Result(value, isOk = True)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	344
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	345 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	346 def Err(cls, value :E) -> "Result":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	347 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	348 Constructs a new Result instance with a failed operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	349
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	350 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	351 value (E): The value to be stored in the Result instance, set as failed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	352
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	353 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	354 Result: A new Result instance with a failed operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	355 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	356 return Result(value, isOk = False)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	357
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	358 def unwrap(self) -> T:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	359 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	360 Unwraps the value of the Result instance, if the operation was successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	361
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	362 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	363 ResultErr: If the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	364
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	365 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	366 T: The value of the Result instance, if the operation was successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	367 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	368 if self.isOk: return self.value
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	369 raise Result.ResultErr(f"Unwrapped Result.Err : {self.value}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	370
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	371 def unwrapOr(self, default :T) -> T:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	372 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	373 Unwraps the value of the Result instance, if the operation was successful, otherwise
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	374 it returns a default value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	375
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	376 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	377 default (T): The default value to be returned if the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	378
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	379 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	380 T: The value of the Result instance, if the operation was successful,
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	381 otherwise the default value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	382 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	383 return self.value if self.isOk else default
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	384
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	385 def expect(self, err :"Result.ResultErr") -> T:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	386 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	387 Expects that the value of the Result instance is successful, otherwise it raises an error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	388
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	389 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	390 err (Exception): The error to be raised if the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	391
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	392 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	393 err: The error raised if the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	394
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	395 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	396 T: The value of the Result instance, if the operation was successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	397 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	398 if self.isOk: return self.value
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	399 raise err
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	400
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	401 U = TypeVar("U")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	402 def map(self, mapper: Callable[[T], U]) -> "Result[U, E]":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	403 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	404 Maps the value of the current Result to whatever is returned by the mapper function.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	405 If the Result contained an unsuccessful operation to begin with it remains unchanged
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	406 (a reference to the current instance is returned).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	407 If the mapper function panics the returned result instance will be of the error kind.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	408
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	409 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	410 mapper (Callable[[T], U]): The mapper operation to be applied to the Result value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	411
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	412 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	413 Result[U, E]: The result of the mapper operation applied to the Result value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	414 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	415 if self.isErr: return self
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	416 try: return Result.Ok(mapper(self.value))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	417 except Exception as e: return Result.Err(e)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	418
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	419 D = TypeVar("D", bound = "Result.ResultErr")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	420 def mapErr(self, mapper :Callable[[E], D]) -> "Result[T, D]":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	421 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	422 Maps the error of the current Result to whatever is returned by the mapper function.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	423 If the Result contained a successful operation it remains unchanged
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	424 (a reference to the current instance is returned).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	425 If the mapper function panics this method does as well.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	426
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	427 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	428 mapper (Callable[[E], D]): The mapper operation to be applied to the Result error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	429
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	430 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	431 Result[U, E]: The result of the mapper operation applied to the Result error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	432 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	433 if self.isOk: return self
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	434 return Result.Err(mapper(self.value))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	435
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	436 def __str__(self):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	437 return f"Result::{'Ok' if self.isOk else 'Err'}({self.value})"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	438
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	439 # FILES
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	440 def read_dataset(path :FilePath, datasetName = "Dataset (not actual file name!)") -> pd.DataFrame:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	441 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	442 Reads a .csv or .tsv file and returns it as a Pandas DataFrame.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	443
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	444 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	445 path : the path to the dataset file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	446 datasetName : the name of the dataset.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	447
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	448 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	449 DataErr: If anything goes wrong when trying to open the file, if pandas thinks the dataset is empty or if
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	450 it has less than 2 columns.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	451
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	452 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	453 pandas.DataFrame: The dataset loaded as a Pandas DataFrame.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	454 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	455 # I advise against the use of this function. This is an attempt at standardizing bad legacy code rather than
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	456 # removing / replacing it to avoid introducing as many bugs as possible in the tools still relying on this code.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	457 # First off, this is not the best way to distinguish between .csv and .tsv files and Galaxy itself makes it really
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	458 # hard to implement anything better. Also, this function's name advertizes it as a dataset-specific operation and
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	459 # contains dubious responsibility (how many columns..) while being a file-opening function instead. My suggestion is
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	460 # TODO: stop using dataframes ever at all in anything and find a way to have tight control over file extensions.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	461 try: dataset = pd.read_csv(path.show(), sep = '\t', header = None, engine = "python")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	462 except:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	463 try: dataset = pd.read_csv(path.show(), sep = ',', header = 0, engine = "python")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	464 except Exception as err: raise DataErr(datasetName, f"encountered empty or wrongly formatted data: {err}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	465
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	466 if len(dataset.columns) < 2: raise DataErr(datasetName, "a dataset is always meant to have at least 2 columns")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	467 return dataset
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	468
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	469 def readPickle(path :FilePath) -> Any:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	470 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	471 Reads the contents of a .pickle file, which needs to exist at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	472
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	473 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	474 path : the path to the .pickle file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	475
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	476 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	477 Any : the data inside a pickle file, could be anything.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	478 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	479 with open(path.show(), "rb") as fd: return pickle.load(fd)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	480
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	481 def writePickle(path :FilePath, data :Any) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	482 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	483 Saves any data in a .pickle file, created at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	484
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	485 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	486 path : the path to the .pickle file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	487 data : the data to be written to the file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	488
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	489 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	490 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	491 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	492 with open(path.show(), "wb") as fd: pickle.dump(data, fd)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	493
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	494 def readCsv(path :FilePath, delimiter = ',', *, skipHeader = True) -> List[List[str]]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	495 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	496 Reads the contents of a .csv file, which needs to exist at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	497
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	498 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	499 path : the path to the .csv file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	500 delimiter : allows other subformats such as .tsv to be opened by the same method (\\t delimiter).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	501 skipHeader : whether the first row of the file is a header and should be skipped.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	502
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	503 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	504 List[List[str]] : list of rows from the file, each parsed as a list of strings originally separated by commas.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	505 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	506 with open(path.show(), "r", newline = "") as fd: return list(csv.reader(fd, delimiter = delimiter))[skipHeader:]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	507
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	508 def readSvg(path :FilePath, customErr :Optional[Exception] = None) -> ET.ElementTree:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	509 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	510 Reads the contents of a .svg file, which needs to exist at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	511
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	512 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	513 path : the path to the .svg file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	514
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	515 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	516 DataErr : if the map is malformed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	517
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	518 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	519 Any : the data inside a svg file, could be anything.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	520 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	521 try: return ET.parse(path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	522 except (ET.XMLSyntaxError, ET.XMLSchemaParseError) as err:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	523 raise customErr if customErr else err
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	524
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	525 def writeSvg(path :FilePath, data:ET.ElementTree) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	526 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	527 Saves svg data opened with lxml.etree in a .svg file, created at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	528
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	529 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	530 path : the path to the .svg file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	531 data : the data to be written to the file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	532
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	533 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	534 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	535 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	536 with open(path.show(), "wb") as fd: fd.write(ET.tostring(data))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	537
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	538 # UI ARGUMENTS
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	539 class Bool:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	540 def __init__(self, argName :str) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	541 self.argName = argName
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	542
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	543 def __call__(self, s :str) -> bool: return self.check(s)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	544
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	545 def check(self, s :str) -> bool:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	546 s = s.lower()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	547 if s == "true" : return True
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	548 if s == "false": return False
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	549 raise ArgsErr(self.argName, "boolean string (true or false, not case sensitive)", f"\"{s}\"")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	550
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	551 class Float:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	552 def __init__(self, argName = "Dataset values, not an argument") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	553 self.argName = argName
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	554
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	555 def __call__(self, s :str) -> float: return self.check(s)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	556
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	557 def check(self, s :str) -> float:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	558 try: return float(s)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	559 except ValueError:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	560 s = s.lower()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	561 if s == "nan" or s == "none": return math.nan
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	562 raise ArgsErr(self.argName, "numeric string or \"None\" or \"NaN\" (not case sensitive)", f"\"{s}\"")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	563
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	564 # MODELS
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	565 OldRule = List[Union[str, "OldRule"]]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	566 class Model(Enum):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	567 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	568 Represents a metabolic model, either custom or locally supported. Custom models don't point
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	569 to valid file paths.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	570 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	571
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	572 Recon = "Recon"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	573 ENGRO2 = "ENGRO2"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	574 ENGRO2_no_legend = "ENGRO2_no_legend"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	575 HMRcore = "HMRcore"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	576 HMRcore_no_legend = "HMRcore_no_legend"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	577 Custom = "Custom" # Exists as a valid variant in the UI, but doesn't point to valid file paths.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	578
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	579 def __raiseMissingPathErr(self, path :Optional[FilePath]) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	580 if not path: raise PathErr("<<MISSING>>", "it's necessary to provide a custom path when retrieving files from a custom model")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	581
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	582 def getRules(self, toolDir :str, customPath :Optional[FilePath] = None) -> Dict[str, Dict[str, OldRule]]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	583 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	584 Open "rules" file for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	585
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	586 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	587 Dict[str, Dict[str, OldRule]] : the rules for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	588 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	589 path = customPath if self is Model.Custom else FilePath(f"{self.name}_rules", FileFormat.PICKLE, prefix = f"{toolDir}/local/pickle files/")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	590 self.__raiseMissingPathErr(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	591 return readPickle(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	592
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	593 def getTranslator(self, toolDir :str, customPath :Optional[FilePath] = None) -> Dict[str, Dict[str, str]]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	594 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	595 Open "gene translator (old: gene_in_rule)" file for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	596
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	597 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	598 Dict[str, Dict[str, str]] : the translator dict for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	599 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	600 path = customPath if self is Model.Custom else FilePath(f"{self.name}_genes", FileFormat.PICKLE, prefix = f"{toolDir}/local/pickle files/")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	601 self.__raiseMissingPathErr(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	602 return readPickle(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	603
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	604 def getMap(self, toolDir = ".", customPath :Optional[FilePath] = None) -> ET.ElementTree:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	605 path = customPath if self is Model.Custom else FilePath(f"{self.name}_map", FileFormat.SVG, prefix = f"{toolDir}/local/svg metabolic maps/")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	606 self.__raiseMissingPathErr(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	607 return readSvg(path, customErr = DataErr(path, f"custom map in wrong format"))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	608
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	609 def getCOBRAmodel(self, toolDir = ".", customPath :Optional[FilePath] = None, customExtension :Optional[FilePath]=None)->cobra.Model:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	610 if(self is Model.Custom):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	611 return self.load_custom_model(customPath, customExtension)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	612 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	613 return cobra.io.read_sbml_model(FilePath(f"{self.name}", FileFormat.XML, prefix = f"{toolDir}/local/models/").show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	614
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	615 def load_custom_model(self, file_path :FilePath, ext :Optional[FileFormat] = None) -> cobra.Model:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	616 ext = ext if ext else file_path.ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	617 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	618 if str(ext) in FileFormat.XML.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	619 return cobra.io.read_sbml_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	620
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	621 if str(ext) in FileFormat.JSON.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	622 # Compressed files are not automatically handled by cobra
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	623 if(ext == "json"):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	624 return cobra.io.load_json_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	625 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	626 return self.extract_model(file_path, ext, "json")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	627
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	628 if str(ext) in FileFormat.MAT.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	629 # Compressed files are not automatically handled by cobra
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	630 if(ext == "mat"):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	631 return cobra.io.load_matlab_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	632 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	633 return self.extract_model(file_path, ext, "mat")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	634
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	635 if str(ext) in FileFormat.YML.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	636 # Compressed files are not automatically handled by cobra
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	637 if(ext == "yml"):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	638 return cobra.io.load_yaml_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	639 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	640 return self.extract_model(file_path, ext, "yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	641
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	642 except Exception as e: raise DataErr(file_path, e.__str__())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	643 raise DataErr(file_path,
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	644 f"Fomat \"{file_path.ext}\" is not recognized, only JSON, XML, MAT and YAML (.yml) files are supported.")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	645
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	646
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	647 def extract_model(self, file_path:FilePath, ext :FileFormat, model_encoding:Literal["json", "mat", "yml"]) -> cobra.Model:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	648 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	649 Extract JSON, MAT and YAML COBRA model from a compressed file (zip, gz, bz2).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	650
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	651 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	652 file_path: File path of the model
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	653 ext: File extensions of class FileFormat (should be .zip, .gz or .bz2)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	654
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	655 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	656 cobra.Model: COBRApy model
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	657
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	658 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	659 Exception: Extraction errors
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	660 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	661 ext_str = str(ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	662
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	663 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	664 if '.zip' in ext_str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	665 with zipfile.ZipFile(file_path.show(), 'r') as zip_ref:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	666 with zip_ref.open(zip_ref.namelist()[0]) as json_file:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	667 content = json_file.read().decode('utf-8')
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	668 if model_encoding == "json":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	669 return cobra.io.load_json_model(StringIO(content))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	670 elif model_encoding == "mat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	671 return cobra.io.load_matlab_model(StringIO(content))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	672 elif model_encoding == "yml":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	673 return cobra.io.load_yaml_model(StringIO(content))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	674 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	675 raise ValueError(f"Unsupported model encoding: {model_encoding}. Supported: json, mat, yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	676 elif '.gz' in ext_str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	677 with gzip.open(file_path.show(), 'rt', encoding='utf-8') as gz_ref:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	678 if model_encoding == "json":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	679 return cobra.io.load_json_model(gz_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	680 elif model_encoding == "mat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	681 return cobra.io.load_matlab_model(gz_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	682 elif model_encoding == "yml":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	683 return cobra.io.load_yaml_model(gz_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	684 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	685 raise ValueError(f"Unsupported model encoding: {model_encoding}. Supported: json, mat, yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	686 elif '.bz2' in ext_str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	687 with bz2.open(file_path.show(), 'rt', encoding='utf-8') as bz2_ref:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	688 if model_encoding == "json":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	689 return cobra.io.load_json_model(bz2_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	690 elif model_encoding == "mat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	691 return cobra.io.load_matlab_model(bz2_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	692 elif model_encoding == "yml":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	693 return cobra.io.load_yaml_model(bz2_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	694 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	695 raise ValueError(f"Unsupported model encoding: {model_encoding}. Supported: json, mat, yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	696 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	697 raise ValueError(f"Compression format not supported: {ext_str}. Supported: .zip, .gz and .bz2")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	698
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	699 except Exception as e:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	700 raise Exception(f"Error during model extraction: {str(e)}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	701
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	702
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	703
394 a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	704 def __str__(self) -> str: return self.value
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	705
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	706
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	707 def convert_genes(model,annotation):
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	708 from cobra.manipulation import rename_genes
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	709 model2=model.copy()
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	710 try:
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	711 dict_genes={gene.id:gene.notes[annotation] for gene in model2.genes}
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	712 except:
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	713 print("No annotation in gene dict!")
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	714 return -1
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	715 rename_genes(model2,dict_genes)
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	716
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	717 return model2
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	718
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	719
409 71850bdf9e1e Uploaded francesco_lapi parents: 408 diff changeset	720 def build_cobra_model_from_csv(csv_path: str, model_id: str = "new_model") -> cobra.Model:
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	721 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	722 Costruisce un modello COBRApy a partire da un file CSV con i dati delle reazioni.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	723
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	724 Args:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	725 csv_path: Path al file CSV (separato da tab)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	726 model_id: ID del modello da creare
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	727
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	728 Returns:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	729 cobra.Model: Il modello COBRApy costruito
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	730 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	731
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	732 # Leggi i dati dal CSV
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	733 df = pd.read_csv(csv_path, sep='\t')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	734
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	735 # Crea il modello vuoto
409 71850bdf9e1e Uploaded francesco_lapi parents: 408 diff changeset	736 model = cobraModel(model_id)
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	737
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	738 # Dict per tenere traccia di metaboliti e compartimenti
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	739 metabolites_dict = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	740 compartments_dict = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	741
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	742 print(f"Costruendo modello da {len(df)} reazioni...")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	743
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	744 # Prima passata: estrai metaboliti e compartimenti dalle formule delle reazioni
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	745 for idx, row in df.iterrows():
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	746 reaction_formula = str(row['Reaction']).strip()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	747 if not reaction_formula or reaction_formula == 'nan':
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	748 continue
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	749
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	750 # Estrai metaboliti dalla formula della reazione
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	751 metabolites = extract_metabolites_from_reaction(reaction_formula)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	752
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	753 for met_id in metabolites:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	754 compartment = extract_compartment_from_metabolite(met_id)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	755
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	756 # Aggiungi compartimento se non esiste
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	757 if compartment not in compartments_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	758 compartments_dict[compartment] = compartment
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	759
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	760 # Aggiungi metabolita se non esiste
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	761 if met_id not in metabolites_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	762 metabolites_dict[met_id] = Metabolite(
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	763 id=met_id,
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	764 compartment=compartment,
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	765 name=met_id.replace(f"_{compartment}", "").replace("__", "_")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	766 )
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	767
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	768 # Aggiungi compartimenti al modello
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	769 model.compartments = compartments_dict
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	770
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	771 # Aggiungi metaboliti al modello
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	772 model.add_metabolites(list(metabolites_dict.values()))
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	773
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	774 print(f"Aggiunti {len(metabolites_dict)} metaboliti e {len(compartments_dict)} compartimenti")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	775
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	776 # Seconda passata: aggiungi le reazioni
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	777 reactions_added = 0
414 5086145cfb96 Uploaded francesco_lapi parents: 413 diff changeset	778 reactions_skipped = 0
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	779
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	780 for idx, row in df.iterrows():
415 4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	781
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	782 reaction_id = str(row['ReactionID']).strip()
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	783 reaction_formula = str(row['Reaction']).strip()
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	784
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	785 # Salta reazioni senza formula
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	786 if not reaction_formula or reaction_formula == 'nan':
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	787 raise ValueError(f"Formula della reazione mancante {reaction_id}")
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	788
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	789 # Crea la reazione
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	790 reaction = Reaction(reaction_id)
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	791 reaction.name = reaction_id
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	792
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	793 # Imposta bounds
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	794 reaction.lower_bound = float(row['lower_bound']) if pd.notna(row['lower_bound']) else -1000.0
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	795 reaction.upper_bound = float(row['upper_bound']) if pd.notna(row['upper_bound']) else 1000.0
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	796
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	797 # Aggiungi gene rule se presente
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	798 if pd.notna(row['Rule']) and str(row['Rule']).strip():
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	799 reaction.gene_reaction_rule = str(row['Rule']).strip()
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	800
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	801 # Parse della formula della reazione
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	802 try:
415 4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	803 parse_reaction_formula(reaction, reaction_formula, metabolites_dict)
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	804 except Exception as e:
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	805 print(f"Errore nel parsing della reazione {reaction_id}: {e}")
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	806 reactions_skipped += 1
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	807 continue
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	808
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	809 # Aggiungi la reazione al modello
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	810 model.add_reactions([reaction])
4a248b45273c Uploaded francesco_lapi parents: 414 diff changeset	811 reactions_added += 1
412 bdf4630ac1eb Uploaded francesco_lapi parents: 411 diff changeset	812
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	813
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	814 print(f"Aggiunte {reactions_added} reazioni, saltate {reactions_skipped} reazioni")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	815
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	816 # Imposta l'obiettivo di biomassa
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	817 set_biomass_objective(model)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	818
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	819 # Imposta il medium
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	820 set_medium_from_data(model, df)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	821
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	822 print(f"Modello completato: {len(model.reactions)} reazioni, {len(model.metabolites)} metaboliti")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	823
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	824 return model
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	825
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	826
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	827 # Estrae tutti gli ID metaboliti nella formula (gestisce prefissi numerici + underscore)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	828 def extract_metabolites_from_reaction(reaction_formula: str) -> Set[str]:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	829 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	830 Estrae gli ID dei metaboliti da una formula di reazione.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	831 Pattern robusto: cattura token che terminano con _<compartimento> (es. _c, _m, _e)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	832 e permette che comincino con cifre o underscore.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	833 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	834 metabolites = set()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	835 # coefficiente opzionale seguito da un token che termina con _<letters>
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	836 pattern = r'(?:\d+(?:\.\d+)?\s+)?([A-Za-z0-9_]+_[a-z]+)'
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	837 matches = re.findall(pattern, reaction_formula)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	838 metabolites.update(matches)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	839 return metabolites
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	840
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	841
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	842 def extract_compartment_from_metabolite(metabolite_id: str) -> str:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	843 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	844 Estrae il compartimento dall'ID del metabolita.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	845 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	846 # Il compartimento è solitamente l'ultima lettera dopo l'underscore
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	847 if '_' in metabolite_id:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	848 return metabolite_id.split('_')[-1]
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	849 return 'c' # default cytoplasm
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	850
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	851
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	852 def parse_reaction_formula(reaction: Reaction, formula: str, metabolites_dict: Dict[str, Metabolite]):
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	853 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	854 Parsa una formula di reazione e imposta i metaboliti con i loro coefficienti.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	855 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	856
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	857 if reaction.id == 'EX_thbpt_e':
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	858 print(reaction.id)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	859 print(formula)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	860 # Dividi in parte sinistra e destra
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	861 if '<=>' in formula:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	862 left, right = formula.split('<=>')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	863 reversible = True
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	864 elif '<--' in formula:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	865 left, right = formula.split('<--')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	866 reversible = False
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	867 left, right = left, right
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	868 elif '-->' in formula:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	869 left, right = formula.split('-->')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	870 reversible = False
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	871 elif '<-' in formula:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	872 left, right = formula.split('<-')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	873 reversible = False
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	874 left, right = left, right
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	875 else:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	876 raise ValueError(f"Formato reazione non riconosciuto: {formula}")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	877
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	878 # Parse dei metaboliti e coefficienti
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	879 reactants = parse_metabolites_side(left.strip())
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	880 products = parse_metabolites_side(right.strip())
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	881
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	882 # Aggiungi metaboliti alla reazione
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	883 metabolites_to_add = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	884
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	885 # Reagenti (coefficienti negativi)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	886 for met_id, coeff in reactants.items():
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	887 if met_id in metabolites_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	888 metabolites_to_add[metabolites_dict[met_id]] = -coeff
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	889
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	890 # Prodotti (coefficienti positivi)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	891 for met_id, coeff in products.items():
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	892 if met_id in metabolites_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	893 metabolites_to_add[metabolites_dict[met_id]] = coeff
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	894
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	895 reaction.add_metabolites(metabolites_to_add)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	896
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	897
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	898 def parse_metabolites_side(side_str: str) -> Dict[str, float]:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	899 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	900 Parsa un lato della reazione per estrarre metaboliti e coefficienti.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	901 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	902 metabolites = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	903 if not side_str or side_str.strip() == '':
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	904 return metabolites
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	905
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	906 terms = side_str.split('+')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	907 for term in terms:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	908 term = term.strip()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	909 if not term:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	910 continue
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	911
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	912 # pattern allineato: coefficiente opzionale + id che termina con _<compartimento>
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	913 match = re.match(r'(?:(\d+\.?\d*)\s+)?([A-Za-z0-9_]+_[a-z]+)', term)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	914 if match:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	915 coeff_str, met_id = match.groups()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	916 coeff = float(coeff_str) if coeff_str else 1.0
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	917 metabolites[met_id] = coeff
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	918
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	919 return metabolites
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	920
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	921
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	922
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	923 def set_biomass_objective(model: Model):
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	924 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	925 Imposta la reazione di biomassa come obiettivo.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	926 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	927 biomass_reactions = [r for r in model.reactions if 'biomass' in r.id.lower()]
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	928
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	929 if biomass_reactions:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	930 model.objective = biomass_reactions[0].id
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	931 print(f"Obiettivo impostato su: {biomass_reactions[0].id}")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	932 else:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	933 print("Nessuna reazione di biomassa trovata")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	934
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	935
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	936 def set_medium_from_data(model: Model, df: pd.DataFrame):
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	937 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	938 Imposta il medium basato sulla colonna InMedium.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	939 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	940 medium_reactions = df[df['InMedium'] == True]['ReactionID'].tolist()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	941
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	942 medium_dict = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	943 for rxn_id in medium_reactions:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	944 if rxn_id in [r.id for r in model.reactions]:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	945 reaction = model.reactions.get_by_id(rxn_id)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	946 if reaction.lower_bound < 0: # Solo reazioni di uptake
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	947 medium_dict[rxn_id] = abs(reaction.lower_bound)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	948
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	949 if medium_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	950 model.medium = medium_dict
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	951 print(f"Medium impostato con {len(medium_dict)} componenti")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	952
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	953
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	954 def validate_model(model: Model) -> Dict[str, any]:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	955 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	956 Valida il modello e fornisce statistiche di base.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	957 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	958 validation = {
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	959 'num_reactions': len(model.reactions),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	960 'num_metabolites': len(model.metabolites),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	961 'num_genes': len(model.genes),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	962 'num_compartments': len(model.compartments),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	963 'objective': str(model.objective),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	964 'medium_size': len(model.medium),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	965 'reversible_reactions': len([r for r in model.reactions if r.reversibility]),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	966 'exchange_reactions': len([r for r in model.reactions if r.id.startswith('EX_')]),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	967 }
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	968
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	969 try:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	970 # Test di crescita
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	971 solution = model.optimize()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	972 validation['growth_rate'] = solution.objective_value
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	973 validation['status'] = solution.status
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	974 except Exception as e:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	975 validation['growth_rate'] = None
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	976 validation['status'] = f"Error: {e}"
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	977
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	978 return validation

Mercurial > repos > bimib > cobraxy

annotate COBRAxy/utils/general_utils.py @ 415:4a248b45273c draft