cobraxy: COBRAxy/utils/general

annotate COBRAxy/utils/general_utils.py @ 411:6b015d3184ab draft

Uploaded

author	francesco_lapi
date	Mon, 08 Sep 2025 21:07:34 +0000
parents	71850bdf9e1e
children	bdf4630ac1eb

rev	line source
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	1 import math
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	2 import re
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	3 import sys
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	4 import csv
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	5 import pickle
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	6 import lxml.etree as ET
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	7
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	8 from enum import Enum
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	9 from itertools import count
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	10 from typing import Any, Callable, Dict, Generic, List, Literal, Optional, TypeVar, Union, Set, Tuple
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	11
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	12 import pandas as pd
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	13 import cobra
409 71850bdf9e1e Uploaded francesco_lapi parents: 408 diff changeset	14 from cobra import Model as cobraModel, Reaction, Metabolite
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	15
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	16 import zipfile
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	17 import gzip
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	18 import bz2
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	19 from io import StringIO
411 6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	20 import rule_parsing as rulesUtils
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	21 import reaction_parsing as reactionUtils
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	22
394 a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	23
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	24
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	25 class ValueErr(Exception):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	26 def __init__(self, param_name, expected, actual):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	27 super().__init__(f"Invalid value for {param_name}: expected {expected}, got {actual}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	28
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	29 class PathErr(Exception):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	30 def __init__(self, path, message):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	31 super().__init__(f"Path error for '{path}': {message}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	32
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	33 class FileFormat(Enum):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	34 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	35 Encodes possible file extensions to conditionally save data in a different format.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	36 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	37 DAT = ("dat",) # this is how galaxy treats all your files!
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	38 CSV = ("csv",) # this is how most editable input data is written
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	39 TSV = ("tsv",) # this is how most editable input data is ACTUALLY written TODO:more support pls!!
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	40 SVG = ("svg",) # this is how most metabolic maps are written
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	41 PNG = ("png",) # this is a common output format for images (such as metabolic maps)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	42 PDF = ("pdf",) # this is also a common output format for images, as it's required in publications.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	43
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	44 # Updated to include compressed variants
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	45 XML = ("xml", "xml.gz", "xml.zip", "xml.bz2") # SBML files are XML files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	46 JSON = ("json", "json.gz", "json.zip", "json.bz2") # COBRA models can be stored as JSON files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	47 MAT = ("mat", "mat.gz", "mat.zip", "mat.bz2") # COBRA models can be stored as MAT files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	48 YML = ("yml", "yml.gz", "yml.zip", "yml.bz2") # COBRA models can be stored as YML files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	49
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	50 TXT = ("txt",) # this is how most output data is written
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	51 PICKLE = ("pickle", "pk", "p") # this is how all runtime data structures are saved
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	52
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	53 def __init__(self, *extensions):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	54 self.extensions = extensions
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	55 # Store original extension when set via fromExt
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	56 self._original_extension = None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	57
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	58 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	59 def fromExt(cls, ext: str) -> "FileFormat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	60 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	61 Converts a file extension string to a FileFormat instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	62 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	63 ext : The file extension as a string.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	64 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	65 FileFormat: The FileFormat instance corresponding to the file extension.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	66 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	67 variantName = ext.upper()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	68 if variantName in FileFormat.__members__:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	69 instance = FileFormat[variantName]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	70 instance._original_extension = ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	71 return instance
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	72
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	73 variantName = ext.lower()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	74 for member in cls:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	75 if variantName in member.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	76 # Create a copy-like behavior by storing the original extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	77 member._original_extension = ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	78 return member
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	79
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	80 raise ValueErr("ext", "a valid FileFormat file extension", ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	81
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	82 def __str__(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	83 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	84 (Private) converts to str representation. Good practice for usage with argparse.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	85 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	86 str : the string representation of the file extension.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	87 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	88 # If we have an original extension stored (for compressed files only), use it
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	89 if hasattr(self, '_original_extension') and self._original_extension:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	90 return self._original_extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	91
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	92 # For XML, JSON, MAT and YML without original extension, use the base extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	93 if self == FileFormat.XML:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	94 return "xml"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	95 elif self == FileFormat.JSON:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	96 return "json"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	97 elif self == FileFormat.MAT:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	98 return "mat"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	99 elif self == FileFormat.YML:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	100 return "yml"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	101
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	102 return self.value[-1]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	103
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	104 class FilePath():
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	105 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	106 Represents a file path. View this as an attempt to standardize file-related operations by expecting
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	107 values of this type in any process requesting a file path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	108 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	109 def __init__(self, filePath: str, ext: FileFormat, *, prefix="") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	110 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	111 (Private) Initializes an instance of FilePath.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	112 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	113 path : the end of the path, containing the file name.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	114 ext : the file's extension.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	115 prefix : anything before path, if the last '/' isn't there it's added by the code.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	116 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	117 None : practically, a FilePath instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	118 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	119 self.ext = ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	120 self.filePath = filePath
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	121
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	122 if prefix and prefix[-1] != '/':
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	123 prefix += '/'
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	124 self.prefix = prefix
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	125
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	126 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	127 def fromStrPath(cls, path: str) -> "FilePath":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	128 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	129 Factory method to parse a string from which to obtain, if possible, a valid FilePath instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	130 It detects double extensions such as .json.gz and .xml.bz2, which are common in COBRA models.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	131 These double extensions are not supported for other file types such as .csv.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	132 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	133 path : the string containing the path
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	134 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	135 PathErr : if the provided string doesn't represent a valid path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	136 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	137 FilePath : the constructed instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	138 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	139 result = re.search(r"^(?P<prefix>.\/)?(?P<name>.)\.(?P<ext>[^.]*)$", path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	140 if not result or not result["name"] or not result["ext"]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	141 raise PathErr(path, "cannot recognize folder structure or extension in path")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	142
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	143 prefix = result["prefix"] if result["prefix"] else ""
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	144 name, ext = result["name"], result["ext"]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	145
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	146 # Check for double extensions (json.gz, xml.zip, etc.)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	147 parts = path.split(".")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	148 if len(parts) >= 3:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	149 penultimate = parts[-2]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	150 last = parts[-1]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	151 double_ext = f"{penultimate}.{last}"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	152
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	153 # Try the double extension first
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	154 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	155 ext_format = FileFormat.fromExt(double_ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	156 name = ".".join(parts[:-2])
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	157 # Extract prefix if it exists
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	158 if '/' in name:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	159 prefix = name[:name.rfind('/') + 1]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	160 name = name[name.rfind('/') + 1:]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	161 return cls(name, ext_format, prefix=prefix)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	162 except ValueErr:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	163 # If double extension doesn't work, fall back to single extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	164 pass
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	165
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	166 # Single extension fallback (original logic)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	167 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	168 ext_format = FileFormat.fromExt(ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	169 return cls(name, ext_format, prefix=prefix)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	170 except ValueErr:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	171 raise PathErr(path, f"unsupported file extension: {ext}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	172
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	173 def show(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	174 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	175 Shows the path as a string.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	176 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	177 str : the path shown as a string.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	178 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	179 return f"{self.prefix}{self.filePath}.{self.ext}"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	180
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	181 def __str__(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	182 return self.show()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	183
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	184 # ERRORS
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	185 def terminate(msg :str) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	186 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	187 Terminate the execution of the script with an error message.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	188
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	189 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	190 msg (str): The error message to be displayed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	191
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	192 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	193 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	194 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	195 sys.exit(f"Execution aborted: {msg}\n")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	196
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	197 def logWarning(msg :str, loggerPath :str) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	198 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	199 Log a warning message to an output log file and print it to the console. The final period and a
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	200 newline is added by the function.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	201
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	202 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	203 s (str): The warning message to be logged and printed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	204 loggerPath : The file path of the output log file. Given as a string, parsed to a FilePath and
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	205 immediately read back (beware relative expensive operation, log with caution).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	206
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	207 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	208 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	209 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	210 # building the path and then reading it immediately seems useless, but it's actually a way of
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	211 # validating that reduces repetition on the caller's side. Besides, logging a message by writing
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	212 # to a file is supposed to be computationally expensive anyway, so this is also a good deterrent from
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	213 # mindlessly logging whenever something comes up, log at the very end and tell the user everything
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	214 # that went wrong. If you don't like it: implement a persistent runtime buffer that gets dumped to
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	215 # the file only at the end of the program's execution.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	216 with open(FilePath.fromStrPath(loggerPath).show(), 'a') as log: log.write(f"{msg}.\n")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	217
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	218 class CustomErr(Exception):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	219 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	220 Custom error class to handle exceptions in a structured way, with a unique identifier and a message.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	221 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	222 __idGenerator = count()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	223 errName = "Custom Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	224 def __init__(self, msg :str, details = "", explicitErrCode = -1) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	225 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	226 (Private) Initializes an instance of CustomErr.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	227
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	228 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	229 msg (str): Error message to be displayed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	230 details (str): Informs the user more about the error encountered. Defaults to "".
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	231 explicitErrCode (int): Explicit error code to be used. Defaults to -1.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	232
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	233 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	234 None : practically, a CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	235 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	236 self.msg = msg
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	237 self.details = details
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	238
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	239 self.id = max(explicitErrCode, next(CustomErr.__idGenerator))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	240
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	241 def throw(self, loggerPath = "") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	242 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	243 Raises the current CustomErr instance, logging a warning message before doing so.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	244
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	245 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	246 self: The current CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	247
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	248 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	249 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	250 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	251 if loggerPath: logWarning(str(self), loggerPath)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	252 raise self
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	253
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	254 def abort(self) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	255 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	256 Aborts the execution of the script.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	257
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	258 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	259 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	260 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	261 terminate(str(self))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	262
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	263 def __str__(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	264 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	265 (Private) Returns a string representing the current CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	266
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	267 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	268 str: A string representing the current CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	269 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	270 return f"{CustomErr.errName} #{self.id}: {self.msg}, {self.details}."
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	271
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	272 class ArgsErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	273 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	274 CustomErr subclass for UI arguments errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	275 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	276 errName = "Args Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	277 def __init__(self, argName :str, expected :Any, actual :Any, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	278 super().__init__(f"argument \"{argName}\" expected {expected} but got {actual}", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	279
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	280 class DataErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	281 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	282 CustomErr subclass for data formatting errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	283 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	284 errName = "Data Format Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	285 def __init__(self, fileName :str, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	286 super().__init__(f"file \"{fileName}\" contains malformed data", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	287
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	288 class PathErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	289 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	290 CustomErr subclass for filepath formatting errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	291 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	292 errName = "Path Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	293 def __init__(self, path :FilePath, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	294 super().__init__(f"path \"{path}\" is invalid", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	295
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	296 class ValueErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	297 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	298 CustomErr subclass for any value error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	299 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	300 errName = "Value Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	301 def __init__(self, valueName: str, expected :Any, actual :Any, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	302 super().__init__("value " + f"\"{valueName}\" " * bool(valueName) + f"was supposed to be {expected}, but got {actual} instead", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	303
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	304 # RESULT
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	305 T = TypeVar('T')
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	306 E = TypeVar('E', bound = CustomErr) # should bind to Result.ResultErr but python happened!
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	307 class Result(Generic[T, E]):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	308 class ResultErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	309 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	310 CustomErr subclass for all Result errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	311 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	312 errName = "Result Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	313 def __init__(self, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	314 super().__init__(msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	315 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	316 Class to handle the result of an operation, with a value and a boolean flag to indicate
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	317 whether the operation was successful or not.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	318 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	319 def __init__(self, value :Union[T, E], isOk :bool) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	320 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	321 (Private) Initializes an instance of Result.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	322
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	323 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	324 value (Union[T, E]): The value to be stored in the Result instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	325 isOk (bool): A boolean flag to indicate whether the operation was successful or not.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	326
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	327 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	328 None : practically, a Result instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	329 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	330 self.isOk = isOk
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	331 self.isErr = not isOk
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	332 self.value = value
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	333
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	334 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	335 def Ok(cls, value :T) -> "Result":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	336 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	337 Constructs a new Result instance with a successful operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	338
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	339 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	340 value (T): The value to be stored in the Result instance, set as successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	341
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	342 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	343 Result: A new Result instance with a successful operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	344 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	345 return Result(value, isOk = True)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	346
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	347 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	348 def Err(cls, value :E) -> "Result":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	349 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	350 Constructs a new Result instance with a failed operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	351
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	352 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	353 value (E): The value to be stored in the Result instance, set as failed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	354
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	355 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	356 Result: A new Result instance with a failed operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	357 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	358 return Result(value, isOk = False)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	359
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	360 def unwrap(self) -> T:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	361 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	362 Unwraps the value of the Result instance, if the operation was successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	363
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	364 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	365 ResultErr: If the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	366
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	367 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	368 T: The value of the Result instance, if the operation was successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	369 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	370 if self.isOk: return self.value
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	371 raise Result.ResultErr(f"Unwrapped Result.Err : {self.value}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	372
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	373 def unwrapOr(self, default :T) -> T:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	374 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	375 Unwraps the value of the Result instance, if the operation was successful, otherwise
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	376 it returns a default value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	377
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	378 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	379 default (T): The default value to be returned if the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	380
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	381 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	382 T: The value of the Result instance, if the operation was successful,
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	383 otherwise the default value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	384 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	385 return self.value if self.isOk else default
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	386
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	387 def expect(self, err :"Result.ResultErr") -> T:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	388 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	389 Expects that the value of the Result instance is successful, otherwise it raises an error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	390
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	391 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	392 err (Exception): The error to be raised if the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	393
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	394 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	395 err: The error raised if the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	396
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	397 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	398 T: The value of the Result instance, if the operation was successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	399 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	400 if self.isOk: return self.value
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	401 raise err
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	402
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	403 U = TypeVar("U")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	404 def map(self, mapper: Callable[[T], U]) -> "Result[U, E]":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	405 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	406 Maps the value of the current Result to whatever is returned by the mapper function.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	407 If the Result contained an unsuccessful operation to begin with it remains unchanged
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	408 (a reference to the current instance is returned).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	409 If the mapper function panics the returned result instance will be of the error kind.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	410
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	411 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	412 mapper (Callable[[T], U]): The mapper operation to be applied to the Result value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	413
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	414 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	415 Result[U, E]: The result of the mapper operation applied to the Result value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	416 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	417 if self.isErr: return self
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	418 try: return Result.Ok(mapper(self.value))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	419 except Exception as e: return Result.Err(e)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	420
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	421 D = TypeVar("D", bound = "Result.ResultErr")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	422 def mapErr(self, mapper :Callable[[E], D]) -> "Result[T, D]":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	423 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	424 Maps the error of the current Result to whatever is returned by the mapper function.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	425 If the Result contained a successful operation it remains unchanged
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	426 (a reference to the current instance is returned).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	427 If the mapper function panics this method does as well.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	428
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	429 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	430 mapper (Callable[[E], D]): The mapper operation to be applied to the Result error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	431
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	432 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	433 Result[U, E]: The result of the mapper operation applied to the Result error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	434 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	435 if self.isOk: return self
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	436 return Result.Err(mapper(self.value))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	437
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	438 def __str__(self):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	439 return f"Result::{'Ok' if self.isOk else 'Err'}({self.value})"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	440
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	441 # FILES
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	442 def read_dataset(path :FilePath, datasetName = "Dataset (not actual file name!)") -> pd.DataFrame:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	443 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	444 Reads a .csv or .tsv file and returns it as a Pandas DataFrame.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	445
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	446 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	447 path : the path to the dataset file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	448 datasetName : the name of the dataset.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	449
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	450 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	451 DataErr: If anything goes wrong when trying to open the file, if pandas thinks the dataset is empty or if
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	452 it has less than 2 columns.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	453
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	454 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	455 pandas.DataFrame: The dataset loaded as a Pandas DataFrame.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	456 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	457 # I advise against the use of this function. This is an attempt at standardizing bad legacy code rather than
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	458 # removing / replacing it to avoid introducing as many bugs as possible in the tools still relying on this code.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	459 # First off, this is not the best way to distinguish between .csv and .tsv files and Galaxy itself makes it really
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	460 # hard to implement anything better. Also, this function's name advertizes it as a dataset-specific operation and
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	461 # contains dubious responsibility (how many columns..) while being a file-opening function instead. My suggestion is
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	462 # TODO: stop using dataframes ever at all in anything and find a way to have tight control over file extensions.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	463 try: dataset = pd.read_csv(path.show(), sep = '\t', header = None, engine = "python")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	464 except:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	465 try: dataset = pd.read_csv(path.show(), sep = ',', header = 0, engine = "python")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	466 except Exception as err: raise DataErr(datasetName, f"encountered empty or wrongly formatted data: {err}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	467
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	468 if len(dataset.columns) < 2: raise DataErr(datasetName, "a dataset is always meant to have at least 2 columns")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	469 return dataset
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	470
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	471 def readPickle(path :FilePath) -> Any:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	472 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	473 Reads the contents of a .pickle file, which needs to exist at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	474
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	475 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	476 path : the path to the .pickle file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	477
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	478 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	479 Any : the data inside a pickle file, could be anything.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	480 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	481 with open(path.show(), "rb") as fd: return pickle.load(fd)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	482
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	483 def writePickle(path :FilePath, data :Any) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	484 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	485 Saves any data in a .pickle file, created at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	486
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	487 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	488 path : the path to the .pickle file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	489 data : the data to be written to the file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	490
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	491 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	492 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	493 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	494 with open(path.show(), "wb") as fd: pickle.dump(data, fd)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	495
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	496 def readCsv(path :FilePath, delimiter = ',', *, skipHeader = True) -> List[List[str]]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	497 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	498 Reads the contents of a .csv file, which needs to exist at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	499
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	500 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	501 path : the path to the .csv file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	502 delimiter : allows other subformats such as .tsv to be opened by the same method (\\t delimiter).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	503 skipHeader : whether the first row of the file is a header and should be skipped.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	504
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	505 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	506 List[List[str]] : list of rows from the file, each parsed as a list of strings originally separated by commas.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	507 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	508 with open(path.show(), "r", newline = "") as fd: return list(csv.reader(fd, delimiter = delimiter))[skipHeader:]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	509
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	510 def readSvg(path :FilePath, customErr :Optional[Exception] = None) -> ET.ElementTree:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	511 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	512 Reads the contents of a .svg file, which needs to exist at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	513
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	514 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	515 path : the path to the .svg file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	516
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	517 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	518 DataErr : if the map is malformed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	519
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	520 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	521 Any : the data inside a svg file, could be anything.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	522 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	523 try: return ET.parse(path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	524 except (ET.XMLSyntaxError, ET.XMLSchemaParseError) as err:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	525 raise customErr if customErr else err
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	526
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	527 def writeSvg(path :FilePath, data:ET.ElementTree) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	528 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	529 Saves svg data opened with lxml.etree in a .svg file, created at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	530
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	531 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	532 path : the path to the .svg file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	533 data : the data to be written to the file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	534
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	535 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	536 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	537 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	538 with open(path.show(), "wb") as fd: fd.write(ET.tostring(data))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	539
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	540 # UI ARGUMENTS
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	541 class Bool:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	542 def __init__(self, argName :str) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	543 self.argName = argName
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	544
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	545 def __call__(self, s :str) -> bool: return self.check(s)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	546
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	547 def check(self, s :str) -> bool:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	548 s = s.lower()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	549 if s == "true" : return True
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	550 if s == "false": return False
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	551 raise ArgsErr(self.argName, "boolean string (true or false, not case sensitive)", f"\"{s}\"")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	552
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	553 class Float:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	554 def __init__(self, argName = "Dataset values, not an argument") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	555 self.argName = argName
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	556
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	557 def __call__(self, s :str) -> float: return self.check(s)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	558
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	559 def check(self, s :str) -> float:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	560 try: return float(s)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	561 except ValueError:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	562 s = s.lower()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	563 if s == "nan" or s == "none": return math.nan
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	564 raise ArgsErr(self.argName, "numeric string or \"None\" or \"NaN\" (not case sensitive)", f"\"{s}\"")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	565
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	566 # MODELS
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	567 OldRule = List[Union[str, "OldRule"]]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	568 class Model(Enum):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	569 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	570 Represents a metabolic model, either custom or locally supported. Custom models don't point
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	571 to valid file paths.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	572 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	573
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	574 Recon = "Recon"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	575 ENGRO2 = "ENGRO2"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	576 ENGRO2_no_legend = "ENGRO2_no_legend"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	577 HMRcore = "HMRcore"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	578 HMRcore_no_legend = "HMRcore_no_legend"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	579 Custom = "Custom" # Exists as a valid variant in the UI, but doesn't point to valid file paths.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	580
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	581 def __raiseMissingPathErr(self, path :Optional[FilePath]) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	582 if not path: raise PathErr("<<MISSING>>", "it's necessary to provide a custom path when retrieving files from a custom model")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	583
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	584 def getRules(self, toolDir :str, customPath :Optional[FilePath] = None) -> Dict[str, Dict[str, OldRule]]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	585 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	586 Open "rules" file for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	587
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	588 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	589 Dict[str, Dict[str, OldRule]] : the rules for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	590 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	591 path = customPath if self is Model.Custom else FilePath(f"{self.name}_rules", FileFormat.PICKLE, prefix = f"{toolDir}/local/pickle files/")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	592 self.__raiseMissingPathErr(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	593 return readPickle(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	594
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	595 def getTranslator(self, toolDir :str, customPath :Optional[FilePath] = None) -> Dict[str, Dict[str, str]]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	596 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	597 Open "gene translator (old: gene_in_rule)" file for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	598
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	599 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	600 Dict[str, Dict[str, str]] : the translator dict for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	601 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	602 path = customPath if self is Model.Custom else FilePath(f"{self.name}_genes", FileFormat.PICKLE, prefix = f"{toolDir}/local/pickle files/")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	603 self.__raiseMissingPathErr(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	604 return readPickle(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	605
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	606 def getMap(self, toolDir = ".", customPath :Optional[FilePath] = None) -> ET.ElementTree:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	607 path = customPath if self is Model.Custom else FilePath(f"{self.name}_map", FileFormat.SVG, prefix = f"{toolDir}/local/svg metabolic maps/")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	608 self.__raiseMissingPathErr(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	609 return readSvg(path, customErr = DataErr(path, f"custom map in wrong format"))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	610
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	611 def getCOBRAmodel(self, toolDir = ".", customPath :Optional[FilePath] = None, customExtension :Optional[FilePath]=None)->cobra.Model:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	612 if(self is Model.Custom):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	613 return self.load_custom_model(customPath, customExtension)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	614 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	615 return cobra.io.read_sbml_model(FilePath(f"{self.name}", FileFormat.XML, prefix = f"{toolDir}/local/models/").show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	616
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	617 def load_custom_model(self, file_path :FilePath, ext :Optional[FileFormat] = None) -> cobra.Model:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	618 ext = ext if ext else file_path.ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	619 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	620 if str(ext) in FileFormat.XML.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	621 return cobra.io.read_sbml_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	622
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	623 if str(ext) in FileFormat.JSON.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	624 # Compressed files are not automatically handled by cobra
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	625 if(ext == "json"):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	626 return cobra.io.load_json_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	627 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	628 return self.extract_model(file_path, ext, "json")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	629
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	630 if str(ext) in FileFormat.MAT.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	631 # Compressed files are not automatically handled by cobra
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	632 if(ext == "mat"):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	633 return cobra.io.load_matlab_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	634 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	635 return self.extract_model(file_path, ext, "mat")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	636
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	637 if str(ext) in FileFormat.YML.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	638 # Compressed files are not automatically handled by cobra
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	639 if(ext == "yml"):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	640 return cobra.io.load_yaml_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	641 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	642 return self.extract_model(file_path, ext, "yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	643
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	644 except Exception as e: raise DataErr(file_path, e.__str__())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	645 raise DataErr(file_path,
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	646 f"Fomat \"{file_path.ext}\" is not recognized, only JSON, XML, MAT and YAML (.yml) files are supported.")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	647
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	648
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	649 def extract_model(self, file_path:FilePath, ext :FileFormat, model_encoding:Literal["json", "mat", "yml"]) -> cobra.Model:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	650 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	651 Extract JSON, MAT and YAML COBRA model from a compressed file (zip, gz, bz2).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	652
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	653 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	654 file_path: File path of the model
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	655 ext: File extensions of class FileFormat (should be .zip, .gz or .bz2)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	656
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	657 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	658 cobra.Model: COBRApy model
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	659
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	660 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	661 Exception: Extraction errors
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	662 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	663 ext_str = str(ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	664
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	665 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	666 if '.zip' in ext_str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	667 with zipfile.ZipFile(file_path.show(), 'r') as zip_ref:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	668 with zip_ref.open(zip_ref.namelist()[0]) as json_file:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	669 content = json_file.read().decode('utf-8')
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	670 if model_encoding == "json":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	671 return cobra.io.load_json_model(StringIO(content))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	672 elif model_encoding == "mat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	673 return cobra.io.load_matlab_model(StringIO(content))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	674 elif model_encoding == "yml":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	675 return cobra.io.load_yaml_model(StringIO(content))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	676 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	677 raise ValueError(f"Unsupported model encoding: {model_encoding}. Supported: json, mat, yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	678 elif '.gz' in ext_str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	679 with gzip.open(file_path.show(), 'rt', encoding='utf-8') as gz_ref:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	680 if model_encoding == "json":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	681 return cobra.io.load_json_model(gz_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	682 elif model_encoding == "mat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	683 return cobra.io.load_matlab_model(gz_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	684 elif model_encoding == "yml":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	685 return cobra.io.load_yaml_model(gz_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	686 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	687 raise ValueError(f"Unsupported model encoding: {model_encoding}. Supported: json, mat, yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	688 elif '.bz2' in ext_str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	689 with bz2.open(file_path.show(), 'rt', encoding='utf-8') as bz2_ref:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	690 if model_encoding == "json":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	691 return cobra.io.load_json_model(bz2_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	692 elif model_encoding == "mat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	693 return cobra.io.load_matlab_model(bz2_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	694 elif model_encoding == "yml":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	695 return cobra.io.load_yaml_model(bz2_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	696 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	697 raise ValueError(f"Unsupported model encoding: {model_encoding}. Supported: json, mat, yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	698 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	699 raise ValueError(f"Compression format not supported: {ext_str}. Supported: .zip, .gz and .bz2")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	700
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	701 except Exception as e:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	702 raise Exception(f"Error during model extraction: {str(e)}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	703
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	704
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	705
394 a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	706 def __str__(self) -> str: return self.value
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	707
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	708
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	709 def convert_genes(model,annotation):
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	710 from cobra.manipulation import rename_genes
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	711 model2=model.copy()
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	712 try:
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	713 dict_genes={gene.id:gene.notes[annotation] for gene in model2.genes}
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	714 except:
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	715 print("No annotation in gene dict!")
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	716 return -1
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	717 rename_genes(model2,dict_genes)
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	718
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	719 return model2
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	720
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	721
409 71850bdf9e1e Uploaded francesco_lapi parents: 408 diff changeset	722 def build_cobra_model_from_csv(csv_path: str, model_id: str = "new_model") -> cobra.Model:
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	723 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	724 Costruisce un modello COBRApy a partire da un file CSV con i dati delle reazioni.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	725
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	726 Args:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	727 csv_path: Path al file CSV (separato da tab)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	728 model_id: ID del modello da creare
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	729
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	730 Returns:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	731 cobra.Model: Il modello COBRApy costruito
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	732 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	733
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	734 # Leggi i dati dal CSV
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	735 df = pd.read_csv(csv_path, sep='\t')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	736
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	737 # Crea il modello vuoto
409 71850bdf9e1e Uploaded francesco_lapi parents: 408 diff changeset	738 model = cobraModel(model_id)
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	739
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	740 # Dict per tenere traccia di metaboliti e compartimenti
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	741 metabolites_dict = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	742 compartments_dict = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	743
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	744 print(f"Costruendo modello da {len(df)} reazioni...")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	745
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	746 # Prima passata: estrai metaboliti e compartimenti dalle formule delle reazioni
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	747 for idx, row in df.iterrows():
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	748 reaction_formula = str(row['Reaction']).strip()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	749 if not reaction_formula or reaction_formula == 'nan':
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	750 continue
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	751
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	752 # Estrai metaboliti dalla formula della reazione
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	753 metabolites = extract_metabolites_from_reaction(reaction_formula)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	754
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	755 for met_id in metabolites:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	756 compartment = extract_compartment_from_metabolite(met_id)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	757
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	758 # Aggiungi compartimento se non esiste
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	759 if compartment not in compartments_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	760 compartments_dict[compartment] = compartment
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	761
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	762 # Aggiungi metabolita se non esiste
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	763 if met_id not in metabolites_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	764 metabolites_dict[met_id] = Metabolite(
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	765 id=met_id,
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	766 compartment=compartment,
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	767 name=met_id.replace(f"_{compartment}", "").replace("__", "_")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	768 )
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	769
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	770 # Aggiungi compartimenti al modello
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	771 model.compartments = compartments_dict
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	772
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	773 # Aggiungi metaboliti al modello
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	774 model.add_metabolites(list(metabolites_dict.values()))
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	775
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	776 print(f"Aggiunti {len(metabolites_dict)} metaboliti e {len(compartments_dict)} compartimenti")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	777
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	778 # Seconda passata: aggiungi le reazioni
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	779 reactions_added = 0
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	780 reactions_skipped = 0
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	781
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	782 for idx, row in df.iterrows():
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	783 try:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	784 reaction_id = str(row['ReactionID']).strip()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	785 reaction_formula = str(row['Reaction']).strip()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	786
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	787 # Salta reazioni senza formula
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	788 if not reaction_formula or reaction_formula == 'nan':
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	789 reactions_skipped += 1
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	790 continue
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	791
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	792 # Crea la reazione
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	793 reaction = Reaction(reaction_id)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	794 reaction.name = reaction_id
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	795
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	796 # Imposta bounds
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	797 reaction.lower_bound = float(row['lower_bound']) if pd.notna(row['lower_bound']) else -1000.0
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	798 reaction.upper_bound = float(row['upper_bound']) if pd.notna(row['upper_bound']) else 1000.0
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	799
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	800 # Aggiungi gene rule se presente
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	801 if pd.notna(row['Rule']) and str(row['Rule']).strip():
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	802 reaction.gene_reaction_rule = str(row['Rule']).strip()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	803
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	804 # Parse della formula della reazione
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	805 try:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	806 parse_reaction_formula(reaction, reaction_formula, metabolites_dict)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	807 except Exception as e:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	808 print(f"Errore nel parsing della reazione {reaction_id}: {e}")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	809 reactions_skipped += 1
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	810 continue
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	811
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	812 # Aggiungi la reazione al modello
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	813 model.add_reactions([reaction])
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	814 reactions_added += 1
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	815
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	816 except Exception as e:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	817 print(f"Errore nell'aggiungere la reazione {reaction_id}: {e}")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	818 reactions_skipped += 1
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	819 continue
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	820
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	821 print(f"Aggiunte {reactions_added} reazioni, saltate {reactions_skipped} reazioni")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	822
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	823 # Imposta l'obiettivo di biomassa
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	824 set_biomass_objective(model)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	825
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	826 # Imposta il medium
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	827 set_medium_from_data(model, df)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	828
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	829 print(f"Modello completato: {len(model.reactions)} reazioni, {len(model.metabolites)} metaboliti")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	830
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	831 return model
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	832
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	833
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	834 # Estrae tutti gli ID metaboliti nella formula (gestisce prefissi numerici + underscore)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	835 def extract_metabolites_from_reaction(reaction_formula: str) -> Set[str]:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	836 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	837 Estrae gli ID dei metaboliti da una formula di reazione.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	838 Pattern robusto: cattura token che terminano con _<compartimento> (es. _c, _m, _e)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	839 e permette che comincino con cifre o underscore.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	840 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	841 metabolites = set()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	842 # coefficiente opzionale seguito da un token che termina con _<letters>
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	843 pattern = r'(?:\d+(?:\.\d+)?\s+)?([A-Za-z0-9_]+_[a-z]+)'
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	844 matches = re.findall(pattern, reaction_formula)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	845 metabolites.update(matches)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	846 return metabolites
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	847
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	848
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	849 def extract_compartment_from_metabolite(metabolite_id: str) -> str:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	850 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	851 Estrae il compartimento dall'ID del metabolita.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	852 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	853 # Il compartimento è solitamente l'ultima lettera dopo l'underscore
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	854 if '_' in metabolite_id:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	855 return metabolite_id.split('_')[-1]
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	856 return 'c' # default cytoplasm
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	857
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	858
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	859 def parse_reaction_formula(reaction: Reaction, formula: str, metabolites_dict: Dict[str, Metabolite]):
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	860 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	861 Parsa una formula di reazione e imposta i metaboliti con i loro coefficienti.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	862 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	863
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	864 if reaction.id == 'EX_thbpt_e':
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	865 print(reaction.id)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	866 print(formula)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	867 # Dividi in parte sinistra e destra
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	868 if '<=>' in formula:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	869 left, right = formula.split('<=>')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	870 reversible = True
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	871 elif '<--' in formula:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	872 left, right = formula.split('<--')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	873 reversible = False
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	874 left, right = left, right
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	875 elif '-->' in formula:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	876 left, right = formula.split('-->')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	877 reversible = False
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	878 elif '<-' in formula:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	879 left, right = formula.split('<-')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	880 reversible = False
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	881 left, right = left, right
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	882 else:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	883 raise ValueError(f"Formato reazione non riconosciuto: {formula}")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	884
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	885 # Parse dei metaboliti e coefficienti
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	886 reactants = parse_metabolites_side(left.strip())
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	887 products = parse_metabolites_side(right.strip())
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	888
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	889 # Aggiungi metaboliti alla reazione
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	890 metabolites_to_add = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	891
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	892 # Reagenti (coefficienti negativi)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	893 for met_id, coeff in reactants.items():
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	894 if met_id in metabolites_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	895 metabolites_to_add[metabolites_dict[met_id]] = -coeff
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	896
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	897 # Prodotti (coefficienti positivi)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	898 for met_id, coeff in products.items():
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	899 if met_id in metabolites_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	900 metabolites_to_add[metabolites_dict[met_id]] = coeff
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	901
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	902 reaction.add_metabolites(metabolites_to_add)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	903
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	904
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	905 def parse_metabolites_side(side_str: str) -> Dict[str, float]:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	906 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	907 Parsa un lato della reazione per estrarre metaboliti e coefficienti.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	908 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	909 metabolites = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	910 if not side_str or side_str.strip() == '':
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	911 return metabolites
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	912
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	913 terms = side_str.split('+')
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	914 for term in terms:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	915 term = term.strip()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	916 if not term:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	917 continue
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	918
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	919 # pattern allineato: coefficiente opzionale + id che termina con _<compartimento>
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	920 match = re.match(r'(?:(\d+\.?\d*)\s+)?([A-Za-z0-9_]+_[a-z]+)', term)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	921 if match:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	922 coeff_str, met_id = match.groups()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	923 coeff = float(coeff_str) if coeff_str else 1.0
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	924 metabolites[met_id] = coeff
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	925
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	926 return metabolites
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	927
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	928
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	929
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	930 def set_biomass_objective(model: Model):
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	931 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	932 Imposta la reazione di biomassa come obiettivo.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	933 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	934 biomass_reactions = [r for r in model.reactions if 'biomass' in r.id.lower()]
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	935
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	936 if biomass_reactions:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	937 model.objective = biomass_reactions[0].id
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	938 print(f"Obiettivo impostato su: {biomass_reactions[0].id}")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	939 else:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	940 print("Nessuna reazione di biomassa trovata")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	941
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	942
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	943 def set_medium_from_data(model: Model, df: pd.DataFrame):
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	944 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	945 Imposta il medium basato sulla colonna InMedium.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	946 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	947 medium_reactions = df[df['InMedium'] == True]['ReactionID'].tolist()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	948
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	949 medium_dict = {}
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	950 for rxn_id in medium_reactions:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	951 if rxn_id in [r.id for r in model.reactions]:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	952 reaction = model.reactions.get_by_id(rxn_id)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	953 if reaction.lower_bound < 0: # Solo reazioni di uptake
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	954 medium_dict[rxn_id] = abs(reaction.lower_bound)
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	955
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	956 if medium_dict:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	957 model.medium = medium_dict
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	958 print(f"Medium impostato con {len(medium_dict)} componenti")
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	959
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	960
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	961 def validate_model(model: Model) -> Dict[str, any]:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	962 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	963 Valida il modello e fornisce statistiche di base.
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	964 """
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	965 validation = {
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	966 'num_reactions': len(model.reactions),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	967 'num_metabolites': len(model.metabolites),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	968 'num_genes': len(model.genes),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	969 'num_compartments': len(model.compartments),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	970 'objective': str(model.objective),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	971 'medium_size': len(model.medium),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	972 'reversible_reactions': len([r for r in model.reactions if r.reversibility]),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	973 'exchange_reactions': len([r for r in model.reactions if r.id.startswith('EX_')]),
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	974 }
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	975
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	976 try:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	977 # Test di crescita
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	978 solution = model.optimize()
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	979 validation['growth_rate'] = solution.objective_value
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	980 validation['status'] = solution.status
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	981 except Exception as e:
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	982 validation['growth_rate'] = None
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	983 validation['status'] = f"Error: {e}"
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	984
f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	985 return validation
411 6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	986
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	987
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	988 ################################- DATA GENERATION -################################
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	989 ReactionId = str
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	990 def generate_rules(model: cobra.Model, *, asParsed = True) -> Union[Dict[ReactionId, rulesUtils.OpList], Dict[ReactionId, str]]:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	991 """
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	992 Generates a dictionary mapping reaction ids to rules from the model.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	993
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	994 Args:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	995 model : the model to derive data from.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	996 asParsed : if True parses the rules to an optimized runtime format, otherwise leaves them as strings.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	997
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	998 Returns:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	999 Dict[ReactionId, rulesUtils.OpList] : the generated dictionary of parsed rules.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1000 Dict[ReactionId, str] : the generated dictionary of raw rules.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1001 """
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1002 # Is the below approach convoluted? yes
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1003 # Ok but is it inefficient? probably
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1004 # Ok but at least I don't have to repeat the check at every rule (I'm clinically insane)
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1005 _ruleGetter = lambda reaction : reaction.gene_reaction_rule
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1006 ruleExtractor = (lambda reaction :
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1007 rulesUtils.parseRuleToNestedList(_ruleGetter(reaction))) if asParsed else _ruleGetter
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1008
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1009 return {
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1010 reaction.id : ruleExtractor(reaction)
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1011 for reaction in model.reactions
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1012 if reaction.gene_reaction_rule }
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1013
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1014 def generate_reactions(model :cobra.Model, *, asParsed = True) -> Dict[ReactionId, str]:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1015 """
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1016 Generates a dictionary mapping reaction ids to reaction formulas from the model.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1017
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1018 Args:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1019 model : the model to derive data from.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1020 asParsed : if True parses the reactions to an optimized runtime format, otherwise leaves them as they are.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1021
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1022 Returns:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1023 Dict[ReactionId, str] : the generated dictionary.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1024 """
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1025
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1026 unparsedReactions = {
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1027 reaction.id : reaction.reaction
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1028 for reaction in model.reactions
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1029 if reaction.reaction
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1030 }
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1031
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1032 if not asParsed: return unparsedReactions
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1033
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1034 return reactionUtils.create_reaction_dict(unparsedReactions)
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1035
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1036 def get_medium(model:cobra.Model) -> pd.DataFrame:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1037 trueMedium=[]
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1038 for r in model.reactions:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1039 positiveCoeff=0
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1040 for m in r.metabolites:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1041 if r.get_coefficient(m.id)>0:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1042 positiveCoeff=1;
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1043 if (positiveCoeff==0 and r.lower_bound<0):
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1044 trueMedium.append(r.id)
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1045
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1046 df_medium = pd.DataFrame()
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1047 df_medium["reaction"] = trueMedium
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1048 return df_medium
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1049
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1050 def generate_bounds(model:cobra.Model) -> pd.DataFrame:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1051
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1052 rxns = []
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1053 for reaction in model.reactions:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1054 rxns.append(reaction.id)
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1055
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1056 bounds = pd.DataFrame(columns = ["lower_bound", "upper_bound"], index=rxns)
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1057
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1058 for reaction in model.reactions:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1059 bounds.loc[reaction.id] = [reaction.lower_bound, reaction.upper_bound]
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1060 return bounds
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1061
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1062
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1063
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1064 def generate_compartments(model: cobra.Model) -> pd.DataFrame:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1065 """
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1066 Generates a DataFrame containing compartment information for each reaction.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1067 Creates columns for each compartment position (Compartment_1, Compartment_2, etc.)
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1068
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1069 Args:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1070 model: the COBRA model to extract compartment data from.
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1071
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1072 Returns:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1073 pd.DataFrame: DataFrame with ReactionID and compartment columns
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1074 """
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1075 pathway_data = []
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1076
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1077 # First pass: determine the maximum number of pathways any reaction has
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1078 max_pathways = 0
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1079 reaction_pathways = {}
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1080
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1081 for reaction in model.reactions:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1082 # Get unique pathways from all metabolites in the reaction
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1083 if type(reaction.annotation['pathways']) == list:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1084 reaction_pathways[reaction.id] = reaction.annotation['pathways']
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1085 max_pathways = max(max_pathways, len(reaction.annotation['pathways']))
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1086 else:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1087 reaction_pathways[reaction.id] = [reaction.annotation['pathways']]
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1088
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1089 # Create column names for pathways
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1090 pathway_columns = [f"Pathway_{i+1}" for i in range(max_pathways)]
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1091
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1092 # Second pass: create the data
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1093 for reaction_id, pathways in reaction_pathways.items():
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1094 row = {"ReactionID": reaction_id}
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1095
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1096 # Fill pathway columns
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1097 for i in range(max_pathways):
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1098 col_name = pathway_columns[i]
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1099 if i < len(pathways):
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1100 row[col_name] = pathways[i]
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1101 else:
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1102 row[col_name] = None # or "" if you prefer empty strings
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1103
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1104 pathway_data.append(row)
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1105
6b015d3184ab Uploaded francesco_lapi parents: 409 diff changeset	1106 return pd.DataFrame(pathway_data)

Mercurial > repos > bimib > cobraxy

annotate COBRAxy/utils/general_utils.py @ 411:6b015d3184ab draft