cobraxy: COBRAxy/utils/model_utils.py comparison

comparison COBRAxy/utils/model_utils.py @ 500:4e7e67693ce7 draft

Uploaded

author	francesco_lapi
date	Tue, 30 Sep 2025 16:39:30 +0000
parents	a2f7a6dd9d0b
children	9bfd1ec3ae6f

comparison

equal deleted inserted replaced

-:a2f7a6dd9d0b
+:4e7e67693ce7
 #        pattern = r'(?:\d+(?:\.\d+)?\s+)?([A-Za-z0-9_]+_[A-Za-z0-9]+)'
 #    matches = re.findall(pattern, reaction_formula)
 #    metabolites.update(matches)
 #    return metabolites
-import re
-from typing import Set
-# Estrae tutti gli ID metaboliti nella formula (gestisce prefissi numerici + underscore e [comp])
 def extract_metabolites_from_reaction(reaction_formula: str) -> Set[str]:
 """
-Estrae gli ID dei metaboliti da una formula di reazione.
+Extract metabolite IDs from a reaction formula.
-Gestisce:
-- coefficienti stechiometrici opzionali (interi o decimali)
+Handles:
-- compartimenti sia in forma [c] sia _c, sempre a fine metabolita
+- optional stoichiometric coefficients (integers or decimals)
-Restituisce gli ID includendo il suffisso di compartimento così come appare.
+- compartment tags at the end of the metabolite, either [c] or _c
+Returns the IDs including the compartment suffix exactly as written.
 """
 pattern = re.compile(
-r'(?:^|(?<=\s)|(?<=\+)|(?<=,)|(?<==)|(?<=:))'              # confine a sinistra
+r'(?:^|(?<=\s)|(?<=\+)|(?<=,)|(?<==)|(?<=:))'              # left boundary (start, space, +, comma, =, :)
-r'(?:\d+(?:\.\d+)?\s*)?'                                   # coefficiente opzionale
+r'(?:\d+(?:\.\d+)?\s*)?'                                   # optional coefficient
-r'([A-Za-z0-9_]+(?:\[[A-Za-z0-9]+\]|_[A-Za-z0-9]+))'       # metabolita + compartimento
+r'([A-Za-z0-9_]+(?:\[[A-Za-z0-9]+\]|_[A-Za-z0-9]+))'       # metabolite + compartment
 )
 return {m.group(1) for m in pattern.finditer(reaction_formula)}
 def extract_compartment_from_metabolite(metabolite_id: str) -> str:
 """Extract the compartment from a metabolite ID."""
-if '_' in metabolite_id:
+if '_' == metabolite_id[-2]:
 return metabolite_id.split('_')[-1]
 if metabolite_id[-1] == ']' and metabolite_id[-3] == '[':
 return metabolite_id[-2]
 return 'c'  # default cytoplasm

Mercurial > repos > bimib > cobraxy

comparison COBRAxy/utils/model_utils.py @ 500:4e7e67693ce7 draft