rem_complex: rem_complex.py comparison

comparison rem_complex.py @ 3:567327a97ad2 draft

planemo upload for repository https://github.com/RECETOX/galaxytools/tree/master/tools/rem_complex commit 4b8a43b863ff8a0ff1d5a08e516068853adf358d

author	recetox
date	Tue, 16 Apr 2024 11:30:27 +0000
parents	a0e07a0bc047
children

comparison

equal deleted inserted replaced

-:1dc9f5a3163d
+:567327a97ad2
 def parse_arguments() -> argparse.Namespace:
 parser = argparse.ArgumentParser()
 parser.add_argument('-iformat', '--input_format', help='Input file format')
 parser.add_argument('-i', '--input_filename', type=str, required=True, help='Input file name')
-parser.add_argument('-o', '--output_filename', type=str, required=True, help='Outout file name')
+parser.add_argument('-o', '--output_filename', type=str, required=True, help='Output file name')
 args = parser.parse_args()
 return args
-def filter_csv_molecules(file_name: str, output_file_name: str) -> None:
+def filter_csv_tsv_molecules(file_name: str, output_file_name: str, sep: str) -> None:
-"""Removes molecules with '.' in SMILES string from csv file.
+"""Removes molecules with '.' in SMILES string from csv or tsv file.
 Args:
-file_name (str): Path to csv file that contains metadata.
+file_name (str): Path to csv or tsv file that contains metadata.
-output_file_name (str): Path to destination file, in csv format.
+output_file_name (str): Path to destination file, tsv format.
+sep (str): Separator used in the file (',' for csv, '\t' for tsv).
 """
-df = pd.read_csv(file_name)
+df = pd.read_csv(file_name, sep=sep)
 mask = df['smiles'].str.contains(".", na=False, regex=False)
 mask = mask.apply(lambda x: not x)
-df[mask].to_csv(output_file_name, index=False)
+df[mask].to_csv(output_file_name, index=False, sep='\t')
 def filter_other_format_molecules(file_name: str, output_file_name: str, input_format: str) -> None:
 """Removes molecules with '.' in SMILES string from smi or inchi files.
 def filter_complex_molecules(file_name: str, output_file_name: str, input_format: str) -> None:
 """Removes molecular complexes depending on the input format.
 Args:
-file_name (str): Path to csv, smi or inchi files
+file_name (str): Path to csv, tsv, smi, or inchi files.
-output_file_name (str): Path to destination files, in csv. smi or inchi formats.
+output_file_name (str): Path to destination files, in corresponding formats.
-input_format (str): Input file formats.
+input_format (str): Input file format.
 """
-if input_format == 'csv':
+if input_format in ['csv', 'tsv']:
-filter_csv_molecules(file_name, output_file_name)
+sep = ',' if input_format == 'csv' else '\t'
+filter_csv_tsv_molecules(file_name, output_file_name, sep)
 else:
 filter_other_format_molecules(file_name, output_file_name, input_format)
 if __name__ == "__main__":

Mercurial > repos > recetox > rem_complex

comparison rem_complex.py @ 3:567327a97ad2 draft