Workflow#

Overview#

Software dependencies#

NextFlow 25.10.4 (>= 22.10)
Java 17 (>= 17, <= 25)

Experimental spectra in proprietary formats need to be converted to .mzML or .mzXML with tools like ProteoWizard msconvert 3.0.21354.

Software components#

Following software packages are used internally

Biopython SeqIO – for reading and writing of .fasta files.
OpenMS 3.4.1
- DecoyDatabase – adds decoys to peptide sequence file database.
- TargetedFileConverter – performs bi-directional conversion between .traML and .tsv.
- OpenSwathDecoyGenerator – adds decoy transitions to the spectral library
ProteoWizard msconvert 3.0.22088 – performs conversion between .mgf, .mzML and .mzXML.
Trans-Proteomic Pipeline (TPP) 6.1.9
- Comet 2022.01.0
- X! Tandem 2017.02.01.4
- InteractParser – combines multiple files produced by Comet and X! Tandem
- InterProphetParser – combines results from Comet and X! Tandem
- SpectraST
- Comet and X! Tandem predict spectra from a database of peptide sequences and try to match experimental MS/MS spectra to them. Search results (PSMs) from both tools are combined and passed to SpectraST that performs search on experimental spectra database again, validating the search results and building a spectral database.
DIA-Umpire SE 2.2.8 – performs deconvolution of raw spectra into pseudospectra.
Mayu – determines protein and peptide identification false discovery rates.
specrast2tsv.py from msproteomicstools/msproteomicstools – converts spectral library into .tsv accepted by OpenSWATH Workflow
OpenSWATH Workflow
SWATH2stats 1.31.0 – transforms extracted SWATH/DIA data into a format directly-usable by statistics packages.
PyProphet 2.2.5 and 0.24.1 – performs statistical validation of the results, version selected based on pyprophet_use_legacy switch.
Python 3.9.9
Java OpenJDK 11.0.15