SPUMONI 2: improved classification using a pangenome index of minimizer digests

Ahmed, Omar Y.; Rossi, Massimiliano; Gagie, Travis; Boucher, Christina; Langmead, Ben (ORCID:0000000324371976)

doi:10.1186/s13059-023-02958-1

Citation Details

SPUMONI 2: improved classification using a pangenome index of minimizer digests

Abstract Genomics analyses use large reference sequence collections, like pangenomes or taxonomic databases. SPUMONI 2 is an efficient tool for sequence classification of both short and long reads. It performs multi-class classification using a novel sampled document array. By incorporating minimizers, SPUMONI 2’s index is 65 times smaller than minimap2’s for a mock community pangenome. SPUMONI 2 achieves a speed improvement of 3-fold compared to SPUMONI and 15-fold compared to minimap2. We show SPUMONI 2 achieves an advantageous mix of accuracy and efficiency in practical scenarios such as adaptive sampling, contamination detection and multi-class metagenomics classification. more »

Award ID(s):: 2029552 2013998

PAR ID:: 10414403

Author(s) / Creator(s):: Ahmed, Omar Y.; Rossi, Massimiliano; Gagie, Travis; Boucher, Christina; Langmead, Ben

Publisher / Repository:: Springer Science + Business Media

Date Published:: 2023-05-18

Journal Name:: Genome Biology

Volume:: 24

Issue:: 1

ISSN:: 1474-760X

Format(s):: Medium: X

Sponsoring Org:: National Science Foundation

Journal Article:
https://doi.org/10.1186/s13059-023-02958-1

More Like this