News

Das aktuelle "Paper of the Month" (06/2018) geht an: Dr. Sarah Sandmann aus dem Institut für Medizinische Informatik

Dr. Sarah Sandmann, Erstautorin des prämierten Papers of the Month (Foto: Julian Varghese)

Für den Monat Juni 2018 geht das "Paper of the Month" der Medizinischen Fakultät der WWU Münster an:

Dr. Sarah Sandmann aus dem Institut für Medizinische Informatik für die Publikation:

appreci8: A Pipeline for Precise Variant Calling Integrating 8 Tools
BY: Sandmann S.; Karimi M.; de Graaf A. O.; et al.
Bioinformatics   Published online: 2018 June 26

Zu Hintergrund, Fragestellung und Bedeutung der Publikation:

Für die Anwendung von Next-Generation-Sequencing in der Forschung und speziell in der klinischen Routine sind valide Ergebnisse unersetzlich. Die Evaluation von verschiedenen Programmen, die regelmäßig zur Detektion von Mutationen verwendet werden, zeigte jedoch, dass kein einziges Tool diesen Anforderungen gerecht wird. Falsch positive wie auch falsch negative Ergebnisse machen zusätzliche Experimente und erhebliche manuelle Arbeit notwendig.

Wir haben appreci8 entwickelt - eine automatische Pipeline zur Detektion von Einzelnukleotid-Varianten und kurzen Indels durch Kombinieren und Filtern des Outputs von acht open-source Varianten Calling Tools, basierend auf einem neuartigen Artefakt- und Polymorphismus Score. Statt eine Blackbox zu sein, reproduziert unser Algorithmus auf verständliche Art die manuelle Arbeit eines Biologen bei der Durchsicht einer rohen Mutationsliste. Die Analyse von 678 Proben zeigt in allen Fällen eine überlegene Performanz von appreci8 im Vergleich zu den besten individuellen Tools wie auch zu alternativen kombinierten Ansätzen. Unterschiedliche Sequenzierer (NextSeq, HiSeq, MiSeq, HiScanSQ, Ion Torrent, Roche 454), Zielregionen (42-958kbp) und Entitäten (MDS, AML, Adenokarzinom) wurden ausgewertet.

Appreci8 zeigte eine überlegene Performance im Vergleich zu jedem anderen evaluierten Ansatz, unter Berücksichtigung einer Vielzahl von Szenarien. Neben dem Filtern von Artefakten ist appreci8 auch in der Lage, Polymorphismen automatisch zu identifizieren. Die Anwendung ist sowohl über Docker als auch über R (inkl. Benutzeroberfläche) möglich.

Background and fundamental question of the publication:

The application of next-generation sequencing in research and particularly in clinical routine requires valid variant calling results. However, evaluation of several commonly used tools has pointed out that not a single tool meets this requirement. False positive as well as false negative calls necessitate additional experiments and extensive manual work.

We developed appreci8, an automatic variant calling pipeline for calling single nucleotide variants and short indels by combining and filtering the output of eight open-source variant calling tools, based on a novel artifact- and polymorphism score. Instead of being a black box, our algorithm comprehensibly reproduces a biologist’s manual work when investigating a raw list of calls. Analysis of 678 samples from patients with hematological malignancies shows that appreci8's performance is in all cases superior to the best individual tool as well as to alternative combined approaches. Variation with respect to sequencing platform (NextSeq, HiSeq, Miseq, HiScanSQ, Ion Torrent, Roche 454), target region (42-958kbp) and disease entity (MDS, AML, adenocarcinoma) was considered.

Appreci8 showed superior performance compared to any evaluated alternative approach in a wide set of investigated scenarios. In addition to filtering artifacts, our algorithm is additionally able to automatically identify polymorphisms. Application is possible via Docker as well as via R, including a user interface.

Die bisherigen ausgezeichneten "Papers of the Month" finden Sie HIER.

Folgendes könnte Sie auch interessieren: