SAM Parser 2 (hw40)

SAM Parser 2

Lo scopo di questo progetto e’ creare uno script perl che parserizzi (legga e decodifichi) un file in formato SAM e che stampi delle semplici statistiche sugli allineamenti contenuti.

Specifica

Lo script deve prendere come parametro dalla shell il nome del file SAM da leggere. Deve dare errori informativi (che facciano capire quale e’ il problema) se il parametro manca, se il file non puo’ essere aperto, o se trovate qualcosa di strano mentre lo leggete. Questo puo’ succedere per esempio se l’utente usa erroneamente come input un file non SAM. Le statistiche da stampare sono le seguenti:

  • lunghezza media e massima delle sequenze trovate;
  • percentuale di allineamenti univoci (ovvero con qualità non nulla) sul totale;
  • qualità media degli allineamenti;
  • percentuale di reads con flag “0″ e la percentuale di reads con flag “16″.

Materiale

Qui trovate un file SAM per testare il programma. Naturalmente potete testarlo con tutti i file SAM che volete/potete, piu’ e’ testato piu’ siete sicuri che funzioni.

Tagged

Leave a Reply

Your email address will not be published.