SAM Parser 1
Lo scopo di questo progetto e’ creare uno script perl che parserizzi (legga e decodifichi) un file in formato SAM e che stampi delle semplici statistiche sugli allineamenti contenuti.
Specifica
Lo script deve prendere come parametro dalla shell il nome del file SAM da leggere. Deve dare errori informativi (che facciano capire quale e’ il problema) se il parametro manca, se il file non puo’ essere aperto, o se trovate qualcosa di strano mentre lo leggete. Questo puo’ succedere per esempio se l’utente usa erroneamente come input un file non SAM. Le statistiche da stampare sono le seguenti:
- il numero di allinementi presenti,
- il numero di cromosomi presenti nel reference,
- il numero di allineamenti per cromosoma,
- il numero di allineamenti per cromosoma diviso per la lunghezza del cromosoma.
Materiale
Qui trovate un file SAM per testare il programma. Naturalmente potete testarlo con tutti i file SAM che volete/potete, piu’ e’ testato piu’ siete sicuri che funzioni.
Domanda…dobbiamo trovare il sistema per cui SOLO un file formato SAM fornito attraverso la shell vanga aperto e letto ecc..oppure ho capito male? In pratica lo script viene eseguito solo su ciò che è un file SAM? Mentre se non lo è mi stampa una cosa del tipo “Ehi, qst nn è un file SAM!!!”???