cpt_phageqc_annotations: cpt_phageqc_annotation/phageqc_report

annotate cpt_phageqc_annotation/phageqc_report_genomea.tex @ 0:c3140b08d703 draft default tip

Uploaded

author	cpt
date	Fri, 17 Jun 2022 13:00:50 +0000
parents
children

rev	line source
0 c3140b08d703 Uploaded cpt parents: diff changeset	1 \documentclass[]{article}
c3140b08d703 Uploaded cpt parents: diff changeset	2 \usepackage{lmodern}
c3140b08d703 Uploaded cpt parents: diff changeset	3 \usepackage{amssymb,amsmath}
c3140b08d703 Uploaded cpt parents: diff changeset	4 \usepackage{ifxetex,ifluatex}
c3140b08d703 Uploaded cpt parents: diff changeset	5 \usepackage{fixltx2e} % provides \textsubscript
c3140b08d703 Uploaded cpt parents: diff changeset	6 \usepackage[T1]{fontenc}
c3140b08d703 Uploaded cpt parents: diff changeset	7 \usepackage[utf8]{inputenc}
c3140b08d703 Uploaded cpt parents: diff changeset	8
c3140b08d703 Uploaded cpt parents: diff changeset	9 \addtolength{\oddsidemargin}{-.875in}
c3140b08d703 Uploaded cpt parents: diff changeset	10 \addtolength{\evensidemargin}{-.875in}
c3140b08d703 Uploaded cpt parents: diff changeset	11 \addtolength{\textwidth}{1.75in}
c3140b08d703 Uploaded cpt parents: diff changeset	12
c3140b08d703 Uploaded cpt parents: diff changeset	13 \addtolength{\topmargin}{-.875in}
c3140b08d703 Uploaded cpt parents: diff changeset	14 \addtolength{\textheight}{1.75in}
c3140b08d703 Uploaded cpt parents: diff changeset	15
c3140b08d703 Uploaded cpt parents: diff changeset	16 \usepackage{fancyhdr}
c3140b08d703 Uploaded cpt parents: diff changeset	17 \pagestyle{fancy}
c3140b08d703 Uploaded cpt parents: diff changeset	18 \lhead{GenomeA Compliance Report}
c3140b08d703 Uploaded cpt parents: diff changeset	19 \chead{}
c3140b08d703 Uploaded cpt parents: diff changeset	20 \rhead{ {{record_name \| texify}} }
c3140b08d703 Uploaded cpt parents: diff changeset	21 \lfoot{}
c3140b08d703 Uploaded cpt parents: diff changeset	22 \cfoot{\thepage}
c3140b08d703 Uploaded cpt parents: diff changeset	23 \rfoot{}
c3140b08d703 Uploaded cpt parents: diff changeset	24
c3140b08d703 Uploaded cpt parents: diff changeset	25
c3140b08d703 Uploaded cpt parents: diff changeset	26
c3140b08d703 Uploaded cpt parents: diff changeset	27 \usepackage{microtype}
c3140b08d703 Uploaded cpt parents: diff changeset	28 \usepackage{hyperref}
c3140b08d703 Uploaded cpt parents: diff changeset	29 \hypersetup{unicode=true,
c3140b08d703 Uploaded cpt parents: diff changeset	30 pdfborder={0 0 0},
c3140b08d703 Uploaded cpt parents: diff changeset	31 breaklinks=true}
c3140b08d703 Uploaded cpt parents: diff changeset	32 \urlstyle{same} % don't use monospace font for urls
c3140b08d703 Uploaded cpt parents: diff changeset	33 \usepackage{longtable,booktabs}
c3140b08d703 Uploaded cpt parents: diff changeset	34 \date{Compiled \today}
c3140b08d703 Uploaded cpt parents: diff changeset	35 \title{GenomeA Compliance Report for {{record_nice_name \| texify}}}
c3140b08d703 Uploaded cpt parents: diff changeset	36
c3140b08d703 Uploaded cpt parents: diff changeset	37 \begin{document}
c3140b08d703 Uploaded cpt parents: diff changeset	38 %\pagestyle{plain}
c3140b08d703 Uploaded cpt parents: diff changeset	39 \maketitle
c3140b08d703 Uploaded cpt parents: diff changeset	40 This report details possible issues with your submitted genome annotations.
c3140b08d703 Uploaded cpt parents: diff changeset	41
c3140b08d703 Uploaded cpt parents: diff changeset	42 \section{Required Changes}
c3140b08d703 Uploaded cpt parents: diff changeset	43
c3140b08d703 Uploaded cpt parents: diff changeset	44 The changes detailed in this section are required for acceptance of your
c3140b08d703 Uploaded cpt parents: diff changeset	45 submission.
c3140b08d703 Uploaded cpt parents: diff changeset	46
c3140b08d703 Uploaded cpt parents: diff changeset	47 \subsection{Missing Gene Features}
c3140b08d703 Uploaded cpt parents: diff changeset	48
c3140b08d703 Uploaded cpt parents: diff changeset	49 These coding sequences (``CDS'' in your GenBank file) are missing the
c3140b08d703 Uploaded cpt parents: diff changeset	50 associated gene feature (``gene''). This is required for validation by NCBI's
c3140b08d703 Uploaded cpt parents: diff changeset	51 rules which are encoded in the sequin and tbl2asn programs.
c3140b08d703 Uploaded cpt parents: diff changeset	52 {%if missing_genes_bad > 0 %}
c3140b08d703 Uploaded cpt parents: diff changeset	53
c3140b08d703 Uploaded cpt parents: diff changeset	54 {{ missing_genes_bad }} out of {{ missing_genes_good + missing_genes_bad
c3140b08d703 Uploaded cpt parents: diff changeset	55 }} features are lacking their associated gene feature.
c3140b08d703 Uploaded cpt parents: diff changeset	56
c3140b08d703 Uploaded cpt parents: diff changeset	57 \begin{longtable}{ll}
c3140b08d703 Uploaded cpt parents: diff changeset	58 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	59 Feature ID & Location\\
c3140b08d703 Uploaded cpt parents: diff changeset	60 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	61 \endhead
c3140b08d703 Uploaded cpt parents: diff changeset	62 {% for row in missing_genes %}
c3140b08d703 Uploaded cpt parents: diff changeset	63 {{ row.id \| texify }} & \texttt{{'{'}}{{row.location}}{{'}'}}\tabularnewline
c3140b08d703 Uploaded cpt parents: diff changeset	64 {% endfor %}
c3140b08d703 Uploaded cpt parents: diff changeset	65 \end{longtable}
c3140b08d703 Uploaded cpt parents: diff changeset	66 {% else %}
c3140b08d703 Uploaded cpt parents: diff changeset	67 You are not missing any gene features
c3140b08d703 Uploaded cpt parents: diff changeset	68 {% endif %}
c3140b08d703 Uploaded cpt parents: diff changeset	69
c3140b08d703 Uploaded cpt parents: diff changeset	70 \subsection{Missing Product Tags}\label{missing-product-tags}
c3140b08d703 Uploaded cpt parents: diff changeset	71
c3140b08d703 Uploaded cpt parents: diff changeset	72 {{missing_tags_good}} out of {{missing_tags_good + missing_tags_bad}} features have product tags (\texttt{/product="..."}).
c3140b08d703 Uploaded cpt parents: diff changeset	73 {% if missing_tags_bad > 0 %}
c3140b08d703 Uploaded cpt parents: diff changeset	74 The following features are missing product tags
c3140b08d703 Uploaded cpt parents: diff changeset	75 \begin{longtable}{ll}
c3140b08d703 Uploaded cpt parents: diff changeset	76 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	77 Feature & Location\\
c3140b08d703 Uploaded cpt parents: diff changeset	78 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	79 \endhead
c3140b08d703 Uploaded cpt parents: diff changeset	80 {% for row in missing_tags %}
c3140b08d703 Uploaded cpt parents: diff changeset	81 {{ row.id \| texify }} & \texttt{{'{'}}{{row.location}}{{'}'}}\tabularnewline
c3140b08d703 Uploaded cpt parents: diff changeset	82 {% endfor %}
c3140b08d703 Uploaded cpt parents: diff changeset	83 \end{longtable}
c3140b08d703 Uploaded cpt parents: diff changeset	84 {% endif %}
c3140b08d703 Uploaded cpt parents: diff changeset	85
c3140b08d703 Uploaded cpt parents: diff changeset	86 \subsection{Missing Locus Tags}\label{missing-locus-tags}
c3140b08d703 Uploaded cpt parents: diff changeset	87
c3140b08d703 Uploaded cpt parents: diff changeset	88 {{gene_model_correction_good}} out of {{gene_model_correction_good + gene_model_correction_bad}} features have valid locus tags (\texttt{/locus\_tag="..."}).
c3140b08d703 Uploaded cpt parents: diff changeset	89 {% if gene_model_correction_bad > 0 %}
c3140b08d703 Uploaded cpt parents: diff changeset	90 The following features have issues with their locus tags
c3140b08d703 Uploaded cpt parents: diff changeset	91 \begin{longtable}{lllll}
c3140b08d703 Uploaded cpt parents: diff changeset	92 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	93 ID & Location & Gene Locus Tag & CDS Locus Tag & Issue \\
c3140b08d703 Uploaded cpt parents: diff changeset	94 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	95 \endhead
c3140b08d703 Uploaded cpt parents: diff changeset	96 {% for row in gene_model_correction %}
c3140b08d703 Uploaded cpt parents: diff changeset	97 {{ row[0].id \| texify }} & \texttt{{'{'}}{{row[1].location}}{{'}'}} & {{ row[0].qualifiers['locus_tag'][0] \| texify }} & {{ row[1].qualifiers['locus_tag'][0] \| texify }} & {{ row[2] \| texify }}\tabularnewline
c3140b08d703 Uploaded cpt parents: diff changeset	98 {% endfor %}
c3140b08d703 Uploaded cpt parents: diff changeset	99 \end{longtable}
c3140b08d703 Uploaded cpt parents: diff changeset	100 {% endif %}
c3140b08d703 Uploaded cpt parents: diff changeset	101
c3140b08d703 Uploaded cpt parents: diff changeset	102
c3140b08d703 Uploaded cpt parents: diff changeset	103 \section{Suggested Changes}\label{suggested-changes}
c3140b08d703 Uploaded cpt parents: diff changeset	104
c3140b08d703 Uploaded cpt parents: diff changeset	105 These changes are not required, but are strongly encouraged in order to
c3140b08d703 Uploaded cpt parents: diff changeset	106 provide a uniform genome annotation within the phage community.
c3140b08d703 Uploaded cpt parents: diff changeset	107
c3140b08d703 Uploaded cpt parents: diff changeset	108 \subsection{Start Codons}\label{start-codons}
c3140b08d703 Uploaded cpt parents: diff changeset	109 Nearly all phage genes use ATG, GTG or TTG as start codons. The start codon distribution is as
c3140b08d703 Uploaded cpt parents: diff changeset	110 follows:
c3140b08d703 Uploaded cpt parents: diff changeset	111
c3140b08d703 Uploaded cpt parents: diff changeset	112
c3140b08d703 Uploaded cpt parents: diff changeset	113 \begin{longtable}{lll}
c3140b08d703 Uploaded cpt parents: diff changeset	114 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	115 Start Codon & Count\\
c3140b08d703 Uploaded cpt parents: diff changeset	116 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	117 \endhead
c3140b08d703 Uploaded cpt parents: diff changeset	118 {% for codon_key in weird_starts_overall_sorted_keys %}
c3140b08d703 Uploaded cpt parents: diff changeset	119 {{ codon_key }} & {{ weird_starts_overall[codon_key] }} \\
c3140b08d703 Uploaded cpt parents: diff changeset	120 {% endfor %}
c3140b08d703 Uploaded cpt parents: diff changeset	121 \end{longtable}
c3140b08d703 Uploaded cpt parents: diff changeset	122
c3140b08d703 Uploaded cpt parents: diff changeset	123 {% if weird_starts_bad != 0 %}
c3140b08d703 Uploaded cpt parents: diff changeset	124 There are {{weird_starts_bad }} unusual start codons in the genome, these
c3140b08d703 Uploaded cpt parents: diff changeset	125 should be carefully justified. If there is evidence for these starts, the
c3140b08d703 Uploaded cpt parents: diff changeset	126 GenomeA text should note this.
c3140b08d703 Uploaded cpt parents: diff changeset	127
c3140b08d703 Uploaded cpt parents: diff changeset	128 \begin{longtable}{lll}
c3140b08d703 Uploaded cpt parents: diff changeset	129 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	130 Feature ID & Location & Start Codon\\
c3140b08d703 Uploaded cpt parents: diff changeset	131 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	132 \endhead
c3140b08d703 Uploaded cpt parents: diff changeset	133 {% for row in weird_starts %}
c3140b08d703 Uploaded cpt parents: diff changeset	134 {{ row.id \| texify }} & \texttt{{'{'}}{{row.location}}{{'}'}} & {{row.__start}} \\
c3140b08d703 Uploaded cpt parents: diff changeset	135 {% endfor %}
c3140b08d703 Uploaded cpt parents: diff changeset	136 \end{longtable}
c3140b08d703 Uploaded cpt parents: diff changeset	137
c3140b08d703 Uploaded cpt parents: diff changeset	138 {% endif %}
c3140b08d703 Uploaded cpt parents: diff changeset	139
c3140b08d703 Uploaded cpt parents: diff changeset	140 \subsection{Unannotated RBSs}\label{unannotated-rbss}
c3140b08d703 Uploaded cpt parents: diff changeset	141
c3140b08d703 Uploaded cpt parents: diff changeset	142 The following CDSs either do not have a detectable ribosome binding site (RBS;
c3140b08d703 Uploaded cpt parents: diff changeset	143 Shine-Dalgarno sequence), in which case there is a strong possibility that
c3140b08d703 Uploaded cpt parents: diff changeset	144 this is not the correct start, or there is one but it is not annotated.
c3140b08d703 Uploaded cpt parents: diff changeset	145 Annotating the RBS as part of the gene feature is the best practice.
c3140b08d703 Uploaded cpt parents: diff changeset	146
c3140b08d703 Uploaded cpt parents: diff changeset	147 \begin{longtable}{lllll}
c3140b08d703 Uploaded cpt parents: diff changeset	148 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	149 ID & Location & Error & Upstream (-{{upstream_max}} .. -{{upstream_min}})\\
c3140b08d703 Uploaded cpt parents: diff changeset	150 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	151 \endhead
c3140b08d703 Uploaded cpt parents: diff changeset	152 {% for row in missing_rbs %}
c3140b08d703 Uploaded cpt parents: diff changeset	153 {% if 'Unannotated' not in row.__message%}
c3140b08d703 Uploaded cpt parents: diff changeset	154 {{ row.id \| texify }} & \texttt{{'{'}}{{row.location}}{{'}'}} & {{row.__message \| texify}} & \texttt{{'{'}}{{row.__upstream}}{{'}'}} \\
c3140b08d703 Uploaded cpt parents: diff changeset	155 {% endif %}
c3140b08d703 Uploaded cpt parents: diff changeset	156 {% endfor %}
c3140b08d703 Uploaded cpt parents: diff changeset	157 {% for row in missing_rbs %}
c3140b08d703 Uploaded cpt parents: diff changeset	158 {% if 'Unannotated' in row.__message%}
c3140b08d703 Uploaded cpt parents: diff changeset	159 {{ row.id \| texify }} & \texttt{{'{'}}{{row.location}}{{'}'}} & {{row.__message \| texify}} & \texttt{{'{'}}{{row.__upstream}}{{'}'}} \\
c3140b08d703 Uploaded cpt parents: diff changeset	160 {% endif %}
c3140b08d703 Uploaded cpt parents: diff changeset	161 {% endfor %}
c3140b08d703 Uploaded cpt parents: diff changeset	162 \end{longtable}
c3140b08d703 Uploaded cpt parents: diff changeset	163
c3140b08d703 Uploaded cpt parents: diff changeset	164 \section{Areas for Further Examination}\label{notes}
c3140b08d703 Uploaded cpt parents: diff changeset	165
c3140b08d703 Uploaded cpt parents: diff changeset	166 These areas may be indicative of a problem, or may simply be
c3140b08d703 Uploaded cpt parents: diff changeset	167 informational. You should examine the areas mentioned in detail to ensure
c3140b08d703 Uploaded cpt parents: diff changeset	168 that the annotations are valid and that no genes are missed.
c3140b08d703 Uploaded cpt parents: diff changeset	169
c3140b08d703 Uploaded cpt parents: diff changeset	170
c3140b08d703 Uploaded cpt parents: diff changeset	171
c3140b08d703 Uploaded cpt parents: diff changeset	172
c3140b08d703 Uploaded cpt parents: diff changeset	173
c3140b08d703 Uploaded cpt parents: diff changeset	174 \subsection{Unusual Gaps}\label{excessive-gaps}
c3140b08d703 Uploaded cpt parents: diff changeset	175
c3140b08d703 Uploaded cpt parents: diff changeset	176 {% if excessive_gap \| length == 0 %}
c3140b08d703 Uploaded cpt parents: diff changeset	177 No gaps over {{ params['excessive_gap_dist'] }} nt (for genes on the same
c3140b08d703 Uploaded cpt parents: diff changeset	178 strand) or {{ params['excessive_gap_divergent_dist'] }} (for genes on
c3140b08d703 Uploaded cpt parents: diff changeset	179 opposite strands) were found.
c3140b08d703 Uploaded cpt parents: diff changeset	180 {% else %}
c3140b08d703 Uploaded cpt parents: diff changeset	181 Gaps over {{ params['excessive_gap_dist'] }} nt (for genes on the same
c3140b08d703 Uploaded cpt parents: diff changeset	182 strand) or {{ params['excessive_gap_divergent_dist'] }} (for genes on
c3140b08d703 Uploaded cpt parents: diff changeset	183 opposite strands) were found.
c3140b08d703 Uploaded cpt parents: diff changeset	184
c3140b08d703 Uploaded cpt parents: diff changeset	185 \begin{longtable}{llll}
c3140b08d703 Uploaded cpt parents: diff changeset	186 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	187 Region & Size & Surroundings & Messages\\
c3140b08d703 Uploaded cpt parents: diff changeset	188 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	189 \endhead
c3140b08d703 Uploaded cpt parents: diff changeset	190 {% for row in excessive_gap %}
c3140b08d703 Uploaded cpt parents: diff changeset	191 \texttt{{'{'}}{{row[0]}}..{{row[1]}}{{'}'}} & {{row[1] - row[0]}} & {{row[2] \| nice_strand_tex}} {{row[3] \| nice_strand_tex}} & {% if row[4] != 0 %}{{row[4]}} ORFs found in this region{% endif %} \\
c3140b08d703 Uploaded cpt parents: diff changeset	192
c3140b08d703 Uploaded cpt parents: diff changeset	193 {% endfor %}
c3140b08d703 Uploaded cpt parents: diff changeset	194 \end{longtable}
c3140b08d703 Uploaded cpt parents: diff changeset	195 {% endif %}
c3140b08d703 Uploaded cpt parents: diff changeset	196
c3140b08d703 Uploaded cpt parents: diff changeset	197
c3140b08d703 Uploaded cpt parents: diff changeset	198
c3140b08d703 Uploaded cpt parents: diff changeset	199
c3140b08d703 Uploaded cpt parents: diff changeset	200 \subsection{Unusual Overlaps}\label{excessive-overlaps}
c3140b08d703 Uploaded cpt parents: diff changeset	201
c3140b08d703 Uploaded cpt parents: diff changeset	202 {% if excessive_overlap \| length == 0 %}
c3140b08d703 Uploaded cpt parents: diff changeset	203 No overlaps over {{ params['excessive_overlap_dist'] }} nt (for genes on the same
c3140b08d703 Uploaded cpt parents: diff changeset	204 strand) or {{ params['excessive_overlap_divergent_dist'] }} (for genes on
c3140b08d703 Uploaded cpt parents: diff changeset	205 opposite strands) were found.
c3140b08d703 Uploaded cpt parents: diff changeset	206 {% else %}
c3140b08d703 Uploaded cpt parents: diff changeset	207 Overlaps over {{ params['excessive_overlap_dist'] }} nt (for genes on the same
c3140b08d703 Uploaded cpt parents: diff changeset	208 strand) or {{ params['excessive_overlap_divergent_dist'] }} (for genes on
c3140b08d703 Uploaded cpt parents: diff changeset	209 opposite strands) were found.
c3140b08d703 Uploaded cpt parents: diff changeset	210 \begin{longtable}{llllll}
c3140b08d703 Uploaded cpt parents: diff changeset	211 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	212 \multicolumn{2}{l}{Feature A} & \multicolumn{2}{l}{Feature B} & & \\
c3140b08d703 Uploaded cpt parents: diff changeset	213 ID & Location & ID & Location & Region & Length\\
c3140b08d703 Uploaded cpt parents: diff changeset	214 \hline
c3140b08d703 Uploaded cpt parents: diff changeset	215 \endhead
c3140b08d703 Uploaded cpt parents: diff changeset	216 {% for row in excessive_overlap %}
c3140b08d703 Uploaded cpt parents: diff changeset	217 {{row[0].id \| texify}} & \texttt{{'{'}}{{row[0].location}}{{'}'}} & {{row[1].id \| texify}} & \texttt{{'{'}}{{row[1].location}}{{'}'}} & {{row[2]}}..{{row[3]}} & {{row[3] - row[2]}} \\
c3140b08d703 Uploaded cpt parents: diff changeset	218 {% endfor %}
c3140b08d703 Uploaded cpt parents: diff changeset	219 \end{longtable}
c3140b08d703 Uploaded cpt parents: diff changeset	220 {% endif %}
c3140b08d703 Uploaded cpt parents: diff changeset	221
c3140b08d703 Uploaded cpt parents: diff changeset	222 \subsection{Coding Density}\label{coding-density}
c3140b08d703 Uploaded cpt parents: diff changeset	223
c3140b08d703 Uploaded cpt parents: diff changeset	224 You have a coding density of {{ coding_density_real }}\% which scores
c3140b08d703 Uploaded cpt parents: diff changeset	225 {{ coding_density }} / 100 on our scale. Most genomes should be in the 90\% to 100\%
c3140b08d703 Uploaded cpt parents: diff changeset	226 coding density range
c3140b08d703 Uploaded cpt parents: diff changeset	227
c3140b08d703 Uploaded cpt parents: diff changeset	228
c3140b08d703 Uploaded cpt parents: diff changeset	229
c3140b08d703 Uploaded cpt parents: diff changeset	230
c3140b08d703 Uploaded cpt parents: diff changeset	231
c3140b08d703 Uploaded cpt parents: diff changeset	232
c3140b08d703 Uploaded cpt parents: diff changeset	233
c3140b08d703 Uploaded cpt parents: diff changeset	234
c3140b08d703 Uploaded cpt parents: diff changeset	235 \end{document}

Mercurial > repos > cpt > cpt_phageqc_annotations

annotate cpt_phageqc_annotation/phageqc_report_genomea.tex @ 0:c3140b08d703 draft default tip