Report on:" >> $outputFile + +mkdir $outputDir/circos +cp $dir/circos/* $outputDir/circos/ +#CIRCOSTOOLS="/data/galaxy/galaxy-dist/toolsheddependencies/circos/0.64/saskia-hiltemann/cg_circos_plots/bbfdd52d64fd/circos-tools-0.21/tools" +#CIRCOSDIR="/data/galaxy/galaxy-dist/toolsheddependencies/circos/0.64/saskia-hiltemann/cg_circos_plots/bbfdd52d64fd/bin/" + +#CIRCOSTOOLS="/home/galaxy/circos/circos-tools-0.22/tools" +#CIRCOSDIR="/home/galaxy/Anaconda3/bin" + +USECIRCOS="no" +if [ -d "$CIRCOSDIR" ]; then + USECIRCOS="yes" +else + if [ -d "/data/galaxy/galaxy-dist/toolsheddependencies/circos/0.64/saskia-hiltemann/cg_circos_plots/bbfdd52d64fd/bin/" ]; then #hopefully temporary fix + USECIRCOS="yes" + CIRCOSTOOLS="/data/galaxy/galaxy-dist/toolsheddependencies/circos/0.64/saskia-hiltemann/cg_circos_plots/bbfdd52d64fd/circos-tools-0.21/tools" + CIRCOSDIR="/data/galaxy/galaxy-dist/toolsheddependencies/circos/0.64/saskia-hiltemann/cg_circos_plots/bbfdd52d64fd/bin/" + fi + + if [ -d "/home/galaxy/Anaconda3/bin" ]; then #hopefully temporary fix + USECIRCOS="yes" + CIRCOSTOOLS="/home/galaxy/circos/circos-tools-0.22/tools" + CIRCOSDIR="/home/galaxy/Anaconda3/bin" + fi +fi + +echo "Using Circos: $USECIRCOS" +sed -i "s%DATA_DIR%$outputDir/circos%" $outputDir/circos/circos.conf +for sample in $samples; do #output the samples to a file and create the circos plots with the R script output + echo " $sample" >> $outputFile + + if [[ "$USECIRCOS" != "yes" ]]; then + continue + fi + + circos_file="$outputDir/${sample}_VJ_circos.txt" + echo -e -n "labels$(cat ${circos_file})" > ${circos_file} + cat "${circos_file}" | $CIRCOSTOOLS/tableviewer/bin/parse-table -configfile $dir/circos/parse-table.conf 2>&1 | $CIRCOSTOOLS/tableviewer/bin/make-conf -dir $outputDir/circos/ + $CIRCOSDIR/circos -conf $outputDir/circos/circos.conf 2>&1 + mv $outputDir/circos/circos.png $outputDir/circosVJ_${sample}.png + + + if [[ "$useD" == "true" ]] ; then + circos_file="$outputDir/${sample}_VD_circos.txt" + echo -e -n "labels$(cat ${circos_file})" > ${circos_file} + cat "${circos_file}" | $CIRCOSTOOLS/tableviewer/bin/parse-table -configfile $dir/circos/parse-table.conf 2>&1 | $CIRCOSTOOLS/tableviewer/bin/make-conf -dir $outputDir/circos/ + $CIRCOSDIR/circos -conf $outputDir/circos/circos.conf 2>&1 + mv $outputDir/circos/circos.png $outputDir/circosVD_${sample}.png + + circos_file="$outputDir/${sample}_DJ_circos.txt" + echo -e -n "labels$(cat ${circos_file})" > ${circos_file} + cat "${circos_file}" | $CIRCOSTOOLS/tableviewer/bin/parse-table -configfile $dir/circos/parse-table.conf 2>&1 | $CIRCOSTOOLS/tableviewer/bin/make-conf -dir $outputDir/circos/ + $CIRCOSDIR/circos -conf $outputDir/circos/circos.conf 2>&1 + mv $outputDir/circos/circos.png $outputDir/circosDJ

Sample/Replicate	All	Productive	Unique Productive	Unproductive	Unique Unproductive
$sample	$all	$productive (${perc_prod}%)	$productive_unique (${perc_prod_un}%)	$unproductive (${perc_unprod}%)	$unproductive_unique (${perc_unprod_un}%)

Sample/Replicate

All

Productive

Unique Productive

Unproductive

Unique Unproductive

$sample

$all

$productive (${perc_prod}%)

$productive_unique (${perc_prod_un}%)

$unproductive (${perc_unprod}%)

$unproductive_unique (${perc_unprod_un}%)

" >> $outputFile + + +echo "

" >> $outputFile +if [[ "$useD" == "true" ]] ; then + echo "

" >> $outputFile +fi +echo "

" >> $outputFile +if [[ "$useD" == "true" ]] ; then + echo "

" >> $outputFile +fi +echo "

" >> $outputFile +echo "

" >> $outputFile + +echo "

" >> $outputFile +echo "

" >> $outputFile + +echo "" >> $outputFile +echo "" >> $outputFile +while IFS=, read Sample median +do + echo "" >> $outputFile +done < $outputDir/AAMedianBySample.csv +echo "

Sample	Median CDR3 Length
$Sample	$median

" >> $outputFile + +echo "

" >> $outputFile + +#Heatmaps + +count=1 +echo "

" >> $outputFile +for sample in $samples; do + echo "

" >> $outputFile + if [[ "$useD" == "true" ]] ; then + echo "" >> $outputFile + fi + echo "" >> $outputFile + if [[ "$useD" == "true" ]] ; then + echo "" >> $outputFile + fi + echo "

" >> $outputFile + count=$((count+1)) +done +echo "

" >> $outputFile + +#circos + +if [[ "$USECIRCOS" == "yes" ]]; then + + echo "

" >> $outputFile + for sample in $samples; do + echo "

" >> $outputFile + if [[ "$useD" == "true" ]] ; then + echo "" >> $outputFile + fi + echo "" >> $outputFile + if [[ "$useD" == "true" ]] ; then + echo "" >> $outputFile + fi + echo "

V-D
V-J
D-J

" >> $outputFile + count=$((count+1)) + done + echo "

" >> $outputFile +fi +#echo "

" >> $outputFile + +hasReplicateColumn="$(if head -n 1 $inputFile | grep -q 'Replicate'; then echo 'Yes'; else echo 'No'; fi)" +echo "$hasReplicateColumn" +#if its a 'new' merged file with replicate info +if [[ "$hasReplicateColumn" == "Yes" ]] ; then + echo "

" >> $outputFile + for sample in $samples; do + echo "${clonality_method}" + if [[ "${clonality_method}" == "old" ]] ; then + echo "in old" + clonalityScore="$(cat $outputDir/ClonalityScore_$sample.csv)" + echo "

" >> $outputFile + echo "" >> $outputFile + + #replicate,reads,squared + echo "" >> $outputFile + while IFS=, read replicate reads squared + do + echo "" >> $outputFile + done < $outputDir/ReplicateReads_$sample.csv + + #sum of reads and reads squared + while IFS=, read readsSum squaredSum + do + echo "" >> $outputFile + done < $outputDir/ReplicateSumReads_$sample.csv + + #overview + echo "" >> $outputFile + while IFS=, read type count weight weightedCount + do + if [[ "$type" -eq "1" ]]; then + echo "" >> $outputFile + else + echo "" >> $outputFile + fi + + done < $outputDir/ClonalityOverView_$sample.csv + echo "

Clonality Score: $clonalityScore
Replicate ID	Number of Reads
$replicate	$reads
Sum	$readsSum
Coincidence Type	Raw Coincidence Freq
$type	$count
$type	$count

" >> $outputFile + else + echo "in new" + clonalityScore="$(cat $outputDir/lymphclon_clonality_${sample}.csv)" + echo "

" >> $outputFile + echo "Lymphclon clonality score:
$clonalityScore

" >> $outputFile + echo "" >> $outputFile + while IFS=, read type count + do + echo "" >> $outputFile + done < $outputDir/lymphclon_coincidences_$sample.csv + echo "

$type

$count

" >> $outputFile + fi + done + echo "

" >> $outputFile +fi + +#hasJunctionData="$(if head -n 1 $inputFile | grep -qE '3V.REGION.trimmed.nt.nb'; then echo 'Yes'; else echo 'No'; fi)" + +#if [[ "$hasJunctionData" == "Yes" ]] ; then +if [ -a "$outputDir/junctionAnalysisProd_mean.csv" ] ; then + echo "

" >> $outputFile + echo "" >> $outputFile + while IFS=, read Sample unique VDEL P1 N1 P2 DELD DDEL P3 N2 P4 DELJ TotalDel TotalN TotalP median + do + echo "" >> $outputFile + done < $outputDir/junctionAnalysisProd_mean.csv + echo "

Productive mean
Sample	count	V.DEL	P1	N1	P2	DEL.D	D.DEL	P3	N2	P4	DEL.J	Total.Del	Total.N	Total.P	Median.CDR3
$Sample	$unique	$VDEL	$P1	$N1	$P2	$DELD	$DDEL	$P3	$N2	$P4	$DELJ	$TotalDel	$TotalN	$TotalP	$median

" >> $outputFile + + echo "" >> $outputFile + while IFS=, read Sample unique VDEL P1 N1 P2 DELD DDEL P3 N2 P4 DELJ TotalDel TotalN TotalP median + do + echo "" >> $outputFile + done < $outputDir/junctionAnalysisUnProd_mean.csv + echo "

Unproductive mean
Sample	count	V.DEL	P1	N1	P2	DEL.D	D.DEL	P3	N2	P4	DEL.J	Total.Del	Total.N	Total.P	Median.CDR3
$Sample	$unique	$VDEL	$P1	$N1	$P2	$DELD	$DDEL	$P3	$N2	$P4	$DELJ	$TotalDel	$TotalN	$TotalP	$median

Productive median
Sample	count	V.DEL	P1	N1	P2	DEL.D	D.DEL	P3	N2	P4	DEL.J	Total.Del	Total.N	Total.P	Median.CDR3
$Sample	$unique	$VDEL	$P1	$N1	$P2	$DELD	$DDEL	$P3	$N2	$P4	$DELJ	$TotalDel	$TotalN	$TotalP	$median

Unproductive median
Sample	count	V.DEL	P1	N1	P2	DEL.D	D.DEL	P3	N2	P4	DEL.J	Total.Del	Total.N	Total.P	Median.CDR3
$Sample	$unique	$VDEL	$P1	$N1	$P2	$DELD	$DDEL	$P3	$N2	$P4	$DELJ	$TotalDel	$TotalN	$TotalP	$median

" >> $outputFile + + echo "

" >> $outputFile +fi + +echo "

" >> $outputFile +for sample in $samples; do + echo "" >> $outputFile +done +echo "

ID	Include
$sample

" >> $outputFile +echo "

" >> $outputFile + +echo "

" >> $outputFile +echo "" >> $outputFile +echo "" >> $outputFile +echo "" >> $outputFile +echo "" >> $outputFile + +echo "" >> $outputFile + +echo "" >> $outputFile +if [[ "$useD" == "true" ]] ; then + echo "" >> $outputFile +fi + +echo "" >> $outputFile +if [[ "$useD" == "true" ]] ; then + echo "" >> $outputFile +fi +echo "" >> $outputFile +echo "" >> $outputFile + +for sample in $samples; do + if [[ "$useD" == "true" ]] ; then + echo "" >> $outputFile + fi + echo "" >> $outputFile + if [[ "$useD" == "true" ]] ; then + echo "" >> $outputFile + fi +done + +echo "" >> $outputFile + +echo "

Description	Link
The dataset used to generate the frequency graphs and the heatmaps (Unique based on clonaltype, $clonalType)	Download
The dataset used to calculate clonality score (Unique based on clonaltype, $clonalType)	Download
The dataset used to generate the CDR3 length frequency graph	Download
The dataset used to generate the V gene family frequency graph	Download
The dataset used to generate the D gene family frequency graph	Download
The dataset used to generate the V gene frequency graph	Download
The dataset used to generate the D gene frequency graph	Download
The dataset used to generate the J gene frequency graph	Download
The dataset used to generate the AA composition graph	Download
The data used to generate the VD heatmap for $sample.	Download
The data used to generate the VJ heatmap for $sample.	Download
The data used to generate the DJ heatmap for $sample.	Download
A frequency count of V Gene + J Gene + CDR3	Download

" >> $outputFile +echo "

" >> $outputFile diff -r 3ef457aa5df6 -r 9185c3dfc679 report_clonality_igg.xml --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/report_clonality_igg.xml Fri Jan 27 03:44:18 2017 -0500 @@ -0,0 +1,197 @@ + + + +#if $gene_selection.source == "imgtdb" + report_clonality/r_wrapper.sh $in_file $out_file $out_file.files_path "$clonaltype" "${gene_selection.species}" "${gene_selection.locus}" $filterproductive $clonality_method +#else + report_clonality/r_wrapper.sh $in_file $out_file $out_file.files_path "$clonaltype" "custom" "${gene_selection.vgenes};${gene_selection.dgenes};${gene_selection.jgenes}" $filterproductive $clonality_method +#end if + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + weblogo + + + +**INPUT** + +One or more ARGalaxy proprietary format files combined with the ARGalaxy Experimental Design tool + + +.. class:: warningmark + +Custom gene ordering based on position on genome: + +**Human** + +IGH:: + + V: + IGHV7-81,IGHV3-74,IGHV3-73,IGHV3-72,IGHV3-71,IGHV2-70,IGHV1-69,IGHV3-66,IGHV3-64,IGHV4-61,IGHV4-59,IGHV1-58,IGHV3-53,IGHV3-52,IGHV5-a,IGHV5-51,IGHV3-49,IGHV3-48,IGHV3-47,IGHV1-46,IGHV1-45,IGHV3-43,IGHV4-39,IGHV3-35,IGHV4-34,IGHV3-33,IGHV4-31,IGHV4-30-4,IGHV4-30-2,IGHV3-30-3,IGHV3-30,IGHV4-28,IGHV2-26,IGHV1-24,IGHV3-23,IGHV3-22,IGHV3-21,IGHV3-20,IGHV3-19,IGHV1-18,IGHV3-15,IGHV3-13,IGHV3-11,IGHV3-9,IGHV1-8,IGHV3-7,IGHV2-5,IGHV7-4-1,IGHV4-4,IGHV4-b,IGHV1-3,IGHV1-2,IGHV6-1 + D: + IGHD1-1,IGHD2-2,IGHD3-3,IGHD6-6,IGHD1-7,IGHD2-8,IGHD3-9,IGHD3-10,IGHD4-11,IGHD5-12,IGHD6-13,IGHD1-14,IGHD2-15,IGHD3-16,IGHD4-17,IGHD5-18,IGHD6-19,IGHD1-20,IGHD2-21,IGHD3-22,IGHD4-23,IGHD5-24,IGHD6-25,IGHD1-26,IGHD7-27 + J: + IGHJ1,IGHJ2,IGHJ3,IGHJ4,IGHJ5,IGHJ6 + + +IGK:: + + V: + IGKV3D-7,IGKV1D-8,IGKV1D-43,IGKV3D-11,IGKV1D-12,IGKV1D-13,IGKV3D-15,IGKV1D-16,IGKV1D-17,IGKV3D-20,IGKV2D-26,IGKV2D-28,IGKV2D-29,IGKV2D-30,IGKV1D-33,IGKV1D-39,IGKV2D-40,IGKV2-40,IGKV1-39,IGKV1-33,IGKV2-30,IGKV2-29,IGKV2-28,IGKV1-27,IGKV2-24,IGKV3-20,IGKV1-17,IGKV1-16,IGKV3-15,IGKV1-13,IGKV1-12,IGKV3-11,IGKV1-9,IGKV1-8,IGKV1-6,IGKV1-5,IGKV5-2,IGKV4-1 + J: + IGKJ1,IGKJ2,IGKJ3,IGKJ4,IGKJ5 + + +IGL:: + + V: + IGLV4-69,IGLV8-61,IGLV4-60,IGLV6-57,IGLV5-52,IGLV1-51,IGLV9-49,IGLV1-47,IGLV7-46,IGLV5-45,IGLV1-44,IGLV7-43,IGLV1-41,IGLV1-40,IGLV5-39,IGLV5-37,IGLV1-36,IGLV3-27,IGLV3-25,IGLV2-23,IGLV3-22,IGLV3-21,IGLV3-19,IGLV2-18,IGLV3-16,IGLV2-14,IGLV3-12,IGLV2-11,IGLV3-10,IGLV3-9,IGLV2-8,IGLV4-3,IGLV3-1 + J: + IGLJ1,IGLJ2,IGLJ3,IGLJ6,IGLJ7 + + +TRB:: + + V: + TRBV2,TRBV3-1,TRBV4-1,TRBV5-1,TRBV6-1,TRBV4-2,TRBV6-2,TRBV4-3,TRBV6-3,TRBV7-2,TRBV6-4,TRBV7-3,TRBV9,TRBV10-1,TRBV11-1,TRBV10-2,TRBV11-2,TRBV6-5,TRBV7-4,TRBV5-4,TRBV6-6,TRBV5-5,TRBV7-6,TRBV5-6,TRBV6-8,TRBV7-7,TRBV6-9,TRBV7-8,TRBV5-8,TRBV7-9,TRBV13,TRBV10-3,TRBV11-3,TRBV12-3,TRBV12-4,TRBV12-5,TRBV14,TRBV15,TRBV16,TRBV18,TRBV19,TRBV20-1,TRBV24-1,TRBV25-1,TRBV27,TRBV28,TRBV29-1,TRBV30 + D: + TRBD1,TRBD2 + J: + TRBJ1-1,TRBJ1-2,TRBJ1-3,TRBJ1-4,TRBJ1-5,TRBJ1-6,TRBJ2-1,TRBJ2-2,TRBJ2-3,TRBJ2-4,TRBJ2-5,TRBJ2-6,TRBJ2-7 + + +TRA:: + + V: + TRAV1-1,TRAV1-2,TRAV2,TRAV3,TRAV4,TRAV5,TRAV6,TRAV7,TRAV8-1,TRAV9-1,TRAV10,TRAV12-1,TRAV8-2,TRAV8-3,TRAV13-1,TRAV12-2,TRAV8-4,TRAV13-2,TRAV14/DV4,TRAV9-2,TRAV12-3,TRAV8-6,TRAV16,TRAV17,TRAV18,TRAV19,TRAV20,TRAV21,TRAV22,TRAV23/DV6,TRAV24,TRAV25,TRAV26-1,TRAV27,TRAV29/DV5,TRAV30,TRAV26-2,TRAV34,TRAV35,TRAV36/DV7,TRAV38-1,TRAV38-2/DV8,TRAV39,TRAV40,TRAV41 + J: + TRAJ57,TRAJ56,TRAJ54,TRAJ53,TRAJ52,TRAJ50,TRAJ49,TRAJ48,TRAJ47,TRAJ46,TRAJ45,TRAJ44,TRAJ43,TRAJ42,TRAJ41,TRAJ40,TRAJ39,TRAJ38,TRAJ37,TRAJ36,TRAJ34,TRAJ33,TRAJ32,TRAJ31,TRAJ30,TRAJ29,TRAJ28,TRAJ27,TRAJ26,TRAJ24,TRAJ23,TRAJ22,TRAJ21,TRAJ20,TRAJ18,TRAJ17,TRAJ16,TRAJ15,TRAJ14,TRAJ13,TRAJ12,TRAJ11,TRAJ10,TRAJ9,TRAJ8,TRAJ7,TRAJ6,TRAJ5,TRAJ4,TRAJ3 + + +TRG:: + + V: + TRGV9,TRGV8,TRGV5,TRGV4,TRGV3,TRGV2 + J: + TRGJ2,TRGJP2,TRGJ1,TRGJP1 + + +TRD:: + + V: + TRDV1,TRDV2,TRDV3 + D: + TRDD1,TRDD2,TRDD3 + J: + TRDJ1,TRDJ4,TRDJ2,TRDJ3 + + +**Mouse** + +TRB:: + + V: + TRBV1,TRBV2,TRBV3,TRBV4,TRBV5,TRBV12-1,TRBV13-1,TRBV12-2,TRBV13-2,TRBV13-3,TRBV14,TRBV15,TRBV16,TRBV17,TRBV19,TRBV20,TRBV23,TRBV24,TRBV26,TRBV29,TRBV30,TRBV31 + D: + TRBD1,TRBD2 + J: + TRBJ1-1,TRBJ1-2,TRBJ1-3,TRBJ1-4,TRBJ1-5,TRBJ2-1,TRBJ2-2,TRBJ2-3,TRBJ2-4,TRBJ2-5,TRBJ2-6,TRBJ2-7 + + +**OUTPUT** + +It generates the following result: + +

Progress

Click here for the results