Prepare analysis workflow

Set filepaths and parameters

set.seed(42)
knitr::opts_knit$set(root.dir = rprojroot::find_rstudio_root_file())
options(
  readr.show_progress = FALSE,
  digits = 2
)

Load packages

suppressPackageStartupMessages({
  library(tximeta)
  library(rjson)
  library(scater)
  library(alevinQC)
  library(biomaRt)
  library(tidyverse)
})

Define functions

create_qc_report <- function(sample_dir, sample_name, reports_dir) {
  checkAlevinInputFiles(sample_dir)

  alevinQCReport(
    baseDir = sample_dir,
    sampleId = sample_name,
    outputFile = paste0(sample_name, "_alevin_report.html"),
    outputFormat = "html_document",
    outputDir = reports_dir,
    forceOverwrite = TRUE
  )
}

get_markers <- function(sce10x) {
  macrophage <-
    which(rowData(sce10x)$gene_name %in% c("Adgre1", "Ptprc", "Itgam"))
  stem <- which(rowData(sce10x)$gene_name %in% c("Pax7"))
  # other <- which(rowData(sce10x)$gene_name %in% c("Pecam1"))
  fap <- which(rowData(sce10x)$gene_name %in% c("Pdgfra"))

  markers_dt <-
    assay(sce10x)[c(stem, fap, macrophage), ] %>%
    as.data.frame.matrix()
  barcode_labels <-
    colnames(markers_dt)

  no_markers <-
    markers_dt %>%
    summarize_all(list(~ (sum(.) == 0)))

  markers <-
    markers_dt %>%
    summarize_all(which.max)

  markers[unlist(no_markers)] <- 0L
  markers <-
    markers %>%
    data.table::transpose() %>%
    set_names("marker")

  markers <-
    markers %>%
    mutate(
      marker = case_when(
        marker == 0L ~ "none",
        marker == 1L ~ "stem",
        marker == 2L ~ "fap",
        marker %in% c(3L, 4L, 5L) ~ "macrophage"
      )
    ) %>%
    pull(marker)
  return(markers)
}


add_metadata <- function(sce10x, gene_metadata, sample_name, mito_thresh = 15) {
  rowData(sce10x) <-
    gene_metadata %>%
    left_join(tibble(ensembl_gene_id_version = rownames(sce10x)),
      .,
      by = "ensembl_gene_id_version"
    ) %>%
    dplyr::rename(chr = "chromosome_name") %>%
    mutate(gene_name = uniquifyFeatureNames(
      ensembl_gene_id_version,
      external_gene_name
    ))
  rownames(sce10x) <- rowData(sce10x)$gene_name

  combined_metrics <-
    perCellQCMetrics(
      sce10x,
      subsets = list(mito = which(rowData(sce10x)$chr ==
        "MT")),
      percent_top = c(500),
      exprs_values = c("counts"),
      flatten = TRUE
    ) %>%
    as_tibble() %>%
    dplyr::select(-total)

  spliced_metrics <-
    perCellQCMetrics(
      sce10x,
      exprs_values = c("spliced"),
      percent_top = NULL,
      flatten = TRUE
    ) %>%
    as_tibble() %>%
    dplyr::select(-total) %>%
    set_names(c("sum_spliced", "detected_spliced"))


  unspliced_metrics <-
    perCellQCMetrics(
      sce10x,
      exprs_values = c("unspliced"),
      percent_top = NULL,
      flatten = TRUE
    ) %>%
    as_tibble() %>%
    dplyr::select(-total) %>%
    set_names(c("sum_unspliced", "detected_unspliced"))

  counts_dt <-
    bind_cols(
      combined_metrics,
      spliced_metrics,
      unspliced_metrics
    ) %>%
    mutate(
      unspliced_ov_spliced = sum_unspliced / sum_spliced,
      unspliced_ov_total = sum_unspliced / sum,
      sample = sample_name,
      condition = case_when(
        str_sub(sample, 1, 1) == "y" ~ "yng",
        str_sub(sample, 1, 1) == "a" ~ "aged"
      ),
      high_mito = combined_metrics$subsets_mito_percent > mito_thresh
    ) %>%
    DataFrame(.)


  rownames(counts_dt) <-
    paste(colnames(sce10x),
      str_sub(counts_dt$sample, start = -2),
      sep = "_"
    )

  colData(sce10x) <- counts_dt


  return(sce10x)
}

load_data <- function(sample_name, sample_dir, spliced_unspliced) {
  col_data <-
    data.frame(
      names = sample_name,
      files = file.path(
        sample_dir,
        "alevin",
        "quants_mat.gz"
      ),
      stringsAsFactors = FALSE
    )

  sce10x <-
    tximeta::tximeta(
      coldata = col_data,
      type = "alevin"
    )

  # split into spliced and nspliced abundances matrices

  sce10x <-
    tximeta::splitSE(sce10x,
      as.data.frame(spliced_unspliced),
      assayName = "counts"
    )

  sce10x <- as(sce10x, "SingleCellExperiment")

  assays(sce10x) <- list(
    counts = assay(sce10x, "spliced") + assay(sce10x, "unspliced"),
    spliced = assay(sce10x, "spliced"),
    unspliced = assay(sce10x, "unspliced")
  )

  return(sce10x)
}

create_diag_plots <- function(sce10x) {
  plot_dt <-
    colData(sce10x) %>%
    as_tibble()

  p1 <-
    ggplot(plot_dt) +
    geom_point(aes(sum_spliced,
      sum_unspliced,
      colour = subsets_mito_percent
    ),
    size = 0.3,
    alpha = 0.3
    ) +
    scale_x_log10() +
    scale_y_log10() +
    # geom_vline(xintercept = unlist(metrics[10,2]), color = "green", linetype = 2) +
    # geom_hline(yintercept =  unlist(metrics[11,2]), color = "green", linetype = 2) +
    facet_wrap(sample ~ ., ncol = 2)

  p2 <-
    ggplot(plot_dt) +
    geom_histogram(aes(unspliced_ov_total, fill = markers), bins = 150) +
    facet_wrap(sample ~ ., ncol = 2)


  p3 <-
    ggplot(colData(sce10x) %>%
      as_tibble()) +
    geom_histogram(aes(detected), bins = 150) +
    facet_wrap(sample ~ ., ncol = 2) +
    scale_x_log10() +
    geom_vline(xintercept = c(300, 7000), color = "green", linetype = 2)


  p4 <-
    plotColData(sce10x,
      x = "sum",
      by_exprs_values = "counts",
      y = "detected",
      colour_by = "subsets_mito_percent",
      point_size = 1
    ) +
    scale_x_log10() +
    scale_y_log10() +
    facet_wrap(~ colData(sce10x)$sample, ncol = 2) +
    geom_vline(aes(xintercept = 1000), color = "green", linetype = 2) +
    geom_hline(aes(yintercept = 500), color = "green", linetype = 2)


  p5 <-
    plotScater(sce10x,
      nfeatures = 500,
      block1 = "sample",
      ncol = 2,
      exprs_values = "counts",
      colour_by = "subsets_mito_percent",
      line_width = 0.2
    ) +
    geom_hline(aes(yintercept = .95))

  ggsave(file.path(figures_dir, "spliced_vs_unspliced_scatter.pdf"), p1)
  ggsave(file.path(figures_dir, "spliced_ov_unspliced_histogram.pdf"), p2)
  ggsave(file.path(figures_dir, "detected_histogram.pdf"), p3)
  ggsave(file.path(figures_dir, "sum_vs_detected.pdf"), p4)
  ggsave(file.path(figures_dir, "cumulative_expression.jpeg"), p5)

  return(list(p1 = p1, p2 = p2, p3 = p3, p3 = p4, p3 = p5))
}

Define file paths

data_dir <- "./data"
salmon_dir <- file.path(data_dir, "salmon_out")
reports_dir <- file.path(data_dir, "alevin_reports")
figures_dir <- file.path("./figures", "qc_cells")

index_dir <-
  "/run/user/1000/gvfs/sftp:host=graham.computecanada.ca,user=rfarouni/home/rfarouni/projects/rrg-hsn/rfarouni/data/salmon_indices/m24/spliced_introns_collapsed_flank90"
json_file <-
  file.path(
    data_dir,
    "metadata",
    "gencode.vM24.annotation.expanded.json"
  )
gene_expanded_file <-
  file.path(
    index_dir,
    "gencode.vM24.annotation.expanded.features.tsv"
  )

list.files(index_dir)

 [1] "gencode.vM24.annotation.expanded.fa"           "gencode.vM24.annotation.expanded.features.tsv"
 [3] "gencode.vM24.annotation.expanded.gtf"          "gencode.vM24.annotation.expanded.sidx"        
 [5] "gencode.vM24.annotation.expanded.tx2gene.tsv"  "gencode.vM24.annotation.gtf.gz"               
 [7] "GRCm38.primary_assembly.genome.chrnames.txt"   "GRCm38.primary_assembly.genome.fa"            
 [9] "salmon_index.job"                              "salmon_m24_index.out"

Define sample names

sample_dirs <-
  list.dirs(salmon_dir,
    full.names = T,
    recursive = FALSE
  )

sample_names <- c(
  paste0("aged", 1:4),
  paste0("yng", 1:3)
)
sample_names

[1] "aged1" "aged2" "aged3" "aged4" "yng1"  "yng2"  "yng3"

Step 1: Generate alevin summary QC report

purrr::map2(sample_dirs,
  sample_names,
  create_qc_report,
  reports_dir = reports_dir
)

Step 2: Get gene metadata

spliced_unspliced <-
  read_tsv(gene_expanded_file) %>%
  dplyr::rename(unspliced = "intron") # Rename the 'intron' column 'unspliced' to make it compatible with scVelo

Parsed with column specification:
cols(
  spliced = [31mcol_character()[39m,
  intron = [31mcol_character()[39m
)

spliced_unspliced

mart <-
  useDataset(
    "mmusculus_gene_ensembl",
    useMart("ensembl")
  )

gene_metadata <-
  getBM(
    filters = "ensembl_gene_id_version",
    attributes = c(
      "ensembl_gene_id_version",
      "external_gene_name",
      "gene_biotype",
      "chromosome_name",
      "description"
    ),
    values = spliced_unspliced$spliced,
    mart = mart
  )
gene_metadata

Step 3: Import abundances into R with tximeta

Create a linked transcriptome with tximeta.

tximeta::makeLinkedTxome(
  indexDir = file.path(index_dir, "gencode.vM24.annotation.expanded.sidx"),
  source = "GENCODE",
  genome = "GRCm38",
  organism = "Mus musculus",
  release = "M24",
  fasta = file.path(index_dir, "gencode.vM24.annotation.expanded.fa"),
  gtf = file.path(index_dir, "gencode.vM24.annotation.expanded.gtf"),
  write = TRUE,
  jsonFile = json_file
)

writing linkedTxome to ./data/metadata/gencode.vM24.annotation.expanded.json
linkedTxome is same as already in bfc

rjson::fromJSON(file = json_file)

[[1]]
[[1]]$index
[1] "gencode.vM24.annotation.expanded.sidx"

[[1]]$source
[1] "GENCODE"

[[1]]$organism
[1] "Mus musculus"

[[1]]$release
[1] "M24"

[[1]]$genome
[1] "GRCm38"

[[1]]$fasta
[1] "/run/user/1000/gvfs/sftp:host=graham.computecanada.ca,user=rfarouni/home/rfarouni/projects/rrg-hsn/rfarouni/data/salmon_indices/m24/spliced_introns_collapsed_flank90/gencode.vM24.annotation.expanded.fa"

[[1]]$gtf
[1] "/run/user/1000/gvfs/sftp:host=graham.computecanada.ca,user=rfarouni/home/rfarouni/projects/rrg-hsn/rfarouni/data/salmon_indices/m24/spliced_introns_collapsed_flank90/gencode.vM24.annotation.expanded.gtf"

[[1]]$sha256
[1] "ea9dfa0cdf7ed85fe348bf8ed32215c2261b01ba3dae7ebf007ef2afaf0213b1"

Load linked transcriptome

tximeta::loadLinkedTxome(json_file)

linkedTxome is same as already in bfc

Step 4: Load, split, and annotate data

load_annotate_data <- function(sample_name, sample_dir, spliced_unspliced, gene_metadata) {
  sce10x <- load_data(sample_name, sample_dir, spliced_unspliced)
  sce10x <- add_metadata(sce10x, gene_metadata, sample_name)
  colData(sce10x)$markers <- get_markers(sce10x)
  return(sce10x)
}

sce10x <-
  map2(sample_names,
    sample_dirs,
    load_annotate_data,
    spliced_unspliced = spliced_unspliced,
    gene_metadata = gene_metadata
  )

importing quantifications
importing alevin data is much faster after installing `fishpond` (>= 1.2.0)
reading in alevin gene-level counts across cells 
found matching linked transcriptome:
[ GENCODE - Mus musculus - release M24 ]
loading existing TxDb created: 2020-04-30 19:48:32
Loading required package: GenomicFeatures
Loading required package: AnnotationDbi

Attaching package: 'AnnotationDbi'

The following object is masked from 'package:dplyr':

    select

generating gene ranges
loading existing gene ranges created: 2020-04-30 19:48:34
fetching genome info for GENCODE
importing quantifications
importing alevin data is much faster after installing `fishpond` (>= 1.2.0)
reading in alevin gene-level counts across cells 
found matching linked transcriptome:
[ GENCODE - Mus musculus - release M24 ]
loading existing TxDb created: 2020-04-30 19:48:32
generating gene ranges
loading existing gene ranges created: 2020-04-30 19:48:34
fetching genome info for GENCODE
importing quantifications
importing alevin data is much faster after installing `fishpond` (>= 1.2.0)
reading in alevin gene-level counts across cells 
found matching linked transcriptome:
[ GENCODE - Mus musculus - release M24 ]
loading existing TxDb created: 2020-04-30 19:48:32
generating gene ranges
loading existing gene ranges created: 2020-04-30 19:48:34
fetching genome info for GENCODE
importing quantifications
importing alevin data is much faster after installing `fishpond` (>= 1.2.0)
reading in alevin gene-level counts across cells 
found matching linked transcriptome:
[ GENCODE - Mus musculus - release M24 ]
loading existing TxDb created: 2020-04-30 19:48:32
generating gene ranges
loading existing gene ranges created: 2020-04-30 19:48:34
fetching genome info for GENCODE
importing quantifications
importing alevin data is much faster after installing `fishpond` (>= 1.2.0)
reading in alevin gene-level counts across cells 
found matching linked transcriptome:
[ GENCODE - Mus musculus - release M24 ]
loading existing TxDb created: 2020-04-30 19:48:32
generating gene ranges
loading existing gene ranges created: 2020-04-30 19:48:34
fetching genome info for GENCODE
importing quantifications
importing alevin data is much faster after installing `fishpond` (>= 1.2.0)
reading in alevin gene-level counts across cells 
found matching linked transcriptome:
[ GENCODE - Mus musculus - release M24 ]
loading existing TxDb created: 2020-04-30 19:48:32
generating gene ranges
loading existing gene ranges created: 2020-04-30 19:48:34
fetching genome info for GENCODE
importing quantifications
importing alevin data is much faster after installing `fishpond` (>= 1.2.0)
reading in alevin gene-level counts across cells 
found matching linked transcriptome:
[ GENCODE - Mus musculus - release M24 ]
loading existing TxDb created: 2020-04-30 19:48:32
generating gene ranges
loading existing gene ranges created: 2020-04-30 19:48:34
fetching genome info for GENCODE

Combine the samples into one sce object

sce10x <- reduce(sce10x, cbind)
colData(sce10x)

DataFrame with 25952 rows and 16 columns
                          sum  detected percent_top_500 subsets_mito_sum subsets_mito_detected subsets_mito_percent sum_spliced detected_spliced
                    <numeric> <integer>       <numeric>        <numeric>             <integer>            <numeric>   <numeric>        <integer>
ATACCGATCACCTGGG_d1     17510      5013         49.1488          425.500                    14              2.43004     10878.1             3681
GACTATGTCCGGCTTT_d1     19538      5122         53.1112          526.998                    13              2.69730     14653.1             4088
ATGGTTGGTTGTAAAG_d1     18438      4910         52.3674         1327.485                    14              7.19973     14088.2             3978
GAGTCTACAGAAGTTA_d1     20504      5063         56.9594         1087.560                    14              5.30414     17555.5             4408
GATTGGTAGGGAGTGG_d1     21025      5503         50.6502          653.396                    13              3.10771     15001.1             4277
...                       ...       ...             ...              ...                   ...                  ...         ...              ...
GTTCCGTTCCGAAATC_g3       155        45             100          104.986                    11              67.7329     148.000               38
ACGTACATCGGCTGGT_g3       200       102             100          105.490                    11              52.7451     184.417               85
AGTTCGAGTTCTCCTG_g3       175        54             100          116.490                     9              66.5658     166.000               44
AATTTCCTCATGGATC_g3       155        33             100          129.990                     9              83.8645     150.000               28
AAGCGTTAGAAATTCG_g3       165        55             100          109.990                    11              66.6608     158.500               46
                    sum_unspliced detected_unspliced unspliced_ov_spliced unspliced_ov_total      sample   condition high_mito     markers
                        <numeric>          <integer>            <numeric>          <numeric> <character> <character> <logical> <character>
ATACCGATCACCTGGG_d1       6631.95               2446             0.609663           0.378752       aged1        aged     FALSE        none
GACTATGTCCGGCTTT_d1       4884.93               1993             0.333372           0.250022       aged1        aged     FALSE         fap
ATGGTTGGTTGTAAAG_d1       4349.80               1889             0.308755           0.235915       aged1        aged     FALSE  macrophage
GAGTCTACAGAAGTTA_d1       2948.46               1249             0.167950           0.143799       aged1        aged     FALSE         fap
GATTGGTAGGGAGTGG_d1       6023.90               2377             0.401564           0.286511       aged1        aged     FALSE         fap
...                           ...                ...                  ...                ...         ...         ...       ...         ...
GTTCCGTTCCGAAATC_g3        7.0000                  7            0.0472973          0.0451613        yng3         yng      TRUE        none
ACGTACATCGGCTGGT_g3       15.5833                 17            0.0845007          0.0779167        yng3         yng      TRUE        none
AGTTCGAGTTCTCCTG_g3        9.0000                 10            0.0542169          0.0514286        yng3         yng      TRUE        none
AATTTCCTCATGGATC_g3        5.0000                  5            0.0333333          0.0322581        yng3         yng      TRUE        none
AAGCGTTAGAAATTCG_g3        6.5000                  9            0.0410095          0.0393939        yng3         yng      TRUE        none

table(colData(sce10x)$sample)


aged1 aged2 aged3 aged4  yng1  yng2  yng3 
 4048  4341  3403  3383  3390  3987  3400

n_exprs_genes <-
  nexprs(sce10x, byrow = TRUE, exprs_values = "counts")
sce10x <- sce10x[n_exprs_genes > 0, ]

sce10x

class: SingleCellExperiment 
dim: 34559 25952 
metadata(42): tximetaInfo quantInfo ... txomeInfo txdbInfo
assays(3): counts spliced unspliced
rownames(34559): Gm1992 Gm37587 ... mt-Cytb mt-Nd6
rowData names(6): ensembl_gene_id_version external_gene_name ... description gene_name
colnames(25952): ATACCGATCACCTGGG_d1 GACTATGTCCGGCTTT_d1 ... AATTTCCTCATGGATC_g3 AAGCGTTAGAAATTCG_g3
colData names(16): sum detected ... high_mito markers
reducedDimNames(0):
altExpNames(0):

Save the single cell experiment objects

saveRDS(sce10x, file.path(data_dir, "preprocessed", "sce10x.rds"))

Step 5: Create diagnostic plots

Make and save plots

plots <- create_diag_plots(sce10x)

Saving 7 x 7 in image

plots

$p1

$p2

$p3

$p3

$p3

sessionInfo()

R version 4.0.0 (2020-04-24)
Platform: x86_64-pc-linux-gnu (64-bit)
Running under: Ubuntu 18.04.4 LTS

Matrix products: default
BLAS:   /usr/lib/x86_64-linux-gnu/blas/libblas.so.3.7.1
LAPACK: /usr/lib/x86_64-linux-gnu/lapack/liblapack.so.3.7.1

locale:
 [1] LC_CTYPE=en_US.UTF-8       LC_NUMERIC=C               LC_TIME=en_US.UTF-8        LC_COLLATE=en_US.UTF-8     LC_MONETARY=en_US.UTF-8   
 [6] LC_MESSAGES=en_US.UTF-8    LC_PAPER=en_US.UTF-8       LC_NAME=C                  LC_ADDRESS=C               LC_TELEPHONE=C            
[11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C       

attached base packages:
[1] parallel  stats4    stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
 [1] GenomicFeatures_1.40.0      AnnotationDbi_1.50.0        forcats_0.5.0               stringr_1.4.0               dplyr_0.8.5                
 [6] purrr_0.3.4                 readr_1.3.1                 tidyr_1.0.2                 tibble_3.0.1                tidyverse_1.3.0            
[11] biomaRt_2.44.0              alevinQC_1.4.0              scater_1.16.0               ggplot2_3.3.0               SingleCellExperiment_1.10.1
[16] SummarizedExperiment_1.18.1 DelayedArray_0.14.0         matrixStats_0.56.0          Biobase_2.48.0              GenomicRanges_1.40.0       
[21] GenomeInfoDb_1.24.0         IRanges_2.22.1              S4Vectors_0.26.0            BiocGenerics_0.34.0         rjson_0.2.20               
[26] tximeta_1.6.1              

loaded via a namespace (and not attached):
  [1] readxl_1.3.1                  backports_1.1.6               AnnotationHub_2.20.0          BiocFileCache_1.12.0         
  [5] plyr_1.8.6                    lazyeval_0.2.2                shinydashboard_0.7.1          BiocParallel_1.22.0          
  [9] digest_0.6.25                 ensembldb_2.12.0              htmltools_0.4.0               viridis_0.5.1                
 [13] fansi_0.4.1                   magrittr_1.5                  memoise_1.1.0                 Biostrings_2.56.0            
 [17] modelr_0.1.7                  askpass_1.1                   prettyunits_1.1.1             colorspace_1.4-1             
 [21] blob_1.2.1                    rvest_0.3.5                   rappdirs_0.3.1                haven_2.2.0                  
 [25] xfun_0.13                     crayon_1.3.4                  RCurl_1.98-1.2                jsonlite_1.6.1               
 [29] tximport_1.16.0               glue_1.4.0                    gtable_0.3.0                  zlibbioc_1.34.0              
 [33] XVector_0.28.0                BiocSingular_1.4.0            scales_1.1.0                  DBI_1.1.0                    
 [37] GGally_1.5.0                  Rcpp_1.0.4.6                  viridisLite_0.3.0             xtable_1.8-4                 
 [41] progress_1.2.2                bit_1.1-15.2                  rsvd_1.0.3                    DT_0.13                      
 [45] htmlwidgets_1.5.1             httr_1.4.1                    RColorBrewer_1.1-2            ellipsis_0.3.0               
 [49] farver_2.0.3                  pkgconfig_2.0.3               reshape_0.8.8                 XML_3.99-0.3                 
 [53] dbplyr_1.4.3                  labeling_0.3                  tidyselect_1.0.0              rlang_0.4.6                  
 [57] later_1.0.0                   munsell_0.5.0                 BiocVersion_3.11.1            cellranger_1.1.0             
 [61] tools_4.0.0                   cli_2.0.2                     generics_0.0.2                RSQLite_2.2.0                
 [65] broom_0.5.6                   evaluate_0.14                 fastmap_1.0.1                 yaml_2.2.1                   
 [69] knitr_1.28                    bit64_0.9-7                   fs_1.4.1                      AnnotationFilter_1.12.0      
 [73] nlme_3.1-147                  mime_0.9                      xml2_1.3.2                    compiler_4.0.0               
 [77] rstudioapi_0.11               beeswarm_0.2.3                curl_4.3                      interactiveDisplayBase_1.26.0
 [81] reprex_0.3.0                  stringi_1.4.6                 lattice_0.20-41               ProtGenerics_1.20.0          
 [85] Matrix_1.2-18                 vctrs_0.2.4                   pillar_1.4.3                  lifecycle_0.2.0              
 [89] BiocManager_1.30.10           BiocNeighbors_1.6.0           data.table_1.12.8             cowplot_1.0.0                
 [93] bitops_1.0-6                  irlba_2.3.3                   httpuv_1.5.2                  rtracklayer_1.48.0           
 [97] R6_2.4.1                      promises_1.1.0                gridExtra_2.3                 vipor_0.4.5                  
[101] assertthat_0.2.1              openssl_1.4.1                 rprojroot_1.3-2               withr_2.2.0                  
[105] GenomicAlignments_1.24.0      Rsamtools_2.4.0               GenomeInfoDbData_1.2.3        hms_0.5.3                    
[109] grid_4.0.0                    rmarkdown_2.1                 DelayedMatrixStats_1.10.0     base64enc_0.1-3              
[113] shiny_1.4.0.2                 lubridate_1.7.8               ggbeeswarm_0.6.0

LS0tCnRpdGxlOiAiTW91c2UgTXVzY2xlIFN0ZW0gQ2VsbCBQcm9qZWN0ICIKc3VidGl0bGU6ICJQYXJ0IDE6IGRhdGEgUUMgYW5kIHByZXByb2Nlc3NpbmcuIgphdXRob3I6IAotIG5hbWU6IFJpY2sgRmFyb3VuaQogIGFmZmlsaWF0aW9uOgogIC0gJmNydWsgR8Opbm9tZSBRdcOpYmVjIElubm92YXRpb24gQ2VudHJlLCBNY0dpbGwgVW5pdmVyc2l0eSwgTW9udHJlYWwsIENhbmFkYQpkYXRlOiAnYHIgZm9ybWF0KFN5cy5EYXRlKCksICIlWS0lQi0lZCIpYCcKb3V0cHV0OgogIGh0bWxfbm90ZWJvb2s6CiAgICBkZl9wcmludDogcGFnZWQKICAgIGNvZGVfZm9sZGluZzogc2hvdwogICAgdG9jOiBubwogICAgdG9jX2Zsb2F0OiAKICAgICAgY29sbGFwc2VkOiBmYWxzZQogICAgICBzbW9vdGhfc2Nyb2xsOiBmYWxzZQotLS0KCgojIFByZXBhcmUgYW5hbHlzaXMgd29ya2Zsb3cKCiMjIFNldCBmaWxlcGF0aHMgYW5kIHBhcmFtZXRlcnMKCmBgYHtyIHNldHVwfQpzZXQuc2VlZCg0MikKa25pdHI6Om9wdHNfa25pdCRzZXQocm9vdC5kaXIgPSBycHJvanJvb3Q6OmZpbmRfcnN0dWRpb19yb290X2ZpbGUoKSkKb3B0aW9ucygKICByZWFkci5zaG93X3Byb2dyZXNzID0gRkFMU0UsCiAgZGlnaXRzID0gMgopCmBgYAoKIyMgTG9hZCBwYWNrYWdlcwpgYGB7cn0Kc3VwcHJlc3NQYWNrYWdlU3RhcnR1cE1lc3NhZ2VzKHsKICBsaWJyYXJ5KHR4aW1ldGEpCiAgbGlicmFyeShyanNvbikKICBsaWJyYXJ5KHNjYXRlcikKICBsaWJyYXJ5KGFsZXZpblFDKQogIGxpYnJhcnkoYmlvbWFSdCkKICBsaWJyYXJ5KHRpZHl2ZXJzZSkKfSkKYGBgCgojIyBEZWZpbmUgZnVuY3Rpb25zCgpgYGB7cn0KY3JlYXRlX3FjX3JlcG9ydCA8LSBmdW5jdGlvbihzYW1wbGVfZGlyLCBzYW1wbGVfbmFtZSwgcmVwb3J0c19kaXIpIHsKICBjaGVja0FsZXZpbklucHV0RmlsZXMoc2FtcGxlX2RpcikKCiAgYWxldmluUUNSZXBvcnQoCiAgICBiYXNlRGlyID0gc2FtcGxlX2RpciwKICAgIHNhbXBsZUlkID0gc2FtcGxlX25hbWUsCiAgICBvdXRwdXRGaWxlID0gcGFzdGUwKHNhbXBsZV9uYW1lLCAiX2FsZXZpbl9yZXBvcnQuaHRtbCIpLAogICAgb3V0cHV0Rm9ybWF0ID0gImh0bWxfZG9jdW1lbnQiLAogICAgb3V0cHV0RGlyID0gcmVwb3J0c19kaXIsCiAgICBmb3JjZU92ZXJ3cml0ZSA9IFRSVUUKICApCn0KCmdldF9tYXJrZXJzIDwtIGZ1bmN0aW9uKHNjZTEweCkgewogIG1hY3JvcGhhZ2UgPC0KICAgIHdoaWNoKHJvd0RhdGEoc2NlMTB4KSRnZW5lX25hbWUgJWluJSBjKCJBZGdyZTEiLCAiUHRwcmMiLCAiSXRnYW0iKSkKICBzdGVtIDwtIHdoaWNoKHJvd0RhdGEoc2NlMTB4KSRnZW5lX25hbWUgJWluJSBjKCJQYXg3IikpCiAgIyBvdGhlciA8LSB3aGljaChyb3dEYXRhKHNjZTEweCkkZ2VuZV9uYW1lICVpbiUgYygiUGVjYW0xIikpCiAgZmFwIDwtIHdoaWNoKHJvd0RhdGEoc2NlMTB4KSRnZW5lX25hbWUgJWluJSBjKCJQZGdmcmEiKSkKCiAgbWFya2Vyc19kdCA8LQogICAgYXNzYXkoc2NlMTB4KVtjKHN0ZW0sIGZhcCwgbWFjcm9waGFnZSksIF0gJT4lCiAgICBhcy5kYXRhLmZyYW1lLm1hdHJpeCgpCiAgYmFyY29kZV9sYWJlbHMgPC0KICAgIGNvbG5hbWVzKG1hcmtlcnNfZHQpCgogIG5vX21hcmtlcnMgPC0KICAgIG1hcmtlcnNfZHQgJT4lCiAgICBzdW1tYXJpemVfYWxsKGxpc3QofiAoc3VtKC4pID09IDApKSkKCiAgbWFya2VycyA8LQogICAgbWFya2Vyc19kdCAlPiUKICAgIHN1bW1hcml6ZV9hbGwod2hpY2gubWF4KQoKICBtYXJrZXJzW3VubGlzdChub19tYXJrZXJzKV0gPC0gMEwKICBtYXJrZXJzIDwtCiAgICBtYXJrZXJzICU+JQogICAgZGF0YS50YWJsZTo6dHJhbnNwb3NlKCkgJT4lCiAgICBzZXRfbmFtZXMoIm1hcmtlciIpCgogIG1hcmtlcnMgPC0KICAgIG1hcmtlcnMgJT4lCiAgICBtdXRhdGUoCiAgICAgIG1hcmtlciA9IGNhc2Vfd2hlbigKICAgICAgICBtYXJrZXIgPT0gMEwgfiAibm9uZSIsCiAgICAgICAgbWFya2VyID09IDFMIH4gInN0ZW0iLAogICAgICAgIG1hcmtlciA9PSAyTCB+ICJmYXAiLAogICAgICAgIG1hcmtlciAlaW4lIGMoM0wsIDRMLCA1TCkgfiAibWFjcm9waGFnZSIKICAgICAgKQogICAgKSAlPiUKICAgIHB1bGwobWFya2VyKQogIHJldHVybihtYXJrZXJzKQp9CgoKYWRkX21ldGFkYXRhIDwtIGZ1bmN0aW9uKHNjZTEweCwgZ2VuZV9tZXRhZGF0YSwgc2FtcGxlX25hbWUsIG1pdG9fdGhyZXNoID0gMTUpIHsKICByb3dEYXRhKHNjZTEweCkgPC0KICAgIGdlbmVfbWV0YWRhdGEgJT4lCiAgICBsZWZ0X2pvaW4odGliYmxlKGVuc2VtYmxfZ2VuZV9pZF92ZXJzaW9uID0gcm93bmFtZXMoc2NlMTB4KSksCiAgICAgIC4sCiAgICAgIGJ5ID0gImVuc2VtYmxfZ2VuZV9pZF92ZXJzaW9uIgogICAgKSAlPiUKICAgIGRwbHlyOjpyZW5hbWUoY2hyID0gImNocm9tb3NvbWVfbmFtZSIpICU+JQogICAgbXV0YXRlKGdlbmVfbmFtZSA9IHVuaXF1aWZ5RmVhdHVyZU5hbWVzKAogICAgICBlbnNlbWJsX2dlbmVfaWRfdmVyc2lvbiwKICAgICAgZXh0ZXJuYWxfZ2VuZV9uYW1lCiAgICApKQogIHJvd25hbWVzKHNjZTEweCkgPC0gcm93RGF0YShzY2UxMHgpJGdlbmVfbmFtZQoKICBjb21iaW5lZF9tZXRyaWNzIDwtCiAgICBwZXJDZWxsUUNNZXRyaWNzKAogICAgICBzY2UxMHgsCiAgICAgIHN1YnNldHMgPSBsaXN0KG1pdG8gPSB3aGljaChyb3dEYXRhKHNjZTEweCkkY2hyID09CiAgICAgICAgIk1UIikpLAogICAgICBwZXJjZW50X3RvcCA9IGMoNTAwKSwKICAgICAgZXhwcnNfdmFsdWVzID0gYygiY291bnRzIiksCiAgICAgIGZsYXR0ZW4gPSBUUlVFCiAgICApICU+JQogICAgYXNfdGliYmxlKCkgJT4lCiAgICBkcGx5cjo6c2VsZWN0KC10b3RhbCkKCiAgc3BsaWNlZF9tZXRyaWNzIDwtCiAgICBwZXJDZWxsUUNNZXRyaWNzKAogICAgICBzY2UxMHgsCiAgICAgIGV4cHJzX3ZhbHVlcyA9IGMoInNwbGljZWQiKSwKICAgICAgcGVyY2VudF90b3AgPSBOVUxMLAogICAgICBmbGF0dGVuID0gVFJVRQogICAgKSAlPiUKICAgIGFzX3RpYmJsZSgpICU+JQogICAgZHBseXI6OnNlbGVjdCgtdG90YWwpICU+JQogICAgc2V0X25hbWVzKGMoInN1bV9zcGxpY2VkIiwgImRldGVjdGVkX3NwbGljZWQiKSkKCgogIHVuc3BsaWNlZF9tZXRyaWNzIDwtCiAgICBwZXJDZWxsUUNNZXRyaWNzKAogICAgICBzY2UxMHgsCiAgICAgIGV4cHJzX3ZhbHVlcyA9IGMoInVuc3BsaWNlZCIpLAogICAgICBwZXJjZW50X3RvcCA9IE5VTEwsCiAgICAgIGZsYXR0ZW4gPSBUUlVFCiAgICApICU+JQogICAgYXNfdGliYmxlKCkgJT4lCiAgICBkcGx5cjo6c2VsZWN0KC10b3RhbCkgJT4lCiAgICBzZXRfbmFtZXMoYygic3VtX3Vuc3BsaWNlZCIsICJkZXRlY3RlZF91bnNwbGljZWQiKSkKCiAgY291bnRzX2R0IDwtCiAgICBiaW5kX2NvbHMoCiAgICAgIGNvbWJpbmVkX21ldHJpY3MsCiAgICAgIHNwbGljZWRfbWV0cmljcywKICAgICAgdW5zcGxpY2VkX21ldHJpY3MKICAgICkgJT4lCiAgICBtdXRhdGUoCiAgICAgIHVuc3BsaWNlZF9vdl9zcGxpY2VkID0gc3VtX3Vuc3BsaWNlZCAvIHN1bV9zcGxpY2VkLAogICAgICB1bnNwbGljZWRfb3ZfdG90YWwgPSBzdW1fdW5zcGxpY2VkIC8gc3VtLAogICAgICBzYW1wbGUgPSBzYW1wbGVfbmFtZSwKICAgICAgY29uZGl0aW9uID0gY2FzZV93aGVuKAogICAgICAgIHN0cl9zdWIoc2FtcGxlLCAxLCAxKSA9PSAieSIgfiAieW5nIiwKICAgICAgICBzdHJfc3ViKHNhbXBsZSwgMSwgMSkgPT0gImEiIH4gImFnZWQiCiAgICAgICksCiAgICAgIGhpZ2hfbWl0byA9IGNvbWJpbmVkX21ldHJpY3Mkc3Vic2V0c19taXRvX3BlcmNlbnQgPiBtaXRvX3RocmVzaAogICAgKSAlPiUKICAgIERhdGFGcmFtZSguKQoKCiAgcm93bmFtZXMoY291bnRzX2R0KSA8LQogICAgcGFzdGUoY29sbmFtZXMoc2NlMTB4KSwKICAgICAgc3RyX3N1Yihjb3VudHNfZHQkc2FtcGxlLCBzdGFydCA9IC0yKSwKICAgICAgc2VwID0gIl8iCiAgICApCgogIGNvbERhdGEoc2NlMTB4KSA8LSBjb3VudHNfZHQKCgogIHJldHVybihzY2UxMHgpCn0KCmxvYWRfZGF0YSA8LSBmdW5jdGlvbihzYW1wbGVfbmFtZSwgc2FtcGxlX2Rpciwgc3BsaWNlZF91bnNwbGljZWQpIHsKICBjb2xfZGF0YSA8LQogICAgZGF0YS5mcmFtZSgKICAgICAgbmFtZXMgPSBzYW1wbGVfbmFtZSwKICAgICAgZmlsZXMgPSBmaWxlLnBhdGgoCiAgICAgICAgc2FtcGxlX2RpciwKICAgICAgICAiYWxldmluIiwKICAgICAgICAicXVhbnRzX21hdC5neiIKICAgICAgKSwKICAgICAgc3RyaW5nc0FzRmFjdG9ycyA9IEZBTFNFCiAgICApCgogIHNjZTEweCA8LQogICAgdHhpbWV0YTo6dHhpbWV0YSgKICAgICAgY29sZGF0YSA9IGNvbF9kYXRhLAogICAgICB0eXBlID0gImFsZXZpbiIKICAgICkKCiAgIyBzcGxpdCBpbnRvIHNwbGljZWQgYW5kIG5zcGxpY2VkIGFidW5kYW5jZXMgbWF0cmljZXMKCiAgc2NlMTB4IDwtCiAgICB0eGltZXRhOjpzcGxpdFNFKHNjZTEweCwKICAgICAgYXMuZGF0YS5mcmFtZShzcGxpY2VkX3Vuc3BsaWNlZCksCiAgICAgIGFzc2F5TmFtZSA9ICJjb3VudHMiCiAgICApCgogIHNjZTEweCA8LSBhcyhzY2UxMHgsICJTaW5nbGVDZWxsRXhwZXJpbWVudCIpCgogIGFzc2F5cyhzY2UxMHgpIDwtIGxpc3QoCiAgICBjb3VudHMgPSBhc3NheShzY2UxMHgsICJzcGxpY2VkIikgKyBhc3NheShzY2UxMHgsICJ1bnNwbGljZWQiKSwKICAgIHNwbGljZWQgPSBhc3NheShzY2UxMHgsICJzcGxpY2VkIiksCiAgICB1bnNwbGljZWQgPSBhc3NheShzY2UxMHgsICJ1bnNwbGljZWQiKQogICkKCiAgcmV0dXJuKHNjZTEweCkKfQoKY3JlYXRlX2RpYWdfcGxvdHMgPC0gZnVuY3Rpb24oc2NlMTB4KSB7CiAgcGxvdF9kdCA8LQogICAgY29sRGF0YShzY2UxMHgpICU+JQogICAgYXNfdGliYmxlKCkKCiAgcDEgPC0KICAgIGdncGxvdChwbG90X2R0KSArCiAgICBnZW9tX3BvaW50KGFlcyhzdW1fc3BsaWNlZCwKICAgICAgc3VtX3Vuc3BsaWNlZCwKICAgICAgY29sb3VyID0gc3Vic2V0c19taXRvX3BlcmNlbnQKICAgICksCiAgICBzaXplID0gMC4zLAogICAgYWxwaGEgPSAwLjMKICAgICkgKwogICAgc2NhbGVfeF9sb2cxMCgpICsKICAgIHNjYWxlX3lfbG9nMTAoKSArCiAgICAjIGdlb21fdmxpbmUoeGludGVyY2VwdCA9IHVubGlzdChtZXRyaWNzWzEwLDJdKSwgY29sb3IgPSAiZ3JlZW4iLCBsaW5ldHlwZSA9IDIpICsKICAgICMgZ2VvbV9obGluZSh5aW50ZXJjZXB0ID0gIHVubGlzdChtZXRyaWNzWzExLDJdKSwgY29sb3IgPSAiZ3JlZW4iLCBsaW5ldHlwZSA9IDIpICsKICAgIGZhY2V0X3dyYXAoc2FtcGxlIH4gLiwgbmNvbCA9IDIpCgogIHAyIDwtCiAgICBnZ3Bsb3QocGxvdF9kdCkgKwogICAgZ2VvbV9oaXN0b2dyYW0oYWVzKHVuc3BsaWNlZF9vdl90b3RhbCwgZmlsbCA9IG1hcmtlcnMpLCBiaW5zID0gMTUwKSArCiAgICBmYWNldF93cmFwKHNhbXBsZSB+IC4sIG5jb2wgPSAyKQoKCiAgcDMgPC0KICAgIGdncGxvdChjb2xEYXRhKHNjZTEweCkgJT4lCiAgICAgIGFzX3RpYmJsZSgpKSArCiAgICBnZW9tX2hpc3RvZ3JhbShhZXMoZGV0ZWN0ZWQpLCBiaW5zID0gMTUwKSArCiAgICBmYWNldF93cmFwKHNhbXBsZSB+IC4sIG5jb2wgPSAyKSArCiAgICBzY2FsZV94X2xvZzEwKCkgKwogICAgZ2VvbV92bGluZSh4aW50ZXJjZXB0ID0gYygzMDAsIDcwMDApLCBjb2xvciA9ICJncmVlbiIsIGxpbmV0eXBlID0gMikKCgogIHA0IDwtCiAgICBwbG90Q29sRGF0YShzY2UxMHgsCiAgICAgIHggPSAic3VtIiwKICAgICAgYnlfZXhwcnNfdmFsdWVzID0gImNvdW50cyIsCiAgICAgIHkgPSAiZGV0ZWN0ZWQiLAogICAgICBjb2xvdXJfYnkgPSAic3Vic2V0c19taXRvX3BlcmNlbnQiLAogICAgICBwb2ludF9zaXplID0gMQogICAgKSArCiAgICBzY2FsZV94X2xvZzEwKCkgKwogICAgc2NhbGVfeV9sb2cxMCgpICsKICAgIGZhY2V0X3dyYXAofiBjb2xEYXRhKHNjZTEweCkkc2FtcGxlLCBuY29sID0gMikgKwogICAgZ2VvbV92bGluZShhZXMoeGludGVyY2VwdCA9IDEwMDApLCBjb2xvciA9ICJncmVlbiIsIGxpbmV0eXBlID0gMikgKwogICAgZ2VvbV9obGluZShhZXMoeWludGVyY2VwdCA9IDUwMCksIGNvbG9yID0gImdyZWVuIiwgbGluZXR5cGUgPSAyKQoKCiAgcDUgPC0KICAgIHBsb3RTY2F0ZXIoc2NlMTB4LAogICAgICBuZmVhdHVyZXMgPSA1MDAsCiAgICAgIGJsb2NrMSA9ICJzYW1wbGUiLAogICAgICBuY29sID0gMiwKICAgICAgZXhwcnNfdmFsdWVzID0gImNvdW50cyIsCiAgICAgIGNvbG91cl9ieSA9ICJzdWJzZXRzX21pdG9fcGVyY2VudCIsCiAgICAgIGxpbmVfd2lkdGggPSAwLjIKICAgICkgKwogICAgZ2VvbV9obGluZShhZXMoeWludGVyY2VwdCA9IC45NSkpCgogIGdnc2F2ZShmaWxlLnBhdGgoZmlndXJlc19kaXIsICJzcGxpY2VkX3ZzX3Vuc3BsaWNlZF9zY2F0dGVyLnBkZiIpLCBwMSkKICBnZ3NhdmUoZmlsZS5wYXRoKGZpZ3VyZXNfZGlyLCAic3BsaWNlZF9vdl91bnNwbGljZWRfaGlzdG9ncmFtLnBkZiIpLCBwMikKICBnZ3NhdmUoZmlsZS5wYXRoKGZpZ3VyZXNfZGlyLCAiZGV0ZWN0ZWRfaGlzdG9ncmFtLnBkZiIpLCBwMykKICBnZ3NhdmUoZmlsZS5wYXRoKGZpZ3VyZXNfZGlyLCAic3VtX3ZzX2RldGVjdGVkLnBkZiIpLCBwNCkKICBnZ3NhdmUoZmlsZS5wYXRoKGZpZ3VyZXNfZGlyLCAiY3VtdWxhdGl2ZV9leHByZXNzaW9uLmpwZWciKSwgcDUpCgogIHJldHVybihsaXN0KHAxID0gcDEsIHAyID0gcDIsIHAzID0gcDMsIHAzID0gcDQsIHAzID0gcDUpKQp9CmBgYAoKIyMgRGVmaW5lIGZpbGUgcGF0aHMKCmBgYHtyfQpkYXRhX2RpciA8LSAiLi9kYXRhIgpzYWxtb25fZGlyIDwtIGZpbGUucGF0aChkYXRhX2RpciwgInNhbG1vbl9vdXQiKQpyZXBvcnRzX2RpciA8LSBmaWxlLnBhdGgoZGF0YV9kaXIsICJhbGV2aW5fcmVwb3J0cyIpCmZpZ3VyZXNfZGlyIDwtIGZpbGUucGF0aCgiLi9maWd1cmVzIiwgInFjX2NlbGxzIikKYGBgCgpgYGB7cn0KaW5kZXhfZGlyIDwtCiAgIi9ydW4vdXNlci8xMDAwL2d2ZnMvc2Z0cDpob3N0PWdyYWhhbS5jb21wdXRlY2FuYWRhLmNhLHVzZXI9cmZhcm91bmkvaG9tZS9yZmFyb3VuaS9wcm9qZWN0cy9ycmctaHNuL3JmYXJvdW5pL2RhdGEvc2FsbW9uX2luZGljZXMvbTI0L3NwbGljZWRfaW50cm9uc19jb2xsYXBzZWRfZmxhbms5MCIKanNvbl9maWxlIDwtCiAgZmlsZS5wYXRoKAogICAgZGF0YV9kaXIsCiAgICAibWV0YWRhdGEiLAogICAgImdlbmNvZGUudk0yNC5hbm5vdGF0aW9uLmV4cGFuZGVkLmpzb24iCiAgKQpnZW5lX2V4cGFuZGVkX2ZpbGUgPC0KICBmaWxlLnBhdGgoCiAgICBpbmRleF9kaXIsCiAgICAiZ2VuY29kZS52TTI0LmFubm90YXRpb24uZXhwYW5kZWQuZmVhdHVyZXMudHN2IgogICkKYGBgCgoKYGBge3J9Cmxpc3QuZmlsZXMoaW5kZXhfZGlyKQpgYGAKCiMjIyBEZWZpbmUgc2FtcGxlIG5hbWVzCgpgYGB7cn0Kc2FtcGxlX2RpcnMgPC0KICBsaXN0LmRpcnMoc2FsbW9uX2RpciwKICAgIGZ1bGwubmFtZXMgPSBULAogICAgcmVjdXJzaXZlID0gRkFMU0UKICApCgpzYW1wbGVfbmFtZXMgPC0gYygKICBwYXN0ZTAoImFnZWQiLCAxOjQpLAogIHBhc3RlMCgieW5nIiwgMTozKQopCnNhbXBsZV9uYW1lcwpgYGAKCiMgU3RlcCAxOiBHZW5lcmF0ZSBhbGV2aW4gc3VtbWFyeSBRQyByZXBvcnQgCgpgYGB7cn0KcHVycnI6Om1hcDIoc2FtcGxlX2RpcnMsCiAgc2FtcGxlX25hbWVzLAogIGNyZWF0ZV9xY19yZXBvcnQsCiAgcmVwb3J0c19kaXIgPSByZXBvcnRzX2RpcgopCmBgYAoKCiMgU3RlcCAyOiBHZXQgZ2VuZSBtZXRhZGF0YSAKCmBgYHtyfQpzcGxpY2VkX3Vuc3BsaWNlZCA8LQogIHJlYWRfdHN2KGdlbmVfZXhwYW5kZWRfZmlsZSkgJT4lCiAgZHBseXI6OnJlbmFtZSh1bnNwbGljZWQgPSAiaW50cm9uIikgIyBSZW5hbWUgdGhlICdpbnRyb24nIGNvbHVtbiAndW5zcGxpY2VkJyB0byBtYWtlIGl0IGNvbXBhdGlibGUgd2l0aCBzY1ZlbG8Kc3BsaWNlZF91bnNwbGljZWQKYGBgCgoKYGBge3J9Cm1hcnQgPC0KICB1c2VEYXRhc2V0KAogICAgIm1tdXNjdWx1c19nZW5lX2Vuc2VtYmwiLAogICAgdXNlTWFydCgiZW5zZW1ibCIpCiAgKQoKZ2VuZV9tZXRhZGF0YSA8LQogIGdldEJNKAogICAgZmlsdGVycyA9ICJlbnNlbWJsX2dlbmVfaWRfdmVyc2lvbiIsCiAgICBhdHRyaWJ1dGVzID0gYygKICAgICAgImVuc2VtYmxfZ2VuZV9pZF92ZXJzaW9uIiwKICAgICAgImV4dGVybmFsX2dlbmVfbmFtZSIsCiAgICAgICJnZW5lX2Jpb3R5cGUiLAogICAgICAiY2hyb21vc29tZV9uYW1lIiwKICAgICAgImRlc2NyaXB0aW9uIgogICAgKSwKICAgIHZhbHVlcyA9IHNwbGljZWRfdW5zcGxpY2VkJHNwbGljZWQsCiAgICBtYXJ0ID0gbWFydAogICkKZ2VuZV9tZXRhZGF0YQpgYGAKCiMgU3RlcCAzOiBJbXBvcnQgYWJ1bmRhbmNlcyBpbnRvIFIgd2l0aCB0eGltZXRhCgojIyBDcmVhdGUgYSBsaW5rZWQgdHJhbnNjcmlwdG9tZSB3aXRoIHR4aW1ldGEuCgoKYGBge3J9CnR4aW1ldGE6Om1ha2VMaW5rZWRUeG9tZSgKICBpbmRleERpciA9IGZpbGUucGF0aChpbmRleF9kaXIsICJnZW5jb2RlLnZNMjQuYW5ub3RhdGlvbi5leHBhbmRlZC5zaWR4IiksCiAgc291cmNlID0gIkdFTkNPREUiLAogIGdlbm9tZSA9ICJHUkNtMzgiLAogIG9yZ2FuaXNtID0gIk11cyBtdXNjdWx1cyIsCiAgcmVsZWFzZSA9ICJNMjQiLAogIGZhc3RhID0gZmlsZS5wYXRoKGluZGV4X2RpciwgImdlbmNvZGUudk0yNC5hbm5vdGF0aW9uLmV4cGFuZGVkLmZhIiksCiAgZ3RmID0gZmlsZS5wYXRoKGluZGV4X2RpciwgImdlbmNvZGUudk0yNC5hbm5vdGF0aW9uLmV4cGFuZGVkLmd0ZiIpLAogIHdyaXRlID0gVFJVRSwKICBqc29uRmlsZSA9IGpzb25fZmlsZQopCmBgYAoKYGBge3J9CnJqc29uOjpmcm9tSlNPTihmaWxlID0ganNvbl9maWxlKQpgYGAKCiMjIExvYWQgbGlua2VkIHRyYW5zY3JpcHRvbWUKCmBgYHtyfQp0eGltZXRhOjpsb2FkTGlua2VkVHhvbWUoanNvbl9maWxlKQpgYGAKCgojIFN0ZXAgNDogTG9hZCwgc3BsaXQsIGFuZCBhbm5vdGF0ZSBkYXRhCgpgYGB7cn0KbG9hZF9hbm5vdGF0ZV9kYXRhIDwtIGZ1bmN0aW9uKHNhbXBsZV9uYW1lLCBzYW1wbGVfZGlyLCBzcGxpY2VkX3Vuc3BsaWNlZCwgZ2VuZV9tZXRhZGF0YSkgewogIHNjZTEweCA8LSBsb2FkX2RhdGEoc2FtcGxlX25hbWUsIHNhbXBsZV9kaXIsIHNwbGljZWRfdW5zcGxpY2VkKQogIHNjZTEweCA8LSBhZGRfbWV0YWRhdGEoc2NlMTB4LCBnZW5lX21ldGFkYXRhLCBzYW1wbGVfbmFtZSkKICBjb2xEYXRhKHNjZTEweCkkbWFya2VycyA8LSBnZXRfbWFya2VycyhzY2UxMHgpCiAgcmV0dXJuKHNjZTEweCkKfQpgYGAKCmBgYHtyfQpzY2UxMHggPC0KICBtYXAyKHNhbXBsZV9uYW1lcywKICAgIHNhbXBsZV9kaXJzLAogICAgbG9hZF9hbm5vdGF0ZV9kYXRhLAogICAgc3BsaWNlZF91bnNwbGljZWQgPSBzcGxpY2VkX3Vuc3BsaWNlZCwKICAgIGdlbmVfbWV0YWRhdGEgPSBnZW5lX21ldGFkYXRhCiAgKQpgYGAKCiMjIENvbWJpbmUgdGhlIHNhbXBsZXMgaW50byBvbmUgc2NlIG9iamVjdAoKYGBge3J9CnNjZTEweCA8LSByZWR1Y2Uoc2NlMTB4LCBjYmluZCkKY29sRGF0YShzY2UxMHgpCmBgYAoKCmBgYHtyfQp0YWJsZShjb2xEYXRhKHNjZTEweCkkc2FtcGxlKQpgYGAKCmBgYHtyfQpuX2V4cHJzX2dlbmVzIDwtCiAgbmV4cHJzKHNjZTEweCwgYnlyb3cgPSBUUlVFLCBleHByc192YWx1ZXMgPSAiY291bnRzIikKc2NlMTB4IDwtIHNjZTEweFtuX2V4cHJzX2dlbmVzID4gMCwgXQpgYGAKYGBge3J9CnNjZTEweApgYGAKCiMjIFNhdmUgdGhlIHNpbmdsZSBjZWxsIGV4cGVyaW1lbnQgb2JqZWN0cwoKYGBge3J9CnNhdmVSRFMoc2NlMTB4LCBmaWxlLnBhdGgoZGF0YV9kaXIsICJwcmVwcm9jZXNzZWQiLCAic2NlMTB4LnJkcyIpKQpgYGAKCiMgU3RlcCA1OiBDcmVhdGUgZGlhZ25vc3RpYyBwbG90cwoKCgojIyBNYWtlIGFuZCBzYXZlIHBsb3RzCgpgYGB7ciBmaWcuaGVpZ2h0PTE2LCBmaWcud2lkdGg9MTJ9CnBsb3RzIDwtIGNyZWF0ZV9kaWFnX3Bsb3RzKHNjZTEweCkKcGxvdHMKYGBgCgoKCmBgYHtyfQpzZXNzaW9uSW5mbygpCmBgYAo=

Mouse Muscle Stem Cell Project

Part 1: data QC and preprocessing.

Rick Farouni

2020-May-05