import scanpy as sc
st_path = "data/spatial/V1_Mouse_Brain_Sagittal_Anterior_cortex.h5ad"
adata_vis = sc.read(st_path)
adata_vis

/home/robinkti/miniconda/envs/dissect_env_1/lib/python3.9/site-packages/anndata/_core/anndata.py:1830: UserWarning: Variable names are not unique. To make them unique, call `.var_names_make_unique`.
  utils.warn_names_duplicates("var")

AnnData object with n_obs × n_vars = 960 × 32285
    obs: 'in_tissue', 'array_row', 'array_col'
    var: 'gene_ids', 'feature_types', 'genome'
    uns: 'spatial'
    obsm: 'spatial'

av_samples = adata_vis.uns["spatial"].keys()
av_samples

dict_keys(['V1_Mouse_Brain_Sagittal_Anterior'])

sample_name = 'V1_Mouse_Brain_Sagittal_Anterior'
images = adata_vis.uns["spatial"][sample_name]["images"]
images["lowres"].shape, images["hires"].shape # Image arrays

((600, 600, 3), (1998, 2000, 3))

# Coordinates
adata_vis.obsm["spatial"]

array([[7950, 3163],
       [6917, 5678],
       [9257, 4241],
       ...,
       [5610, 3642],
       [5885, 4361],
       [6780, 5199]])

import scanpy as sc
sc_path = "data/scRNAseq/mouseBrainAllenInstitute_sc_sampled.h5ad"
adata = sc.read(sc_path)
adata

AnnData object with n_obs × n_vars = 1404 × 34617
    obs: 'Celltype', 'n_counts'

adata.X.max()

559532.0

import dissect

config = dissect.config

config

{'experiment_folder': '/home/user/experiment',
 'simulation_params': {'scdata': '/home/user/experiment/data.h5ad',
  'n_samples': None,
  'type': 'bulk',
  'celltype_col': 'celltype',
  'batch_col': None,
  'cells_per_sample': None,
  'downsample': None,
  'preprocess': None,
  'filter': {'min_genes': 200, 'min_cells': 3, 'mt_cutoff': 5, 'min_expr': 0},
  'concentration': None,
  'prop_sparse': 0.5,
  'generate_component_figures': True},
 'deconv_params': {'test_dataset': '../bulk.txt',
  'test_dataset_format': 'txt',
  'test_dataset_type': 'bulk',
  'duplicated': 'first',
  'normalize_simulated': 'cpm',
  'normalize_test': 'cpm',
  'var_cutoff': 0.1,
  'test_in_mix': None,
  'simulated': True,
  'sig_matrix': False,
  'mix': 'srm',
  'save_config': True,
  'network_params': {'n_hidden_layers': 4,
   'hidden_units': [512, 256, 128, 64],
   'hidden_activation': 'relu6',
   'output_activation': 'softmax',
   'loss': 'kldivergence',
   'n_steps': 5000,
   'lr': 1e-05,
   'batch_size': 64,
   'dropout': None,
   'n_steps_expr': 5000},
  'alpha_range': [0.1, 0.9],
  'normalization_per_batch': 'log1p-MinMax',
  'models': [1, 2, 3, 4, 5]}}

config["experiment_folder"] # this prints the current folder

'/home/user/experiment'

# we will set it to "tutorial_bulkRNAseq"

config["experiment_folder"] = "tutorial_visium"

config["simulation_params"]["scdata"] = "data/scRNAseq/mouseBrainAllenInstitute_sc_sampled.h5ad"
config["simulation_params"]["type"] = "st" # for spatial data
config["simulation_params"]["celltype_col"] = "Celltype"
config["simulation_params"]["n_samples"] = 1000 # By default, we simulate n (= 1000 times number of cell types) samples. Since, the number of cell types in this data is large (=23), for this tutorial, we shall simulate 6000 samples

# by default the single-cell data passes through following QC:
config["simulation_params"]["filter"]

{'min_genes': 200, 'min_cells': 3, 'mt_cutoff': 5, 'min_expr': 0}

dissect.simulate(config)

Number of batches in single-cell data is 1. If this is incorrect, please specify name of the batch column as in the single-cell data object (.obs)

100%|███████████████████████████████████████████████████████████████████████████████| 1000/1000 [00:02<00:00, 361.13it/s]

Datasets needed for tutorial¶

A note on the supported formats¶

Import DISSECT module¶

Set experiment folder¶

Do simulation¶

Mapping cells to spots¶