Distribution of restriction sites in the human genome

Enzyme:  BtsIB               Longest uncut segments
Specificity:  GCAGTG               Repeats in uncut segments
Number of sites:  2943388               Genes in uncut segments
Mean distance between sites:  972 base pairs
Standard deviation:  1246 base pairs
Site density1028.7 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494070  chr15  NT_037852.6  1397381-1891451    0.74 % in   18 repeats    0.00 % in 0 genes
2   402911  chr6  NT_167244.1  2358897-2761808    0.19 % in   3 repeats    0.00 % in 0 genes
3   208732  chr6  NT_167244.1  4389976-4598708    0.39 % in   5 repeats    0.00 % in 0 genes
4   180622  chr6  NT_167244.1  3790330-3970952    0.18 % in   3 repeats    0.00 % in 0 genes
5   176961  chr6  NT_167244.1  3178465-3355426    0.25 % in   6 repeats    0.99 % in 1 genes
6   173822  chr6  NT_167247.1  4421675-4595497    0.72 % in   3 repeats    100.00 % in 1 genes
7   169035  chr6  NT_167247.1  1561176-1730211    1.57 % in   10 repeats    1.05 % in 1 genes
8   167352  chr6  NT_167248.1  520112-687464    3.70 % in   3 repeats    0.00 % in 0 genes
9   165457  chr6  NT_167249.1  2137906-2303363    0.14 % in   4 repeats    0.00 % in 0 genes
10   151453  chr9  NT_008470.19  21692905-21844358    0.28 % in   2 repeats    0.00 % in 0 genes
11   143551  chr6  NT_167244.1  2894198-3037749    0.28 % in   5 repeats    0.00 % in 0 genes
12   135591  chrY  NT_011875.12  8524153-8659744    63.07 % in   6 repeats    0.00 % in 0 genes
13   119757  chr1  NT_077389.3  259265-379022    96.91 % in   60 repeats    0.00 % in 0 genes
14   118403  chr6  NT_167245.1  2606063-2724466    0.73 % in   4 repeats    0.00 % in 0 genes
15   115662  chr6  NT_167247.1  1176827-1292489    0.72 % in   1 repeats    0.00 % in 0 genes
16   115393  chr6  NT_167246.1  3259470-3374863    0.29 % in   3 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494070  chr15  NT_037852.6  1397381-1891451    18  15       L2a (3)  L1M5 (2)  U2 (1) 
402911  chr6  NT_167244.1  2358897-2761808    3       L4 (1)  AluSp (1)  AluJb (1) 
208732  chr6  NT_167244.1  4389976-4598708    4       AluSx (2)  L1MC (1)  AluSg/x (1) 
180622  chr6  NT_167244.1  3790330-3970952    3       MLT1H-int (1)  MER52D (1)  AluSc (1) 
176961  chr6  NT_167244.1  3178465-3355426    4       GC_rich (3)  L2a (1)  (CCG)n (1) 
173822  chr6  NT_167247.1  4421675-4595497    3       MER11A (1)  AluSg/x (1)  AluSc (1) 
169035  chr6  NT_167247.1  1561176-1730211    10  8       MIR (2)  L1MEe (2)  MIRc (1) 
167352  chr6  NT_167248.1  520112-687464    3       L1PREC2 (1)  HERVH-int (1)  AT_rich (1) 
165457  chr6  NT_167249.1  2137906-2303363    4       L1MC4a (1)  L1MB8 (1)  AT_rich (1) 
10  151453  chr9  NT_008470.19  21692905-21844358    2       MIR3 (1)  L1M5 (1) 
11  143551  chr6  NT_167244.1  2894198-3037749    5       L1MC5 (1)  AluY (1)  AluSg1 (1) 
12  135591  chrY  NT_011875.12  8524153-8659744    1       LTR12B (6) 
13  119757  chr1  NT_077389.3  259265-379022    60  11       ALR/Alpha (48)  MLT1J (2)  L1MB1 (2) 
14  118403  chr6  NT_167245.1  2606063-2724466    3       L2 (2)  MLT1E2 (1)  L2a (1) 
15  115662  chr6  NT_167247.1  1176827-1292489    1       ERV3-16A3_I-int (1) 
16  115393  chr6  NT_167246.1  3259470-3374863    3       MIRb (1)  MIR3 (1)  AluSx (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   176961       chr6  NT_167244.1  3178465-3355426    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   173822       chr6  NT_167247.1  4421675-4595497    LOC100507722  hypothetical_protein_LOC100507722
7   169035       chr6  NT_167247.1  1561176-1730211    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011