Distribution of restriction sites in the human genome

Enzyme:  TstI               Longest uncut segments
Specificity:  CACNNNNNNTCC               Repeats in uncut segments
Number of sites:  1632364               Genes in uncut segments
Mean distance between sites:  1752 base pairs
Standard deviation:  1985 base pairs
Site density 570.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488626  chr15  NT_037852.6  1396580-1885206    0.18 % in   6 repeats    0.00 % in 0 genes
2   402581  chr6  NT_167244.1  2358979-2761560    0.17 % in   3 repeats    0.00 % in 0 genes
3   239028  chrY  NT_011875.12  8441891-8680919    79.00 % in   14 repeats    0.00 % in 0 genes
4   208295  chr6  NT_167244.1  4389899-4598194    0.19 % in   3 repeats    0.00 % in 0 genes
5   183190  chr6  NT_167244.1  3787751-3970941    0.63 % in   7 repeats    0.00 % in 0 genes
6   175713  chr6  NT_167244.1  3179917-3355630    0.24 % in   5 repeats    0.18 % in 1 genes
7   173675  chr6  NT_167247.1  4421755-4595430    0.68 % in   3 repeats    100.00 % in 1 genes
8   166159  chr6  NT_167249.1  2137285-2303444    0.52 % in   5 repeats    0.00 % in 0 genes
9   165648  chr6  NT_167247.1  1561325-1726973    0.53 % in   2 repeats    0.00 % in 0 genes
10   161406  chr6  NT_167248.1  520271-681677    1.30 % in   2 repeats    0.00 % in 0 genes
11   159767  chr9  NT_008470.19  21686407-21846174    3.63 % in   18 repeats    0.00 % in 0 genes
12   158910  chr7  NT_023603.5  32242-191152    100.00 % in   3 repeats    0.00 % in 0 genes
13   143222  chr6  NT_167244.1  2894588-3037810    0.28 % in   4 repeats    0.00 % in 0 genes
14   119588  chr1  NT_077389.3  268691-388279    99.52 % in   52 repeats    0.00 % in 0 genes
15   118167  chr6  NT_167245.1  2606113-2724280    0.54 % in   3 repeats    0.00 % in 0 genes
16   117575  chr6  NT_167246.1  3259965-3377540    1.91 % in   14 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488626  chr15  NT_037852.6  1396580-1885206    6       MIRc (1)  MIRb (1)  L1M3 (1) 
402581  chr6  NT_167244.1  2358979-2761560    3       L4 (1)  AluSp (1)  AluJb (1) 
239028  chrY  NT_011875.12  8441891-8680919    14  2       LTR12B (13)  LTR12D (1) 
208295  chr6  NT_167244.1  4389899-4598194    3       AluSx (1)  AluSg/x (1)  AluJo (1) 
183190  chr6  NT_167244.1  3787751-3970941    6       AT_rich (2)  MLT1H-int (1)  MIR (1) 
175713  chr6  NT_167244.1  3179917-3355630    4       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
173675  chr6  NT_167247.1  4421755-4595430    3       MER11A (1)  AluSg/x (1)  AluSc (1) 
166159  chr6  NT_167249.1  2137285-2303444    5       L1MC4a (1)  L1MB8 (1)  AT_rich (1) 
165648  chr6  NT_167247.1  1561325-1726973    2       L1MC3 (1)  A-rich (1) 
10  161406  chr6  NT_167248.1  520271-681677    2       L1PREC2 (1)  HERVH-int (1) 
11  159767  chr9  NT_008470.19  21686407-21846174    18  12       MER5B (2)  LTR67B (2)  L2 (2) 
12  158910  chr7  NT_023603.5  32242-191152    2       L1PA2 (2)  ALR/Alpha (1) 
13  143222  chr6  NT_167244.1  2894588-3037810    4       L1MC5 (1)  AluY (1)  AluSg1 (1) 
14  119588  chr1  NT_077389.3  268691-388279    52  1       ALR/Alpha (52) 
15  118167  chr6  NT_167245.1  2606113-2724280    3       MLT1E2 (1)  L2a (1)  L2 (1) 
16  117575  chr6  NT_167246.1  3259965-3377540    14  10       AluSx (3)  MIRb (2)  L1MC5 (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   175713       chr6  NT_167244.1  3179917-3355630    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   173675       chr6  NT_167247.1  4421755-4595430    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011