Distribution of restriction sites in the human genome

Enzyme:  Eco31I               Longest uncut segments
Specificity:  GGTCTC               Repeats in uncut segments
Number of sites:  1648231               Genes in uncut segments
Mean distance between sites:  1736 base pairs
Standard deviation:  2130 base pairs
Site density 576.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   489786  chr15  NT_037852.6  1397220-1887006    0.15 % in   6 repeats    0.00 % in 0 genes
2   402806  chr6  NT_167244.1  2358869-2761675    0.20 % in   3 repeats    0.00 % in 0 genes
3   211809  chr6  NT_167244.1  4386081-4597890    1.77 % in   10 repeats    0.00 % in 0 genes
4   185160  chr7  NT_023603.5  35411-220571    100.00 % in   6 repeats    0.00 % in 0 genes
5   182370  chr6  NT_167244.1  3788652-3971022    0.55 % in   8 repeats    0.00 % in 0 genes
6   178338  chr6  NT_167244.1  3178131-3356469    0.47 % in   9 repeats    1.33 % in 2 genes
7   172762  chr6  NT_167247.1  4422019-4594781    0.31 % in   2 repeats    100.00 % in 1 genes
8   171480  chr6  NT_167247.1  1560377-1731857    1.92 % in   16 repeats    1.50 % in 1 genes
9   166666  chr6  NT_167248.1  516687-683353    4.41 % in   3 repeats    0.00 % in 0 genes
10   165262  chr6  NT_167249.1  2138272-2303534    0.19 % in   3 repeats    0.00 % in 0 genes
11   151039  chr9  NT_008470.19  21692437-21843476    0.44 % in   2 repeats    0.00 % in 0 genes
12   143664  chr6  NT_167244.1  2894037-3037701    0.36 % in   5 repeats    0.00 % in 0 genes
13   118651  chr6  NT_167245.1  2604973-2723624    1.00 % in   2 repeats    0.00 % in 0 genes
14   116647  chr6  NT_167247.1  1175749-1292396    1.64 % in   2 repeats    0.00 % in 0 genes
15   115429  chr6  NT_167246.1  3259406-3374835    0.26 % in   3 repeats    0.00 % in 0 genes
16   112449  chr6  NT_025741.15  72110812-72223261    2.68 % in   13 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
489786  chr15  NT_037852.6  1397220-1887006    6       MLT1L (1)  MIRc (1)  MIRb (1) 
402806  chr6  NT_167244.1  2358869-2761675    3       L4 (1)  AluSp (1)  AluJb (1) 
211809  chr6  NT_167244.1  4386081-4597890    10  7       MER57-int (3)  AluY (2)  (TTTTA)n (1) 
185160  chr7  NT_023603.5  35411-220571    3       ALR/Alpha (3)  L1PA2 (2)  L1PA3 (1) 
182370  chr6  NT_167244.1  3788652-3971022    7       AT_rich (2)  MLT1H-int (1)  MIR (1) 
178338  chr6  NT_167244.1  3178131-3356469    7       GC_rich (3)  LTR23 (1)  L2a (1) 
172762  chr6  NT_167247.1  4422019-4594781    2       MER11A (1)  AluSc (1) 
171480  chr6  NT_167247.1  1560377-1731857    16  13       Tigger7 (2)  MIR (2)  L1MEe (2) 
166666  chr6  NT_167248.1  516687-683353    3       LTR7 (1)  L1PREC2 (1)  HERVH-int (1) 
10  165262  chr6  NT_167249.1  2138272-2303534    3       L1MB8 (1)  AT_rich (1)  AluSx (1) 
11  151039  chr9  NT_008470.19  21692437-21843476    2       LTR67B (1)  L1M5 (1) 
12  143664  chr6  NT_167244.1  2894037-3037701    5       L1MC5 (1)  AluY (1)  AluSg1 (1) 
13  118651  chr6  NT_167245.1  2604973-2723624    2       MER5A1 (1)  L2a (1) 
14  116647  chr6  NT_167247.1  1175749-1292396    1       ERV3-16A3_I-int (2) 
15  115429  chr6  NT_167246.1  3259406-3374835    3       MIRb (1)  MIR3 (1)  AluSx (1) 
16  112449  chr6  NT_025741.15  72110812-72223261    13  11       (TG)n (3)  (TTCA)n (1)  (TATG)n (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   178338       chr6  NT_167244.1  3178131-3356469    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
7   172762       chr6  NT_167247.1  4422019-4594781    LOC100507722  hypothetical_protein_LOC100507722
8   171480       chr6  NT_167247.1  1560377-1731857    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011