Distribution of restriction sites in the human genome

Enzyme:  EcoO109I               Longest uncut segments
Specificity:  RGGNCCY               Repeats in uncut segments
Number of sites:  2320926               Genes in uncut segments
Mean distance between sites:  1232 base pairs
Standard deviation:  1879 base pairs
Site density 811.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   489004  chr15  NT_037852.6  1396667-1885671    0.18 % in   6 repeats    0.00 % in 0 genes
2   402017  chr6  NT_167244.1  2359503-2761520    0.08 % in   1 repeats    0.00 % in 0 genes
3   209499  chr6  NT_167244.1  4389631-4599130    0.71 % in   8 repeats    0.00 % in 0 genes
4   185731  chrY  NT_011875.12  8536349-8722080    72.35 % in   28 repeats    0.43 % in 1 genes
5   183968  chr6  NT_167244.1  3787656-3971624    0.99 % in   10 repeats    0.00 % in 0 genes
6   175987  chr6  NT_167244.1  3180070-3356057    0.23 % in   5 repeats    0.09 % in 1 genes
7   173502  chr6  NT_167247.1  4421892-4595394    0.66 % in   2 repeats    100.00 % in 1 genes
8   170082  chr6  NT_167249.1  2136527-2306609    2.40 % in   17 repeats    0.00 % in 0 genes
9   159618  chr6  NT_167248.1  521877-681495    0.19 % in   2 repeats    0.00 % in 0 genes
10   158491  chr7  NT_023603.5  33360-191851    100.00 % in   2 repeats    0.00 % in 0 genes
11   151760  chr9  NT_008470.19  21691916-21843676    0.67 % in   5 repeats    0.00 % in 0 genes
12   149296  chr6  NT_167244.1  2891709-3041005    3.24 % in   25 repeats    0.00 % in 0 genes
13   119937  chr6  NT_167245.1  2604375-2724312    1.66 % in   6 repeats    0.00 % in 0 genes
14   117650  chr5  NW_003315917.1  1145800-1263450    6.30 % in   31 repeats    0.00 % in 0 genes
15   114888  chr6  NT_167247.1  1177471-1292359    0.17 % in   1 repeats    0.00 % in 0 genes
16   114161  chr6  NT_167246.1  3261229-3375390    0.41 % in   3 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
489004  chr15  NT_037852.6  1396667-1885671    6       MIRc (1)  MIRb (1)  L1M3 (1) 
402017  chr6  NT_167244.1  2359503-2761520    1       AluSp (1) 
209499  chr6  NT_167244.1  4389631-4599130    7       AluSx (2)  (TTCC)n (1)  MER57-int (1) 
185731  chrY  NT_011875.12  8536349-8722080    28  13       LTR12B (10)  L1PA16 (6)  L1PA8 (2) 
183968  chr6  NT_167244.1  3787656-3971624    10  9       AT_rich (2)  MLT1H-int (1)  MIR (1) 
175987  chr6  NT_167244.1  3180070-3356057    4       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
173502  chr6  NT_167247.1  4421892-4595394    2       MER11A (1)  AluSc (1) 
170082  chr6  NT_167249.1  2136527-2306609    17  9       Charlie2b (4)  AluSx (4)  L1MB8 (3) 
159618  chr6  NT_167248.1  521877-681495    2       L1PREC2 (1)  HERVH-int (1) 
10  158491  chr7  NT_023603.5  33360-191851    2       L1PA2 (1)  ALR/Alpha (1) 
11  151760  chr9  NT_008470.19  21691916-21843676    4       LTR67B (2)  MSTA (1)  MIR3 (1) 
12  149296  chr6  NT_167244.1  2891709-3041005    25  13       L1MC5 (6)  AluY (3)  AluSc (3) 
13  119937  chr6  NT_167245.1  2604375-2724312    6       MLT1N2 (1)  MLT1E2 (1)  MER5B (1) 
14  117650  chr5  NW_003315917.1  1145800-1263450    31  20       AT_rich (6)  AluSg (3)  Tigger3c (2) 
15  114888  chr6  NT_167247.1  1177471-1292359    1       ERV3-16A3_I-int (1) 
16  114161  chr6  NT_167246.1  3261229-3375390    2       MIRb (2)  AluSx (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   185731       chrY  NT_011875.12  8536349-8722080    ZNF884P 
6   175987       chr6  NT_167244.1  3180070-3356057    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   173502       chr6  NT_167247.1  4421892-4595394    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011