Distribution of restriction sites in the human genome

Enzyme:  PpuMI               Longest uncut segments
Specificity:  RGGWCCY               Repeats in uncut segments
Number of sites:  1078310               Genes in uncut segments
Mean distance between sites:  2653 base pairs
Standard deviation:  3462 base pairs
Site density 376.9 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   503567  chr15  NT_037852.6  1396667-1900234    1.13 % in   31 repeats    1.42 % in 1 genes
2   404124  chr6  NT_167244.1  2357497-2761621    0.52 % in   9 repeats    0.00 % in 0 genes
3   209499  chr6  NT_167244.1  4389631-4599130    0.71 % in   8 repeats    0.00 % in 0 genes
4   195304  chrY  NT_011875.12  8536349-8731653    72.85 % in   54 repeats    0.41 % in 1 genes
5   184008  chr6  NT_167244.1  3787656-3971664    1.01 % in   10 repeats    0.00 % in 0 genes
6   177100  chr6  NT_167244.1  3179848-3356948    0.41 % in   6 repeats    0.64 % in 2 genes
7   173502  chr6  NT_167247.1  4421892-4595394    0.66 % in   2 repeats    100.00 % in 1 genes
8   170082  chr6  NT_167249.1  2136527-2306609    2.40 % in   17 repeats    0.00 % in 0 genes
9   164622  chr6  NT_167247.1  1562083-1726705    0.08 % in   2 repeats    0.00 % in 0 genes
10   161162  chr7  NT_023603.5  33360-194522    100.00 % in   3 repeats    0.00 % in 0 genes
11   159618  chr6  NT_167248.1  521877-681495    0.19 % in   2 repeats    0.00 % in 0 genes
12   153045  chr9  NT_008470.19  21690631-21843676    1.22 % in   8 repeats    0.00 % in 0 genes
13   149335  chr6  NT_167244.1  2891709-3041044    3.24 % in   25 repeats    0.00 % in 0 genes
14   127576  chr6  NT_167244.1  3486973-3614549    8.90 % in   36 repeats    0.00 % in 0 genes
15   119937  chr6  NT_167245.1  2604375-2724312    1.66 % in   6 repeats    0.00 % in 0 genes
16   117817  chr5  NW_003315917.1  1145633-1263450    6.29 % in   31 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
503567  chr15  NT_037852.6  1396667-1900234    31  21       (TA)n (3)  L2a (3)  AT_rich (3) 
404124  chr6  NT_167244.1  2357497-2761621    7       L4 (2)  AluJb (2)  MER8 (1) 
209499  chr6  NT_167244.1  4389631-4599130    7       AluSx (2)  (TTCC)n (1)  MER57-int (1) 
195304  chrY  NT_011875.12  8536349-8731653    54  27       LTR12B (10)  L1PA16 (7)  L1ME3A (6) 
184008  chr6  NT_167244.1  3787656-3971664    10  9       AT_rich (2)  MLT1H-int (1)  MIR (1) 
177100  chr6  NT_167244.1  3179848-3356948    5       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
173502  chr6  NT_167247.1  4421892-4595394    2       MER11A (1)  AluSc (1) 
170082  chr6  NT_167249.1  2136527-2306609    17  9       Charlie2b (4)  AluSx (4)  L1MB8 (3) 
164622  chr6  NT_167247.1  1562083-1726705    2       L1MC3 (1)  A-rich (1) 
10  161162  chr7  NT_023603.5  33360-194522    2       L1PA2 (2)  ALR/Alpha (1) 
11  159618  chr6  NT_167248.1  521877-681495    2       L1PREC2 (1)  HERVH-int (1) 
12  153045  chr9  NT_008470.19  21690631-21843676    6       LTR67B (2)  L1M4b (2)  MSTA (1) 
13  149335  chr6  NT_167244.1  2891709-3041044    25  13       L1MC5 (6)  AluY (3)  AluSc (3) 
14  127576  chr6  NT_167244.1  3486973-3614549    36  17       AluSx (7)  AluSg (5)  L1M2 (4) 
15  119937  chr6  NT_167245.1  2604375-2724312    6       MLT1N2 (1)  MLT1E2 (1)  MER5B (1) 
16  117817  chr5  NW_003315917.1  1145633-1263450    31  20       AT_rich (6)  AluSg (3)  Tigger3c (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   503567       chr15  NT_037852.6  1396667-1900234    LOC100418897 
4   195304       chrY  NT_011875.12  8536349-8731653    ZNF884P 
6   177100       chr6  NT_167244.1  3179848-3356948    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
7   173502       chr6  NT_167247.1  4421892-4595394    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011