Distribution of restriction sites in the human genome

Enzyme:  AteTI               Longest uncut segments
Specificity:  GGGRAG               Repeats in uncut segments
Number of sites:  4053941               Genes in uncut segments
Mean distance between sites:  705 base pairs
Standard deviation:  958 base pairs
Site density1416.8 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   487518  chr15  NT_037852.6  1398537-1886055    0.01 % in   1 repeats    0.00 % in 0 genes
2   402326  chr6  NT_167244.1  2358931-2761257    0.18 % in   3 repeats    0.00 % in 0 genes
3   209775  chr6  NT_167244.1  4389778-4599553    0.70 % in   8 repeats    0.00 % in 0 genes
4   180322  chr6  NT_167244.1  3790318-3970640    0.04 % in   2 repeats    0.00 % in 0 genes
5   175253  chr6  NT_167244.1  3180159-3355412    0.11 % in   3 repeats    0.04 % in 1 genes
6   172601  chr6  NT_167247.1  4421910-4594511    0.15 % in   2 repeats    100.00 % in 1 genes
7   166829  chr6  NT_167249.1  2137598-2304427    0.89 % in   8 repeats    0.00 % in 0 genes
8   160521  chr6  NT_167248.1  521870-682391    0.75 % in   2 repeats    0.00 % in 0 genes
9   151523  chr9  NT_008470.19  21693311-21844834    0.25 % in   3 repeats    0.00 % in 0 genes
10   143280  chr6  NT_167244.1  2894503-3037783    0.27 % in   4 repeats    0.00 % in 0 genes
11   117484  chr6  NT_167245.1  2606158-2723642    0.07 % in   1 repeats    0.00 % in 0 genes
12   115413  chr6  NT_167247.1  1176912-1292325    0.65 % in   1 repeats    0.00 % in 0 genes
13   114800  chr6  NT_167246.1  3261219-3376019    0.55 % in   4 repeats    0.00 % in 0 genes
14   109674  chr6  NT_167245.1  137816-247490    1.45 % in   6 repeats    0.00 % in 0 genes
15   106021  chr6  NT_167244.1  1451149-1557170    1.29 % in   5 repeats    0.00 % in 0 genes
16   105842  chr6  NT_167244.1  588448-694290    1.30 % in   7 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
487518  chr15  NT_037852.6  1398537-1886055    1       AT_rich (1) 
402326  chr6  NT_167244.1  2358931-2761257    3       L4 (1)  AluSp (1)  AluJb (1) 
209775  chr6  NT_167244.1  4389778-4599553    7       AluSx (2)  (TTCC)n (1)  L1PA15 (1) 
180322  chr6  NT_167244.1  3790318-3970640    2       MLT1H-int (1)  MER52D (1) 
175253  chr6  NT_167244.1  3180159-3355412    3       GC_rich (1)  (CCG)n (1)  AluSp (1) 
172601  chr6  NT_167247.1  4421910-4594511    2       MER11A (1)  AluSc (1) 
166829  chr6  NT_167249.1  2137598-2304427    4       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
160521  chr6  NT_167248.1  521870-682391    2       L1PREC2 (1)  HERVH-int (1) 
151523  chr9  NT_008470.19  21693311-21844834    2       L2 (2)  MIR3 (1) 
10  143280  chr6  NT_167244.1  2894503-3037783    4       L1MC5 (1)  AluY (1)  AluSg1 (1) 
11  117484  chr6  NT_167245.1  2606158-2723642    1       L2a (1) 
12  115413  chr6  NT_167247.1  1176912-1292325    1       ERV3-16A3_I-int (1) 
13  114800  chr6  NT_167246.1  3261219-3376019    3       MIRb (2)  L2a (1)  AluSx (1) 
14  109674  chr6  NT_167245.1  137816-247490    6       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 
15  106021  chr6  NT_167244.1  1451149-1557170    5       L1MA1 (1)  ERV3-16A3_I-int (1)  AT_rich (1) 
16  105842  chr6  NT_167244.1  588448-694290    5       L1MA9 (3)  L1PB1 (1)  L1P5 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   175253       chr6  NT_167244.1  3180159-3355412    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   172601       chr6  NT_167247.1  4421910-4594511    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011