Distribution of restriction sites in the human genome

Enzyme:  AciI               Longest uncut segments
Specificity:  CCGC               Repeats in uncut segments
Number of sites:  4109489               Genes in uncut segments
Mean distance between sites:  696 base pairs
Standard deviation:  1292 base pairs
Site density1436.2 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488054  chr15  NT_037852.6  1398375-1886429    0.01 % in   1 repeats    0.00 % in 0 genes
2   402279  chr6  NT_167244.1  2359915-2762194    0.01 % in   1 repeats    0.00 % in 0 genes
3   208207  chr6  NT_167244.1  4389909-4598116    0.17 % in   2 repeats    0.00 % in 0 genes
4   181454  chr6  NT_167244.1  3790351-3971805    0.64 % in   5 repeats    0.00 % in 0 genes
5   175114  chr6  NT_167244.1  3180303-3355417    0.07 % in   1 repeats    0.00 % in 0 genes
6   172322  chr6  NT_167247.1  4422103-4594425    0.10 % in   2 repeats    100.00 % in 1 genes
7   167885  chr6  NT_167249.1  2136321-2304206    1.31 % in   12 repeats    0.00 % in 0 genes
8   159542  chr6  NT_167248.1  521816-681358    0.15 % in   2 repeats    0.00 % in 0 genes
9   152522  chr9  NT_008470.19  21692304-21844826    0.71 % in   6 repeats    0.00 % in 0 genes
10   144417  chr6  NT_167244.1  2893104-3037521    0.42 % in   5 repeats    0.00 % in 0 genes
11   117861  chr6  NT_167245.1  2605838-2723699    0.34 % in   1 repeats    0.00 % in 0 genes
12   115802  chr6  NT_167247.1  1176485-1292287    1.02 % in   1 repeats    0.00 % in 0 genes
13   111949  chr6  NT_167244.1  586582-698531    4.29 % in   19 repeats    0.00 % in 0 genes
14   108947  chr6  NT_167245.1  137993-246940    0.92 % in   4 repeats    0.00 % in 0 genes
15   107981  chr6  NT_167247.1  2705580-2813561    6.58 % in   27 repeats    0.00 % in 0 genes
16   107314  chr6  NT_167244.1  1451394-1558708    2.51 % in   10 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488054  chr15  NT_037852.6  1398375-1886429    1       AT_rich (1) 
402279  chr6  NT_167244.1  2359915-2762194    1       AluSp (1) 
208207  chr6  NT_167244.1  4389909-4598116    2       AluSg/x (1)  AluJo (1) 
181454  chr6  NT_167244.1  3790351-3971805    5       MLT1H-int (1)  MER52D (1)  LTR19B (1) 
175114  chr6  NT_167244.1  3180303-3355417    1       AluSp (1) 
172322  chr6  NT_167247.1  4422103-4594425    2       MER11A (1)  AluSc (1) 
167885  chr6  NT_167249.1  2136321-2304206    12  8       L1MB8 (3)  AluSx (3)  MLT1A (1) 
159542  chr6  NT_167248.1  521816-681358    2       L1PREC2 (1)  HERVH-int (1) 
152522  chr9  NT_008470.19  21692304-21844826    4       LTR67B (2)  L2 (2)  MIR3 (1) 
10  144417  chr6  NT_167244.1  2893104-3037521    4       AluY (2)  (TCC)n (1)  AluSg1 (1) 
11  117861  chr6  NT_167245.1  2605838-2723699    1       L2a (1) 
12  115802  chr6  NT_167247.1  1176485-1292287    1       ERV3-16A3_I-int (1) 
13  111949  chr6  NT_167244.1  586582-698531    19  16       L1MA9 (3)  L1MC5 (2)  THE1D (1) 
14  108947  chr6  NT_167245.1  137993-246940    4       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 
15  107981  chr6  NT_167247.1  2705580-2813561    27  19       L1MEf (5)  HAL1 (3)  L1ME1 (2) 
16  107314  chr6  NT_167244.1  1451394-1558708    10  7       L1MA1 (3)  AluJb (2)  ERV3-16A3_I-int (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   172322       chr6  NT_167247.1  4422103-4594425    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011