Distribution of restriction sites in the human genome

Enzyme:  Hpy99IV               Longest uncut segments
Specificity:  CCNNGG               Repeats in uncut segments
Number of sites:  10197731               Genes in uncut segments
Mean distance between sites:  280 base pairs
Standard deviation:  421 base pairs
Site density3564.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488290  chr15  NT_037852.6  1397762-1886052    0.05 % in   3 repeats    0.00 % in 0 genes
2   401595  chr6  NT_167244.1  2359922-2761517    0.01 % in   1 repeats    0.00 % in 0 genes
3   208563  chr6  NT_167244.1  4389513-4598076    0.33 % in   5 repeats    0.00 % in 0 genes
4   180528  chr6  NT_167244.1  3790076-3970604    0.11 % in   2 repeats    0.00 % in 0 genes
5   175389  chr6  NT_167244.1  3180253-3355642    0.19 % in   3 repeats    0.00 % in 0 genes
6   172709  chr6  NT_167247.1  4422025-4594734    0.28 % in   2 repeats    100.00 % in 1 genes
7   164867  chr6  NT_167249.1  2138483-2303350    0.04 % in   2 repeats    0.00 % in 0 genes
8   164566  chr6  NT_167247.1  1562827-1727393    0.11 % in   2 repeats    0.08 % in 1 genes
9   159652  chr6  NT_167248.1  521866-681518    0.21 % in   2 repeats    0.00 % in 0 genes
10   151186  chr9  NT_008470.19  21693226-21844412    0.07 % in   2 repeats    0.00 % in 0 genes
11   143007  chr6  NT_167244.1  2894517-3037524    0.09 % in   2 repeats    0.00 % in 0 genes
12   118456  chr6  NT_167245.1  2605172-2723628    0.90 % in   1 repeats    0.00 % in 0 genes
13   114700  chr6  NT_167247.1  1177582-1292282    0.07 % in   1 repeats    0.00 % in 0 genes
14   113878  chr6  NT_167246.1  3261022-3374900    0.16 % in   2 repeats    0.00 % in 0 genes
15   108014  chr6  NT_167245.1  138047-246061    0.10 % in   2 repeats    0.00 % in 0 genes
16   107724  chr6  NT_167244.1  587384-695108    2.52 % in   9 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488290  chr15  NT_037852.6  1397762-1886052    3       MIRc (1)  MIRb (1)  AT_rich (1) 
401595  chr6  NT_167244.1  2359922-2761517    1       AluSp (1) 
208563  chr6  NT_167244.1  4389513-4598076    5       (TTCC)n (1)  MER57-int (1)  AluY (1) 
180528  chr6  NT_167244.1  3790076-3970604    2       MER52D (1)  AluJb (1) 
175389  chr6  NT_167244.1  3180253-3355642    3       GC_rich (1)  Charlie4a (1)  AluSp (1) 
172709  chr6  NT_167247.1  4422025-4594734    2       MER11A (1)  AluSc (1) 
164867  chr6  NT_167249.1  2138483-2303350    2       L1MB8 (1)  AluSx (1) 
164566  chr6  NT_167247.1  1562827-1727393    2       MIR (1)  AluSq (1) 
159652  chr6  NT_167248.1  521866-681518    2       L1PREC2 (1)  HERVH-int (1) 
10  151186  chr9  NT_008470.19  21693226-21844412    2       MIR3 (1)  L1M5 (1) 
11  143007  chr6  NT_167244.1  2894517-3037524    2       AluY (1)  AluSg1 (1) 
12  118456  chr6  NT_167245.1  2605172-2723628    1       L2a (1) 
13  114700  chr6  NT_167247.1  1177582-1292282    1       ERV3-16A3_I-int (1) 
14  113878  chr6  NT_167246.1  3261022-3374900    2       MIRb (1)  AluSx (1) 
15  108014  chr6  NT_167245.1  138047-246061    2       MLT1E2 (1)  LTR12C (1) 
16  107724  chr6  NT_167244.1  587384-695108    7       L1MA9 (3)  MER77 (1)  L1PB1 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   172709       chr6  NT_167247.1  4422025-4594734    LOC100507722  hypothetical_protein_LOC100507722
8   164566       chr6  NT_167247.1  1562827-1727393    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011