Distribution of restriction sites in the human genome

Enzyme:  Mae7806I               Longest uncut segments
Specificity:  AAGGAG               Repeats in uncut segments
Number of sites:  2298627               Genes in uncut segments
Mean distance between sites:  1244 base pairs
Standard deviation:  1373 base pairs
Site density 803.3 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   402657  chr6  NT_167244.1  2359159-2761816    0.13 % in   2 repeats    0.00 % in 0 genes
2   210409  chr6  NT_167244.1  4389787-4600196    0.75 % in   9 repeats    0.00 % in 0 genes
3   180954  chr6  NT_167244.1  3789652-3970606    0.16 % in   2 repeats    0.00 % in 0 genes
4   175792  chr6  NT_167247.1  4420371-4596163    1.23 % in   10 repeats    100.00 % in 1 genes
5   175368  chr6  NT_167244.1  3180297-3355665    0.18 % in   2 repeats    0.00 % in 0 genes
6   166374  chr6  NT_167249.1  2138041-2304415    0.66 % in   7 repeats    0.00 % in 0 genes
7   165170  chr6  NT_167247.1  1562480-1727650    0.29 % in   4 repeats    0.29 % in 1 genes
8   161074  chr6  NT_167248.1  521686-682760    1.10 % in   2 repeats    0.00 % in 0 genes
9   150549  chr9  NT_008470.19  21692893-21843442    0.25 % in   1 repeats    0.00 % in 0 genes
10   145741  chr6  NT_167244.1  2894330-3040071    1.74 % in   15 repeats    0.00 % in 0 genes
11   118570  chr6  NT_167245.1  2605886-2724456    0.87 % in   4 repeats    0.00 % in 0 genes
12   116312  chr6  NT_167247.1  1176874-1293186    0.68 % in   1 repeats    0.00 % in 0 genes
13   115120  chr6  NT_167246.1  3260633-3375753    0.41 % in   3 repeats    0.00 % in 0 genes
14   111093  chr6  NT_167245.1  136636-247729    2.71 % in   8 repeats    0.00 % in 0 genes
15   106055  chr6  NT_167244.1  1450785-1556840    1.00 % in   3 repeats    0.00 % in 0 genes
16   105857  chr6  NT_167244.1  1832365-1938222    0.65 % in   4 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
402657  chr6  NT_167244.1  2359159-2761816    2       L4 (1)  AluSp (1) 
210409  chr6  NT_167244.1  4389787-4600196    8       AluSx (2)  (TTCC)n (1)  LTR78 (1) 
180954  chr6  NT_167244.1  3789652-3970606    2       MER52D (1)  AluJb (1) 
175792  chr6  NT_167247.1  4420371-4596163    10  10       (TTAAA)n (1)  MLT1J (1)  MIR (1) 
175368  chr6  NT_167244.1  3180297-3355665    2       Charlie4a (1)  AluSp (1) 
166374  chr6  NT_167249.1  2138041-2304415    3       L1MB8 (3)  AluSx (3)  AT_rich (1) 
165170  chr6  NT_167247.1  1562480-1727650    4       MIR (1)  (GGAA)n (1)  A-rich (1) 
161074  chr6  NT_167248.1  521686-682760    2       L1PREC2 (1)  HERVH-int (1) 
150549  chr9  NT_008470.19  21692893-21843442    1       L1M5 (1) 
10  145741  chr6  NT_167244.1  2894330-3040071    15  7       L1MC5 (6)  AluY (2)  AluSc (2) 
11  118570  chr6  NT_167245.1  2605886-2724456    3       L2 (2)  MLT1E2 (1)  L2a (1) 
12  116312  chr6  NT_167247.1  1176874-1293186    1       ERV3-16A3_I-int (1) 
13  115120  chr6  NT_167246.1  3260633-3375753    2       MIRb (2)  AluSx (1) 
14  111093  chr6  NT_167245.1  136636-247729    7       L2c (2)  MLT1F (1)  MLT1E2 (1) 
15  106055  chr6  NT_167244.1  1450785-1556840    3       ERV3-16A3_I-int (1)  AluY (1)  AluSg1 (1) 
16  105857  chr6  NT_167244.1  1832365-1938222    4       (TATG)n (1)  MIR (1)  AluSx (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   175792       chr6  NT_167247.1  4420371-4596163    LOC100507722  hypothetical_protein_LOC100507722
7   165170       chr6  NT_167247.1  1562480-1727650    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011