Distribution of restriction sites in the human genome

Enzyme:  FauI               Longest uncut segments
Specificity:  CCCGC               Repeats in uncut segments
Number of sites:  1412167               Genes in uncut segments
Mean distance between sites:  2026 base pairs
Standard deviation:  3707 base pairs
Site density 493.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   493120  chr15  NT_037852.6  1398374-1891494    0.66 % in   14 repeats    0.00 % in 0 genes
2   405701  chr6  NT_167244.1  2357939-2763640    0.46 % in   8 repeats    0.00 % in 0 genes
3   219717  chr6  NT_167244.1  4380334-4600051    2.63 % in   20 repeats    1.51 % in 1 genes
4   182815  chr6  NT_167244.1  3790351-3973166    1.07 % in   12 repeats    0.00 % in 0 genes
5   177774  chr6  NT_167248.1  521816-699590    6.09 % in   24 repeats    1.89 % in 2 genes
6   177044  chrY  NT_011875.12  8544935-8721979    71.00 % in   27 repeats    0.45 % in 1 genes
7   175926  chr6  NT_167247.1  4419948-4595874    1.07 % in   9 repeats    100.00 % in 1 genes
8   175751  chr6  NT_167244.1  3180198-3355949    0.22 % in   4 repeats    0.02 % in 1 genes
9   169563  chr6  NT_167249.1  2136321-2305884    2.09 % in   16 repeats    0.00 % in 0 genes
10   164697  chr6  NT_167247.1  1562798-1727495    0.17 % in   2 repeats    0.00 % in 0 genes
11   156051  chr6  NT_167244.1  2008440-2164491    0.45 % in   4 repeats    0.00 % in 0 genes
12   152523  chr9  NT_008470.19  21692303-21844826    0.71 % in   6 repeats    0.00 % in 0 genes
13   144416  chr6  NT_167244.1  2893104-3037520    0.42 % in   5 repeats    0.00 % in 0 genes
14   121208  chr6  NT_167244.1  437347-558555    17.08 % in   42 repeats    0.00 % in 0 genes
15   121122  chr6  NT_167247.1  1171165-1292287    4.30 % in   11 repeats    0.00 % in 0 genes
16   118883  chr6  NT_167245.1  2604816-2723699    1.11 % in   3 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
493120  chr15  NT_037852.6  1398374-1891494    14  11       L2a (3)  L1M5 (2)  U2 (1) 
405701  chr6  NT_167244.1  2357939-2763640    6       L4 (2)  AluJb (2)  L1MEg (1) 
219717  chr6  NT_167244.1  4380334-4600051    20  15       MER57-int (3)  AluSx (3)  AluY (2) 
182815  chr6  NT_167244.1  3790351-3973166    12  10       MLT1H-int (2)  L2a (2)  (TA)n (1) 
177774  chr6  NT_167248.1  521816-699590    24  17       AT_rich (5)  L1MA9 (3)  L1MC5 (2) 
177044  chrY  NT_011875.12  8544935-8721979    27  13       LTR12B (9)  L1PA16 (6)  L1PA8 (2) 
175926  chr6  NT_167247.1  4419948-4595874    9       (TTAAA)n (1)  MIR (1)  MER11A (1) 
175751  chr6  NT_167244.1  3180198-3355949    4       GC_rich (1)  Charlie4a (1)  (CCG)n (1) 
169563  chr6  NT_167249.1  2136321-2305884    16  10       AluSx (4)  L1MB8 (3)  Charlie2b (2) 
10  164697  chr6  NT_167247.1  1562798-1727495    2       MIR (1)  AluSq (1) 
11  156051  chr6  NT_167244.1  2008440-2164491    4       MIRb (1)  MIR (1)  AluY (1) 
12  152523  chr9  NT_008470.19  21692303-21844826    4       LTR67B (2)  L2 (2)  MIR3 (1) 
13  144416  chr6  NT_167244.1  2893104-3037520    4       AluY (2)  (TCC)n (1)  AluSg1 (1) 
14  121208  chr6  NT_167244.1  437347-558555    42  28       AT_rich (5)  MLT1A-int (3)  L1MA8 (3) 
15  121122  chr6  NT_167247.1  1171165-1292287    11  7       L2 (3)  MIRb (2)  ERV3-16A3_I-int (2) 
16  118883  chr6  NT_167245.1  2604816-2723699    3       MER5B (1)  MER5A1 (1)  L2a (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   219717       chr6  NT_167244.1  4380334-4600051    HLA-DPB2  major_histocompatibility_complex,_class_II,_DP_beta_2_(pseudogene)
5   177774       chr6  NT_167248.1  521816-699590    OR12D1P 
OR11A1  olfactory_receptor_11A1
6   177044       chrY  NT_011875.12  8544935-8721979    ZNF884P 
7   175926       chr6  NT_167247.1  4419948-4595874    LOC100507722  hypothetical_protein_LOC100507722
8   175751       chr6  NT_167244.1  3180198-3355949    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b



Posfai@neb.com
May 11, 2011