Distribution of restriction sites in the human genome

Enzyme:  DraIII               Longest uncut segments
Specificity:  CACNNNGTG               Repeats in uncut segments
Number of sites:  553610               Genes in uncut segments
Mean distance between sites:  5168 base pairs
Standard deviation:  5767 base pairs
Site density 193.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   500122  chr15  NT_037852.6  1398454-1898576    0.92 % in   21 repeats    1.10 % in 1 genes
2   411063  chr6  NT_167244.1  2350214-2761277    1.58 % in   32 repeats    0.00 % in 0 genes
3   319719  chrY  NT_011875.12  8417557-8737276    83.35 % in   65 repeats    0.25 % in 1 genes
4   214089  chr6  NT_167244.1  4385730-4599819    2.38 % in   17 repeats    0.00 % in 0 genes
5   190704  chr6  NT_167244.1  3789202-3979906    3.37 % in   27 repeats    0.00 % in 0 genes
6   187131  chr6  NT_167244.1  3171755-3358886    3.61 % in   40 repeats    5.97 % in 2 genes
7   178056  chr6  NT_167247.1  4419259-4597315    1.55 % in   12 repeats    100.00 % in 1 genes
8   171975  chr6  NT_167249.1  2137957-2309932    2.90 % in   26 repeats    0.00 % in 0 genes
9   168442  chr6  NT_167247.1  1561581-1730023    1.24 % in   9 repeats    0.00 % in 0 genes
10   166423  chr6  NT_167244.1  2879414-3045837    8.32 % in   68 repeats    0.00 % in 0 genes
11   164386  chr6  NT_167248.1  516867-681253    3.09 % in   3 repeats    0.00 % in 0 genes
12   152925  chr9  NT_008470.19  21691988-21844913    0.83 % in   7 repeats    0.00 % in 0 genes
13   130888  chr6  NT_167244.1  1817362-1948250    11.33 % in   66 repeats    0.00 % in 0 genes
14   127681  chr6  NT_167246.1  3259282-3386963    4.31 % in   26 repeats    0.00 % in 0 genes
15   126139  chr6  NT_167244.1  585457-711596    8.60 % in   40 repeats    0.00 % in 0 genes
16   125130  chr6  NT_167245.1  2600523-2725653    5.01 % in   16 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
500122  chr15  NT_037852.6  1398454-1898576    21  15       L2a (3)  MER44C (2)  L1MEf (2) 
411063  chr6  NT_167244.1  2350214-2761277    32  22       AluJb (4)  L1ME4a (3)  AluSx (3) 
319719  chrY  NT_011875.12  8417557-8737276    65  29       LTR12B (17)  L1PA16 (7)  L1ME3A (6) 
214089  chr6  NT_167244.1  4385730-4599819    17  12       MER57-int (3)  AluSx (3)  AluY (2) 
190704  chr6  NT_167244.1  3789202-3979906    27  21       L2a (5)  MLT1H-int (2)  L1M5 (2) 
187131  chr6  NT_167244.1  3171755-3358886    40  21       AluSx (6)  L1MC5 (4)  L1MB3 (4) 
178056  chr6  NT_167247.1  4419259-4597315    12  11       MLT1J (2)  (TTAAA)n (1)  MIRb (1) 
171975  chr6  NT_167249.1  2137957-2309932    26  13       Charlie2b (6)  AluSx (4)  L1MB8 (3) 
168442  chr6  NT_167247.1  1561581-1730023    7       MIR (2)  L1MEe (2)  L1MC3 (1) 
10  166423  chr6  NT_167244.1  2879414-3045837    68  27       AluY (7)  AluSx (7)  AluJo (7) 
11  164386  chr6  NT_167248.1  516867-681253    3       LTR7 (1)  L1PREC2 (1)  HERVH-int (1) 
12  152925  chr9  NT_008470.19  21691988-21844913    5       LTR67B (2)  L2 (2)  MSTA (1) 
13  130888  chr6  NT_167244.1  1817362-1948250    66  26       AluSx (9)  L1MC4 (8)  L2c (6) 
14  127681  chr6  NT_167246.1  3259282-3386963    26  18       AluSx (4)  L1MC5 (3)  MIRb (2) 
15  126139  chr6  NT_167244.1  585457-711596    40  29       L2c (3)  L2b (3)  L1MA9 (3) 
16  125130  chr6  NT_167245.1  2600523-2725653    16  13       MLT1N2 (2)  MER21C (2)  L2 (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   500122       chr15  NT_037852.6  1398454-1898576    LOC100418897 
3   319719       chrY  NT_011875.12  8417557-8737276    ZNF884P 
6   187131       chr6  NT_167244.1  3171755-3358886    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
7   178056       chr6  NT_167247.1  4419259-4597315    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011