Distribution of restriction sites in the human genome

Enzyme:  BceSIII               Longest uncut segments
Specificity:  ACGGC               Repeats in uncut segments
Number of sites:  692836               Genes in uncut segments
Mean distance between sites:  4129 base pairs
Standard deviation:  5672 base pairs
Site density 242.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   503239  chr15  NT_037852.6  1398270-1901509    0.98 % in   28 repeats    1.68 % in 1 genes
2   403281  chr6  NT_167244.1  2359821-2763102    0.09 % in   2 repeats    0.00 % in 0 genes
3   210446  chr6  NT_167244.1  4388971-4599417    1.09 % in   11 repeats    0.00 % in 0 genes
4   190000  chr6  NT_167247.1  1554297-1744297    8.57 % in   63 repeats    4.56 % in 1 genes
5   182167  chr6  NT_167244.1  3789164-3971331    0.64 % in   8 repeats    0.00 % in 0 genes
6   176850  chr6  NT_167244.1  3179899-3356749    0.35 % in   6 repeats    0.50 % in 2 genes
7   175550  chr6  NT_167247.1  4421845-4597395    1.19 % in   8 repeats    100.00 % in 1 genes
8   171524  chr6  NT_167249.1  2134077-2305601    2.80 % in   20 repeats    0.00 % in 0 genes
9   166894  chr6  NT_167248.1  521792-688686    2.89 % in   5 repeats    0.00 % in 0 genes
10   160091  chr6  NT_167244.1  2007669-2167760    1.42 % in   9 repeats    0.00 % in 0 genes
11   158820  chr9  NT_008470.19  21687262-21846082    3.54 % in   17 repeats    0.00 % in 0 genes
12   154969  chr7  NT_023603.5  46092-201061    100.00 % in   4 repeats    0.00 % in 0 genes
13   144956  chr6  NT_167244.1  2894567-3039523    1.42 % in   12 repeats    0.00 % in 0 genes
14   126122  chr6  NT_167245.1  2598400-2724522    5.77 % in   18 repeats    0.00 % in 0 genes
15   118507  chr6  NT_167249.1  4720118-4838625    8.74 % in   52 repeats    0.00 % in 0 genes
16   117506  chr6  NT_167244.1  3486570-3604076    7.27 % in   21 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
503239  chr15  NT_037852.6  1398270-1901509    28  17       AT_rich (5)  (TA)n (3)  L2a (3) 
403281  chr6  NT_167244.1  2359821-2763102    2       L1MEg (1)  AluSp (1) 
210446  chr6  NT_167244.1  4388971-4599417    11  9       MER57-int (2)  AluSx (2)  (TTCC)n (1) 
190000  chr6  NT_167247.1  1554297-1744297    63  38       L1MEf (6)  L1PB2 (4)  L2c (3) 
182167  chr6  NT_167244.1  3789164-3971331    8       MLT1H-int (1)  MIR (1)  MER52D (1) 
176850  chr6  NT_167244.1  3179899-3356749    5       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
175550  chr6  NT_167247.1  4421845-4597395    7       MLT1J (2)  (TTAAA)n (1)  MER11A (1) 
171524  chr6  NT_167249.1  2134077-2305601    20  12       AluSx (4)  L1MB8 (3)  MLT1A (2) 
166894  chr6  NT_167248.1  521792-688686    4       AT_rich (2)  L1PREC2 (1)  HERVH-int (1) 
10  160091  chr6  NT_167244.1  2007669-2167760    8       AluSx (2)  MIRb (1)  MIR (1) 
11  158820  chr9  NT_008470.19  21687262-21846082    17  11       MER5B (2)  LTR67B (2)  L2 (2) 
12  154969  chr7  NT_023603.5  46092-201061    2       L1PA2 (2)  ALR/Alpha (2) 
13  144956  chr6  NT_167244.1  2894567-3039523    12  7       L1MC5 (4)  AluSc (2)  AluJo (2) 
14  126122  chr6  NT_167245.1  2598400-2724522    18  15       MLT1N2 (2)  MER21C (2)  L2 (2) 
15  118507  chr6  NT_167249.1  4720118-4838625    52  24       AluSx (10)  AluY (6)  MLT1C (4) 
16  117506  chr6  NT_167244.1  3486570-3604076    21  12       L1M2 (4)  AluSx (3)  AluSg (3) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   503239       chr15  NT_037852.6  1398270-1901509    LOC100418897 
4   190000       chr6  NT_167247.1  1554297-1744297    LOC100421582  tripartite_motif-containing_protein_26
6   176850       chr6  NT_167244.1  3179899-3356749    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
7   175550       chr6  NT_167247.1  4421845-4597395    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011