Distribution of restriction sites in the human genome

Enzyme:  DrdV               Longest uncut segments
Specificity:  CATGNAC               Repeats in uncut segments
Number of sites:  1467919               Genes in uncut segments
Mean distance between sites:  1949 base pairs
Standard deviation:  2210 base pairs
Site density 513.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   497402  chr15  NT_037852.6  1394771-1892173    0.99 % in   23 repeats    0.00 % in 0 genes
2   402242  chr6  NT_167244.1  2359810-2762052    0.04 % in   1 repeats    0.00 % in 0 genes
3   209585  chr6  NT_167244.1  4389208-4598793    0.79 % in   9 repeats    0.00 % in 0 genes
4   188190  chr6  NT_167244.1  3784584-3972774    2.13 % in   21 repeats    1.54 % in 1 genes
5   180290  chr6  NT_167244.1  3180140-3360430    1.47 % in   13 repeats    2.40 % in 2 genes
6   174192  chr6  NT_167247.1  4420262-4594454    0.42 % in   6 repeats    100.00 % in 1 genes
7   171686  chr6  NT_167249.1  2137849-2309535    2.82 % in   25 repeats    0.00 % in 0 genes
8   166442  chr6  NT_167247.1  1561706-1728148    0.71 % in   6 repeats    0.75 % in 1 genes
9   163016  chr6  NT_167248.1  521202-684218    2.27 % in   2 repeats    0.00 % in 0 genes
10   156553  chr6  NT_167244.1  2008637-2165190    0.32 % in   3 repeats    0.00 % in 0 genes
11   152903  chr7  NT_023603.5  40706-193609    100.00 % in   1 repeats    0.00 % in 0 genes
12   152220  chr9  NT_008470.19  21691181-21843401    0.88 % in   5 repeats    0.00 % in 0 genes
13   146831  chr6  NT_167244.1  2893509-3040340    2.11 % in   19 repeats    0.00 % in 0 genes
14   131485  chr1  NT_077389.3  259363-390848    97.15 % in   65 repeats    0.00 % in 0 genes
15   121556  chr6  NT_167245.1  2603497-2725053    2.96 % in   9 repeats    0.00 % in 0 genes
16   120601  chr6  NT_167246.1  3258849-3379450    2.20 % in   16 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
497402  chr15  NT_037852.6  1394771-1892173    23  18       L2a (3)  L1MDa (2)  L1M5 (2) 
402242  chr6  NT_167244.1  2359810-2762052    1       AluSp (1) 
209585  chr6  NT_167244.1  4389208-4598793    7       MER57-int (2)  AluSx (2)  (TTCC)n (1) 
188190  chr6  NT_167244.1  3784584-3972774    21  15       L2a (3)  MLT1H-int (2)  AT_rich (2) 
180290  chr6  NT_167244.1  3180140-3360430    13  8       AluSx (3)  MIRb (2)  L2c (2) 
174192  chr6  NT_167247.1  4420262-4594454    6       MIR (1)  MER11A (1)  L2b (1) 
171686  chr6  NT_167249.1  2137849-2309535    25  12       Charlie2b (6)  AluSx (4)  L1MB8 (3) 
166442  chr6  NT_167247.1  1561706-1728148    5       MIR (2)  L1MC3 (1)  (GGAA)n (1) 
163016  chr6  NT_167248.1  521202-684218    2       L1PREC2 (1)  HERVH-int (1) 
10  156553  chr6  NT_167244.1  2008637-2165190    3       MIRb (1)  MIR (1)  AluSx (1) 
11  152903  chr7  NT_023603.5  40706-193609    1       ALR/Alpha (1) 
12  152220  chr9  NT_008470.19  21691181-21843401    4       LTR67B (2)  MSTA (1)  L1M5 (1) 
13  146831  chr6  NT_167244.1  2893509-3040340    19  10       L1MC5 (6)  AluSc (3)  AluY (2) 
14  131485  chr1  NT_077389.3  259363-390848    65  12       ALR/Alpha (52)  MLT1J (2)  L1MB1 (2) 
15  121556  chr6  NT_167245.1  2603497-2725053    7       MLT1N2 (2)  L2 (2)  MLT1E2 (1) 
16  120601  chr6  NT_167246.1  3258849-3379450    16  11       L1MC5 (3)  AluSx (3)  MIRb (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   188190       chr6  NT_167244.1  3784584-3972774    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
5   180290       chr6  NT_167244.1  3180140-3360430    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   174192       chr6  NT_167247.1  4420262-4594454    LOC100507722  hypothetical_protein_LOC100507722
8   166442       chr6  NT_167247.1  1561706-1728148    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011