Distribution of restriction sites in the human genome

Enzyme:  BmrI               Longest uncut segments
Specificity:  ACTGGG               Repeats in uncut segments
Number of sites:  1686472               Genes in uncut segments
Mean distance between sites:  1696 base pairs
Standard deviation:  1898 base pairs
Site density 589.4 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   493089  chr15  NT_037852.6  1395980-1889069    0.54 % in   13 repeats    0.00 % in 0 genes
2   401629  chr6  NT_167244.1  2359650-2761279    0.08 % in   1 repeats    0.00 % in 0 genes
3   209746  chr6  NT_167244.1  4389571-4599317    0.80 % in   9 repeats    0.00 % in 0 genes
4   183985  chr6  NT_167244.1  3786867-3970852    0.59 % in   7 repeats    0.34 % in 1 genes
5   178295  chr6  NT_167247.1  4418533-4596828    1.46 % in   11 repeats    100.00 % in 1 genes
6   175806  chr6  NT_167244.1  3179563-3355369    0.12 % in   5 repeats    0.38 % in 1 genes
7   167391  chr6  NT_167247.1  1561778-1729169    0.85 % in   8 repeats    0.70 % in 1 genes
8   166915  chr6  NT_167249.1  2137588-2304503    0.90 % in   8 repeats    0.00 % in 0 genes
9   163869  chr7  NT_023603.5  32112-195981    100.00 % in   5 repeats    0.00 % in 0 genes
10   159729  chr6  NT_167248.1  521831-681560    0.26 % in   2 repeats    0.00 % in 0 genes
11   152097  chr9  NT_008470.19  21692590-21844687    0.60 % in   5 repeats    0.00 % in 0 genes
12   149533  chrY  NT_011875.12  8417106-8566639    99.70 % in   13 repeats    0.00 % in 0 genes
13   144472  chr6  NT_167244.1  2893845-3038317    0.84 % in   7 repeats    0.00 % in 0 genes
14   119327  chr6  NT_167245.1  2605597-2724924    1.50 % in   4 repeats    0.00 % in 0 genes
15   119094  chr6  NT_167244.1  583607-702701    7.77 % in   36 repeats    0.00 % in 0 genes
16   116917  chr6  NT_167247.1  1177468-1294385    0.17 % in   1 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
493089  chr15  NT_037852.6  1395980-1889069    13  11       L2a (3)  (TA)n (1)  MLT1L (1) 
401629  chr6  NT_167244.1  2359650-2761279    1       AluSp (1) 
209746  chr6  NT_167244.1  4389571-4599317    8       AluSx (2)  (TTCC)n (1)  MER57-int (1) 
183985  chr6  NT_167244.1  3786867-3970852    6       AT_rich (2)  MLT1H-int (1)  MIR (1) 
178295  chr6  NT_167247.1  4418533-4596828    11  11       (TTAAA)n (1)  MLT1J (1)  MIRb (1) 
175806  chr6  NT_167244.1  3179563-3355369    3       GC_rich (3)  (CCG)n (1)  AluSp (1) 
167391  chr6  NT_167247.1  1561778-1729169    6       MIR (2)  L1MEe (2)  L1MC3 (1) 
166915  chr6  NT_167249.1  2137588-2304503    4       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
163869  chr7  NT_023603.5  32112-195981    2       L1PA2 (4)  ALR/Alpha (1) 
10  159729  chr6  NT_167248.1  521831-681560    2       L1PREC2 (1)  HERVH-int (1) 
11  152097  chr9  NT_008470.19  21692590-21844687    4       L2 (2)  MIR3 (1)  LTR67B (1) 
12  149533  chrY  NT_011875.12  8417106-8566639    13  4       LTR12B (9)  LTR12D (2)  L1PA7 (1) 
13  144472  chr6  NT_167244.1  2893845-3038317    6       AluJo (2)  L1MC5 (1)  AluY (1) 
14  119327  chr6  NT_167245.1  2605597-2724924    3       L2 (2)  MLT1E2 (1)  L2a (1) 
15  119094  chr6  NT_167244.1  583607-702701    36  25       L2b (3)  L1MA9 (3)  L1M5 (3) 
16  116917  chr6  NT_167247.1  1177468-1294385    1       ERV3-16A3_I-int (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   183985       chr6  NT_167244.1  3786867-3970852    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
5   178295       chr6  NT_167247.1  4418533-4596828    LOC100507722  hypothetical_protein_LOC100507722
6   175806       chr6  NT_167244.1  3179563-3355369    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   167391       chr6  NT_167247.1  1561778-1729169    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011