Distribution of restriction sites in the human genome

Enzyme:  BpmI               Longest uncut segments
Specificity:  CTGGAG               Repeats in uncut segments
Number of sites:  2894054               Genes in uncut segments
Mean distance between sites:  988 base pairs
Standard deviation:  1140 base pairs
Site density1011.4 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494307  chr15  NT_037852.6  1397388-1891695    0.79 % in   18 repeats    0.00 % in 0 genes
2   401967  chr6  NT_167244.1  2359711-2761678    0.07 % in   1 repeats    0.00 % in 0 genes
3   208754  chr6  NT_167244.1  4389947-4598701    0.41 % in   5 repeats    0.00 % in 0 genes
4   183347  chr6  NT_167244.1  3788483-3971830    1.08 % in   10 repeats    0.00 % in 0 genes
5   175585  chr6  NT_167244.1  3179868-3355453    0.14 % in   4 repeats    0.20 % in 1 genes
6   173982  chr6  NT_167247.1  4421390-4595372    0.69 % in   3 repeats    100.00 % in 1 genes
7   166960  chr6  NT_167249.1  2136396-2303356    0.78 % in   8 repeats    0.00 % in 0 genes
8   164611  chr6  NT_167247.1  1562370-1726981    0.02 % in   1 repeats    0.35 % in 1 genes
9   159445  chr6  NT_167248.1  521882-681327    0.08 % in   2 repeats    0.00 % in 0 genes
10   152543  chr9  NT_008470.19  21692700-21845243    0.65 % in   6 repeats    0.00 % in 0 genes
11   143732  chr6  NT_167244.1  2894205-3037937    0.41 % in   6 repeats    0.00 % in 0 genes
12   118289  chr6  NT_167245.1  2605935-2724224    0.64 % in   3 repeats    0.00 % in 0 genes
13   114850  chr1  NT_077389.3  264857-379707    99.54 % in   49 repeats    0.00 % in 0 genes
14   113622  chr6  NT_167246.1  3261234-3374856    0.12 % in   2 repeats    0.00 % in 0 genes
15   111192  chr6  NT_167245.1  135600-246792    2.48 % in   6 repeats    0.00 % in 0 genes
16   109119  chr6  NT_167244.1  586547-695666    3.28 % in   12 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494307  chr15  NT_037852.6  1397388-1891695    18  15       L2a (3)  L1M5 (2)  U2 (1) 
401967  chr6  NT_167244.1  2359711-2761678    1       AluSp (1) 
208754  chr6  NT_167244.1  4389947-4598701    4       AluSx (2)  L1MC (1)  AluSg/x (1) 
183347  chr6  NT_167244.1  3788483-3971830    10  9       AT_rich (2)  MLT1H-int (1)  MIR (1) 
175585  chr6  NT_167244.1  3179868-3355453    3       GC_rich (2)  (CCG)n (1)  AluSp (1) 
173982  chr6  NT_167247.1  4421390-4595372    3       MIR (1)  MER11A (1)  AluSc (1) 
166960  chr6  NT_167249.1  2136396-2303356    8       MLT1A (1)  MamGypLTR1b (1)  L1MC4a (1) 
164611  chr6  NT_167247.1  1562370-1726981    1       A-rich (1) 
159445  chr6  NT_167248.1  521882-681327    2       L1PREC2 (1)  HERVH-int (1) 
10  152543  chr9  NT_008470.19  21692700-21845243    5       L2 (2)  MIR3 (1)  LTR67B (1) 
11  143732  chr6  NT_167244.1  2894205-3037937    6       L1MC5 (1)  AluY (1)  AluSp (1) 
12  118289  chr6  NT_167245.1  2605935-2724224    3       MLT1E2 (1)  L2a (1)  L2 (1) 
13  114850  chr1  NT_077389.3  264857-379707    49  2       ALR/Alpha (48)  MLT1J (1) 
14  113622  chr6  NT_167246.1  3261234-3374856    2       MIRb (1)  AluSx (1) 
15  111192  chr6  NT_167245.1  135600-246792    6       MLT1F (1)  MLT1E2 (1)  MER6 (1) 
16  109119  chr6  NT_167244.1  586547-695666    12  10       L1MA9 (3)  MIR (1)  MER77 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   175585       chr6  NT_167244.1  3179868-3355453    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   173982       chr6  NT_167247.1  4421390-4595372    LOC100507722  hypothetical_protein_LOC100507722
8   164611       chr6  NT_167247.1  1562370-1726981    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011