Distribution of restriction sites in the human genome

Enzyme:  RpaTI               Longest uncut segments
Specificity:  GRTGGAG               Repeats in uncut segments
Number of sites:  1332085               Genes in uncut segments
Mean distance between sites:  2148 base pairs
Standard deviation:  2589 base pairs
Site density 465.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   489200  chr15  NT_037852.6  1397516-1886716    0.09 % in   4 repeats    0.00 % in 0 genes
2   403324  chr6  NT_167244.1  2358709-2762033    0.24 % in   4 repeats    0.00 % in 0 genes
3   215785  chr6  NT_167244.1  4382659-4598444    1.97 % in   12 repeats    0.46 % in 1 genes
4   188012  chrY  NT_011875.12  8527444-8715456    73.31 % in   13 repeats    0.00 % in 0 genes
5   183497  chr6  NT_167244.1  3787521-3971018    0.66 % in   8 repeats    0.00 % in 0 genes
6   176525  chr6  NT_167244.1  3178954-3355479    0.18 % in   5 repeats    0.72 % in 1 genes
7   173430  chr6  NT_167247.1  4422119-4595549    0.75 % in   3 repeats    100.00 % in 1 genes
8   172226  chr6  NT_167247.1  1559973-1732199    2.21 % in   17 repeats    1.73 % in 1 genes
9   167745  chr6  NT_167249.1  2135647-2303392    1.25 % in   11 repeats    0.00 % in 0 genes
10   162990  chr6  NT_167248.1  520530-683520    2.26 % in   2 repeats    0.00 % in 0 genes
11   156551  chr6  NT_167244.1  2008245-2164796    0.57 % in   4 repeats    0.00 % in 0 genes
12   151306  chr9  NT_008470.19  21692541-21843847    0.48 % in   3 repeats    0.00 % in 0 genes
13   150195  chr7  NT_023603.5  46383-196578    100.00 % in   4 repeats    0.00 % in 0 genes
14   143752  chr6  NT_167244.1  2894221-3037973    0.42 % in   6 repeats    0.00 % in 0 genes
15   123551  chr10  NT_008705.16  38712096-38835647    26.75 % in   219 repeats    0.00 % in 0 genes
16   121682  chr6  NT_167247.1  1170869-1292551    4.28 % in   11 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
489200  chr15  NT_037852.6  1397516-1886716    4       MIRc (1)  MIRb (1)  L1M3 (1) 
403324  chr6  NT_167244.1  2358709-2762033    3       AluJb (2)  L4 (1)  AluSp (1) 
215785  chr6  NT_167244.1  4382659-4598444    12  8       MER57-int (3)  AluY (2)  AluSx (2) 
188012  chrY  NT_011875.12  8527444-8715456    13  4       LTR12B (10)  L1PA8A (1)  L1PA16 (1) 
183497  chr6  NT_167244.1  3787521-3971018    7       AT_rich (2)  MLT1H-int (1)  MIR (1) 
176525  chr6  NT_167244.1  3178954-3355479    3       GC_rich (3)  (CCG)n (1)  AluSp (1) 
173430  chr6  NT_167247.1  4422119-4595549    3       MER11A (1)  AluSg/x (1)  AluSc (1) 
172226  chr6  NT_167247.1  1559973-1732199    17  14       Tigger7 (2)  MIR (2)  L1MEe (2) 
167745  chr6  NT_167249.1  2135647-2303392    11  8       MLT1A (2)  AluSx (2)  AluJb (2) 
10  162990  chr6  NT_167248.1  520530-683520    2       L1PREC2 (1)  HERVH-int (1) 
11  156551  chr6  NT_167244.1  2008245-2164796    4       MIRb (1)  MIR (1)  AluY (1) 
12  151306  chr9  NT_008470.19  21692541-21843847    3       MIR3 (1)  LTR67B (1)  L1M5 (1) 
13  150195  chr7  NT_023603.5  46383-196578    2       L1PA2 (2)  ALR/Alpha (2) 
14  143752  chr6  NT_167244.1  2894221-3037973    6       L1MC5 (1)  AluY (1)  AluSp (1) 
15  123551  chr10  NT_008705.16  38712096-38835647    219  33       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 
16  121682  chr6  NT_167247.1  1170869-1292551    11  7       L2 (3)  MIRb (2)  ERV3-16A3_I-int (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   215785       chr6  NT_167244.1  4382659-4598444    HLA-DPB2  major_histocompatibility_complex,_class_II,_DP_beta_2_(pseudogene)
6   176525       chr6  NT_167244.1  3178954-3355479    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   173430       chr6  NT_167247.1  4422119-4595549    LOC100507722  hypothetical_protein_LOC100507722
8   172226       chr6  NT_167247.1  1559973-1732199    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011