Distribution of restriction sites in the human genome

Enzyme:  RlaII               Longest uncut segments
Specificity:  ACACAG               Repeats in uncut segments
Number of sites:  2459197               Genes in uncut segments
Mean distance between sites:  1163 base pairs
Standard deviation:  1251 base pairs
Site density 859.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   491503  chr15  NT_037852.6  1397526-1889029    0.39 % in   10 repeats    0.00 % in 0 genes
2   403693  chr6  NT_167244.1  2357547-2761240    0.50 % in   9 repeats    0.00 % in 0 genes
3   211640  chr6  NT_167244.1  4387849-4599489    1.61 % in   11 repeats    0.00 % in 0 genes
4   181330  chr6  NT_167244.1  3789535-3970865    0.29 % in   3 repeats    0.00 % in 0 genes
5   177855  chr6  NT_167247.1  4420159-4598014    1.79 % in   14 repeats    100.00 % in 1 genes
6   176420  chr6  NT_167244.1  3179407-3355827    0.26 % in   6 repeats    0.46 % in 1 genes
7   172310  chr6  NT_167247.1  1559281-1731591    2.21 % in   17 repeats    2.13 % in 1 genes
8   168123  chr6  NT_167249.1  2138120-2306243    1.58 % in   13 repeats    0.00 % in 0 genes
9   161477  chr6  NT_167248.1  520238-681715    1.34 % in   2 repeats    0.00 % in 0 genes
10   153181  chr9  NT_008470.19  21693048-21846229    0.72 % in   6 repeats    0.00 % in 0 genes
11   148304  chr6  NT_167244.1  2892389-3040693    2.82 % in   22 repeats    0.00 % in 0 genes
12   118065  chr6  NT_167245.1  2605904-2723969    0.45 % in   3 repeats    0.00 % in 0 genes
13   117769  chr6  NT_167247.1  1175707-1293476    1.66 % in   2 repeats    0.00 % in 0 genes
14   114161  chr6  NT_167246.1  3260688-3374849    0.11 % in   2 repeats    0.00 % in 0 genes
15   109821  chr6  NT_167245.1  137473-247294    1.58 % in   5 repeats    0.00 % in 0 genes
16   109684  chrY  NT_011875.12  8568693-8678377    54.32 % in   7 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
491503  chr15  NT_037852.6  1397526-1889029    10  8       L2a (3)  (TA)n (1)  MLT1L (1) 
403693  chr6  NT_167244.1  2357547-2761240    7       L4 (2)  AluJb (2)  MER8 (1) 
211640  chr6  NT_167244.1  4387849-4599489    11  9       MER57-int (2)  AluSx (2)  (TTCC)n (1) 
181330  chr6  NT_167244.1  3789535-3970865    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
177855  chr6  NT_167247.1  4420159-4598014    14  12       MLT1J (2)  AluSx (2)  (TTAAA)n (1) 
176420  chr6  NT_167244.1  3179407-3355827    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
172310  chr6  NT_167247.1  1559281-1731591    17  14       Tigger7 (2)  MIR (2)  L1MEe (2) 
168123  chr6  NT_167249.1  2138120-2306243    13  5       Charlie2b (4)  AluSx (4)  L1MB8 (3) 
161477  chr6  NT_167248.1  520238-681715    2       L1PREC2 (1)  HERVH-int (1) 
10  153181  chr9  NT_008470.19  21693048-21846229    5       L2 (2)  MIRb (1)  MIR3 (1) 
11  148304  chr6  NT_167244.1  2892389-3040693    22  11       L1MC5 (6)  AluY (3)  AluSc (3) 
12  118065  chr6  NT_167245.1  2605904-2723969    3       MLT1E2 (1)  L2a (1)  L2 (1) 
13  117769  chr6  NT_167247.1  1175707-1293476    1       ERV3-16A3_I-int (2) 
14  114161  chr6  NT_167246.1  3260688-3374849    2       MIRb (1)  AluSx (1) 
15  109821  chr6  NT_167245.1  137473-247294    5       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 
16  109684  chrY  NT_011875.12  8568693-8678377    1       LTR12B (7) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   177855       chr6  NT_167247.1  4420159-4598014    LOC100507722  hypothetical_protein_LOC100507722
6   176420       chr6  NT_167244.1  3179407-3355827    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   172310       chr6  NT_167247.1  1559281-1731591    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011