Distribution of restriction sites in the human genome

Enzyme:  MjaIV               Longest uncut segments
Specificity:  GTNNAC               Repeats in uncut segments
Number of sites:  6199946               Genes in uncut segments
Mean distance between sites:  461 base pairs
Standard deviation:  478 base pairs
Site density2166.8 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488368  chr15  NT_037852.6  1397253-1885621    0.13 % in   5 repeats    0.00 % in 0 genes
2   402806  chr6  NT_167244.1  2358436-2761242    0.30 % in   5 repeats    0.00 % in 0 genes
3   208731  chr6  NT_167244.1  4389458-4598189    0.39 % in   6 repeats    0.00 % in 0 genes
4   180633  chr6  NT_167244.1  3790034-3970667    0.16 % in   3 repeats    0.00 % in 0 genes
5   176379  chr6  NT_167244.1  3179895-3356274    0.24 % in   5 repeats    0.24 % in 2 genes
6   172640  chr6  NT_167247.1  4421823-4594463    0.12 % in   2 repeats    100.00 % in 1 genes
7   166076  chr6  NT_167249.1  2137781-2303857    0.51 % in   6 repeats    0.00 % in 0 genes
8   164833  chr6  NT_167247.1  1562903-1727736    0.32 % in   4 repeats    0.03 % in 1 genes
9   161279  chr6  NT_167248.1  520943-682222    1.22 % in   2 repeats    0.00 % in 0 genes
10   155869  chr6  NT_167244.1  2009166-2165035    0.07 % in   1 repeats    0.00 % in 0 genes
11   145475  chr6  NT_167244.1  2893504-3038979    1.26 % in   10 repeats    0.00 % in 0 genes
12   119123  chr6  NT_167245.1  2605363-2724486    1.33 % in   4 repeats    0.00 % in 0 genes
13   115157  chr6  NT_167247.1  1177344-1292501    0.28 % in   1 repeats    0.00 % in 0 genes
14   114039  chr6  NT_167246.1  3260487-3374526    0.01 % in   1 repeats    0.00 % in 0 genes
15   109140  chr6  NT_167245.1  137557-246697    1.13 % in   3 repeats    0.00 % in 0 genes
16   104956  chr6  NT_167244.1  1451381-1556337    0.34 % in   3 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488368  chr15  NT_037852.6  1397253-1885621    5       MIRc (1)  MIRb (1)  L1M3 (1) 
402806  chr6  NT_167244.1  2358436-2761242    4       AluJb (2)  L4 (1)  L1ME4a (1) 
208731  chr6  NT_167244.1  4389458-4598189    6       (TTCC)n (1)  MER57-int (1)  AluY (1) 
180633  chr6  NT_167244.1  3790034-3970667    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
176379  chr6  NT_167244.1  3179895-3356274    4       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
172640  chr6  NT_167247.1  4421823-4594463    2       MER11A (1)  AluSc (1) 
166076  chr6  NT_167249.1  2137781-2303857    4       L1MB8 (2)  AluSx (2)  L1MC4a (1) 
164833  chr6  NT_167247.1  1562903-1727736    3       MIR (2)  (GGAA)n (1)  AluSq (1) 
161279  chr6  NT_167248.1  520943-682222    2       L1PREC2 (1)  HERVH-int (1) 
10  155869  chr6  NT_167244.1  2009166-2165035    1       MIRb (1) 
11  145475  chr6  NT_167244.1  2893504-3038979    10  7       L1MC5 (2)  AluSc (2)  AluJo (2) 
12  119123  chr6  NT_167245.1  2605363-2724486    3       L2 (2)  MLT1E2 (1)  L2a (1) 
13  115157  chr6  NT_167247.1  1177344-1292501    1       ERV3-16A3_I-int (1) 
14  114039  chr6  NT_167246.1  3260487-3374526    1       MIR3 (1) 
15  109140  chr6  NT_167245.1  137557-246697    3       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 
16  104956  chr6  NT_167244.1  1451381-1556337    3       ERV3-16A3_I-int (1)  AluY (1)  AluSg1 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   176379       chr6  NT_167244.1  3179895-3356274    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   172640       chr6  NT_167247.1  4421823-4594463    LOC100507722  hypothetical_protein_LOC100507722
8   164833       chr6  NT_167247.1  1562903-1727736    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011