Distribution of restriction sites in the human genome

Enzyme:  Eco57I               Longest uncut segments
Specificity:  CTGAAG               Repeats in uncut segments
Number of sites:  2145295               Genes in uncut segments
Mean distance between sites:  1333 base pairs
Standard deviation:  1412 base pairs
Site density 749.7 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   486787  chr15  NT_037852.6  1398513-1885300    0.01 % in   1 repeats    0.00 % in 0 genes
2   402101  chr6  NT_167244.1  2359494-2761595    0.08 % in   1 repeats    0.00 % in 0 genes
3   211869  chr6  NT_167244.1  4388997-4600866    1.37 % in   14 repeats    0.00 % in 0 genes
4   183274  chr6  NT_167244.1  3788310-3971584    0.97 % in   10 repeats    0.00 % in 0 genes
5   177468  chr6  NT_167244.1  3178114-3355582    0.46 % in   9 repeats    1.19 % in 1 genes
6   174877  chr6  NT_167247.1  4421289-4596166    1.00 % in   7 repeats    100.00 % in 1 genes
7   165695  chr6  NT_167247.1  1561189-1726884    0.61 % in   3 repeats    1.06 % in 1 genes
8   165366  chr6  NT_167249.1  2138057-2303423    0.12 % in   3 repeats    0.00 % in 0 genes
9   159758  chr6  NT_167248.1  521657-681415    0.28 % in   2 repeats    0.00 % in 0 genes
10   152580  chr9  NT_008470.19  21691493-21844073    0.89 % in   5 repeats    0.00 % in 0 genes
11   144988  chr6  NT_167244.1  2893756-3038744    1.10 % in   10 repeats    0.00 % in 0 genes
12   120765  chr6  NT_167244.1  578911-699676    9.45 % in   33 repeats    0.00 % in 0 genes
13   119796  chr6  NT_167245.1  2606208-2726004    1.52 % in   5 repeats    0.00 % in 0 genes
14   115775  chr6  NT_167247.1  1177643-1293418    0.02 % in   1 repeats    0.00 % in 0 genes
15   113940  chr6  NT_167246.1  3261211-3375151    0.38 % in   3 repeats    0.00 % in 0 genes
16   113317  chr6  NT_167245.1  133013-246330    2.73 % in   8 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
486787  chr15  NT_037852.6  1398513-1885300    1       AT_rich (1) 
402101  chr6  NT_167244.1  2359494-2761595    1       AluSp (1) 
211869  chr6  NT_167244.1  4388997-4600866    14  11       MER57-int (2)  AluSx (2)  AluSg/x (2) 
183274  chr6  NT_167244.1  3788310-3971584    10  9       AT_rich (2)  MLT1H-int (1)  MIR (1) 
177468  chr6  NT_167244.1  3178114-3355582    7       GC_rich (3)  LTR23 (1)  L2a (1) 
174877  chr6  NT_167247.1  4421289-4596166    7       (TTAAA)n (1)  MLT1J (1)  MIR (1) 
165695  chr6  NT_167247.1  1561189-1726884    3       MIRc (1)  L1MC3 (1)  A-rich (1) 
165366  chr6  NT_167249.1  2138057-2303423    3       L1MB8 (1)  AT_rich (1)  AluSx (1) 
159758  chr6  NT_167248.1  521657-681415    2       L1PREC2 (1)  HERVH-int (1) 
10  152580  chr9  NT_008470.19  21691493-21844073    4       LTR67B (2)  MSTA (1)  MIR3 (1) 
11  144988  chr6  NT_167244.1  2893756-3038744    10  7       L1MC5 (2)  AluSc (2)  AluJo (2) 
12  120765  chr6  NT_167244.1  578911-699676    33  26       L1MA9 (3)  L1M5 (3)  L1PA7 (2) 
13  119796  chr6  NT_167245.1  2606208-2726004    4       L2 (2)  MLT1E2 (1)  L2a (1) 
14  115775  chr6  NT_167247.1  1177643-1293418    1       ERV3-16A3_I-int (1) 
15  113940  chr6  NT_167246.1  3261211-3375151    2       MIRb (2)  AluSx (1) 
16  113317  chr6  NT_167245.1  133013-246330    8       tRNA-Ala-GCY_ (1)  MLT1F (1)  MLT1E2 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   177468       chr6  NT_167244.1  3178114-3355582    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   174877       chr6  NT_167247.1  4421289-4596166    LOC100507722  hypothetical_protein_LOC100507722
7   165695       chr6  NT_167247.1  1561189-1726884    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011