Distribution of restriction sites in the human genome

Enzyme:  EacI               Longest uncut segments
Specificity:  GGATC               Repeats in uncut segments
Number of sites:  3351642               Genes in uncut segments
Mean distance between sites:  853 base pairs
Standard deviation:  991 base pairs
Site density1171.4 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488244  chr15  NT_037852.6  1397197-1885441    0.14 % in   5 repeats    0.00 % in 0 genes
2   401459  chr6  NT_167244.1  2359912-2761371    0.02 % in   1 repeats    0.00 % in 0 genes
3   208809  chr6  NT_167244.1  4389103-4597912    0.45 % in   6 repeats    0.00 % in 0 genes
4   180735  chr6  NT_167244.1  3790048-3970783    0.22 % in   3 repeats    0.00 % in 0 genes
5   176665  chr6  NT_167244.1  3179403-3356068    0.26 % in   6 repeats    0.47 % in 1 genes
6   175624  chr6  NT_167247.1  4419973-4595597    1.06 % in   8 repeats    100.00 % in 1 genes
7   165308  chr6  NT_167249.1  2137827-2303135    0.13 % in   2 repeats    0.00 % in 0 genes
8   164653  chr6  NT_167247.1  1562751-1727404    0.12 % in   2 repeats    0.12 % in 1 genes
9   159375  chr6  NT_167248.1  521863-681238    0.04 % in   2 repeats    0.00 % in 0 genes
10   156520  chr6  NT_167244.1  2008434-2164954    0.45 % in   4 repeats    0.00 % in 0 genes
11   152184  chr9  NT_008470.19  21691897-21844081    0.68 % in   5 repeats    0.00 % in 0 genes
12   143132  chr6  NT_167244.1  2894382-3037514    0.08 % in   2 repeats    0.00 % in 0 genes
13   117588  chr6  NT_167245.1  2606078-2723666    0.14 % in   1 repeats    0.00 % in 0 genes
14   115416  chr6  NT_167246.1  3261069-3376485    0.94 % in   8 repeats    0.00 % in 0 genes
15   115391  chr6  NT_167247.1  1177383-1292774    0.24 % in   1 repeats    0.00 % in 0 genes
16   108985  chr6  NT_167245.1  137013-245998    0.99 % in   2 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488244  chr15  NT_037852.6  1397197-1885441    5       MIRc (1)  MIRb (1)  L1M3 (1) 
401459  chr6  NT_167244.1  2359912-2761371    1       AluSp (1) 
208809  chr6  NT_167244.1  4389103-4597912    5       MER57-int (2)  (TTCC)n (1)  AluY (1) 
180735  chr6  NT_167244.1  3790048-3970783    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
176665  chr6  NT_167244.1  3179403-3356068    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
175624  chr6  NT_167247.1  4419973-4595597    8       (TTAAA)n (1)  MIR (1)  MER11A (1) 
165308  chr6  NT_167249.1  2137827-2303135    2       L1MC4a (1)  AT_rich (1) 
164653  chr6  NT_167247.1  1562751-1727404    2       MIR (1)  AluSq (1) 
159375  chr6  NT_167248.1  521863-681238    2       L1PREC2 (1)  HERVH-int (1) 
10  156520  chr6  NT_167244.1  2008434-2164954    4       MIRb (1)  MIR (1)  AluY (1) 
11  152184  chr9  NT_008470.19  21691897-21844081    4       LTR67B (2)  MSTA (1)  MIR3 (1) 
12  143132  chr6  NT_167244.1  2894382-3037514    2       AluY (1)  AluSg1 (1) 
13  117588  chr6  NT_167245.1  2606078-2723666    1       L2a (1) 
14  115416  chr6  NT_167246.1  3261069-3376485    5       AluSx (3)  MIRb (2)  (TTA)n (1) 
15  115391  chr6  NT_167247.1  1177383-1292774    1       ERV3-16A3_I-int (1) 
16  108985  chr6  NT_167245.1  137013-245998    2       MLT1E2 (1)  LTR12C (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   176665       chr6  NT_167244.1  3179403-3356068    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   175624       chr6  NT_167247.1  4419973-4595597    LOC100507722  hypothetical_protein_LOC100507722
8   164653       chr6  NT_167247.1  1562751-1727404    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011