Distribution of restriction sites in the human genome

Enzyme:  Sth368I               Longest uncut segments
Specificity:  GATC               Repeats in uncut segments
Number of sites:  7127304               Genes in uncut segments
Mean distance between sites:  401 base pairs
Standard deviation:  419 base pairs
Site density2490.9 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   401460  chr6  NT_167244.1  2359912-2761372    0.02 % in   1 repeats    0.00 % in 0 genes
2   208420  chr6  NT_167244.1  4389492-4597912    0.26 % in   5 repeats    0.00 % in 0 genes
3   180729  chr6  NT_167244.1  3790055-3970784    0.21 % in   3 repeats    0.00 % in 0 genes
4   176035  chr6  NT_167244.1  3179403-3355438    0.15 % in   5 repeats    0.47 % in 1 genes
5   173234  chr6  NT_167247.1  4421313-4594547    0.23 % in   3 repeats    100.00 % in 1 genes
6   164983  chr6  NT_167249.1  2138152-2303135    0.03 % in   1 repeats    0.00 % in 0 genes
7   159375  chr6  NT_167248.1  521863-681238    0.04 % in   2 repeats    0.00 % in 0 genes
8   150550  chr9  NT_008470.19  21693324-21843874    0.04 % in   1 repeats    0.00 % in 0 genes
9   142863  chr6  NT_167244.1  2894635-3037498    0.03 % in   2 repeats    0.00 % in 0 genes
10   117588  chr6  NT_167245.1  2606079-2723667    0.13 % in   1 repeats    0.00 % in 0 genes
11   115391  chr6  NT_167247.1  1177383-1292774    0.24 % in   1 repeats    0.00 % in 0 genes
12   113544  chr6  NT_167246.1  3261329-3374873    0.14 % in   2 repeats    0.00 % in 0 genes
13   108985  chr6  NT_167245.1  137013-245998    0.99 % in   2 repeats    0.00 % in 0 genes
14   106106  chr6  NT_167244.1  587599-693705    1.06 % in   7 repeats    0.00 % in 0 genes
15   105548  chr6  NT_167244.1  1451256-1556804    0.90 % in   3 repeats    0.00 % in 0 genes
16   104481  chr6  NT_167244.1  1833259-1937740    0.27 % in   3 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
401460  chr6  NT_167244.1  2359912-2761372    1       AluSp (1) 
208420  chr6  NT_167244.1  4389492-4597912    5       (TTCC)n (1)  MER57-int (1)  AluY (1) 
180729  chr6  NT_167244.1  3790055-3970784    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
176035  chr6  NT_167244.1  3179403-3355438    3       GC_rich (3)  (CCG)n (1)  AluSp (1) 
173234  chr6  NT_167247.1  4421313-4594547    3       MIR (1)  MER11A (1)  AluSc (1) 
164983  chr6  NT_167249.1  2138152-2303135    1       AT_rich (1) 
159375  chr6  NT_167248.1  521863-681238    2       L1PREC2 (1)  HERVH-int (1) 
150550  chr9  NT_008470.19  21693324-21843874    1       MIR3 (1) 
142863  chr6  NT_167244.1  2894635-3037498    2       AluY (1)  AluSg1 (1) 
10  117588  chr6  NT_167245.1  2606079-2723667    1       L2a (1) 
11  115391  chr6  NT_167247.1  1177383-1292774    1       ERV3-16A3_I-int (1) 
12  113544  chr6  NT_167246.1  3261329-3374873    2       MIRb (1)  AluSx (1) 
13  108985  chr6  NT_167245.1  137013-245998    2       MLT1E2 (1)  LTR12C (1) 
14  106106  chr6  NT_167244.1  587599-693705    5       L1MA9 (3)  MER77 (1)  L1PB1 (1) 
15  105548  chr6  NT_167244.1  1451256-1556804    3       ERV3-16A3_I-int (1)  AluY (1)  AluSg1 (1) 
16  104481  chr6  NT_167244.1  1833259-1937740    3       (TATG)n (1)  MIR (1)  AluSx (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   176035       chr6  NT_167244.1  3179403-3355438    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
5   173234       chr6  NT_167247.1  4421313-4594547    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011