Distribution of restriction sites in the human genome

Enzyme:  StsI               Longest uncut segments
Specificity:  GGATG               Repeats in uncut segments
Number of sites:  5127453               Genes in uncut segments
Mean distance between sites:  558 base pairs
Standard deviation:  625 base pairs
Site density1792.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488810  chr15  NT_037852.6  1397580-1886390    0.09 % in   4 repeats    0.00 % in 0 genes
2   403400  chr6  NT_167244.1  2358069-2761469    0.38 % in   7 repeats    0.00 % in 0 genes
3   209276  chr6  NT_167244.1  4389641-4598917    0.65 % in   7 repeats    0.00 % in 0 genes
4   181159  chr6  NT_167244.1  3789578-3970737    0.22 % in   3 repeats    0.00 % in 0 genes
5   175438  chr6  NT_167244.1  3180024-3355462    0.15 % in   4 repeats    0.11 % in 1 genes
6   173140  chr6  NT_167247.1  4422006-4595146    0.52 % in   2 repeats    100.00 % in 1 genes
7   166825  chr6  NT_167249.1  2138065-2304890    0.78 % in   8 repeats    0.00 % in 0 genes
8   165456  chr6  NT_167247.1  1562671-1728127    0.41 % in   4 repeats    0.17 % in 1 genes
9   160379  chr6  NT_167248.1  521276-681655    0.67 % in   2 repeats    0.00 % in 0 genes
10   150443  chr9  NT_008470.19  21693223-21843666    0.06 % in   2 repeats    0.00 % in 0 genes
11   143149  chr6  NT_167244.1  2894339-3037488    0.06 % in   2 repeats    0.00 % in 0 genes
12   117630  chr6  NT_167245.1  2606072-2723702    0.14 % in   1 repeats    0.00 % in 0 genes
13   114793  chr6  NT_167247.1  1177655-1292448    0.01 % in   1 repeats    0.00 % in 0 genes
14   113647  chr6  NT_167246.1  3261128-3374775    0.05 % in   1 repeats    0.00 % in 0 genes
15   108335  chr6  NT_167245.1  138016-246351    0.40 % in   3 repeats    0.00 % in 0 genes
16   105858  chr6  NT_167244.1  1833271-1939129    0.93 % in   5 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488810  chr15  NT_037852.6  1397580-1886390    4       MIRc (1)  MIRb (1)  L1M3 (1) 
403400  chr6  NT_167244.1  2358069-2761469    5       L4 (2)  AluJb (2)  L1ME4a (1) 
209276  chr6  NT_167244.1  4389641-4598917    6       AluSx (2)  (TTCC)n (1)  MER57-int (1) 
181159  chr6  NT_167244.1  3789578-3970737    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
175438  chr6  NT_167244.1  3180024-3355462    3       GC_rich (2)  (CCG)n (1)  AluSp (1) 
173140  chr6  NT_167247.1  4422006-4595146    2       MER11A (1)  AluSc (1) 
166825  chr6  NT_167249.1  2138065-2304890    4       L1MB8 (3)  AluSx (3)  Charlie2b (1) 
165456  chr6  NT_167247.1  1562671-1728127    3       MIR (2)  (GGAA)n (1)  AluSq (1) 
160379  chr6  NT_167248.1  521276-681655    2       L1PREC2 (1)  HERVH-int (1) 
10  150443  chr9  NT_008470.19  21693223-21843666    2       MIR3 (1)  L1M5 (1) 
11  143149  chr6  NT_167244.1  2894339-3037488    2       AluY (1)  AluSg1 (1) 
12  117630  chr6  NT_167245.1  2606072-2723702    1       L2a (1) 
13  114793  chr6  NT_167247.1  1177655-1292448    1       ERV3-16A3_I-int (1) 
14  113647  chr6  NT_167246.1  3261128-3374775    1       MIRb (1) 
15  108335  chr6  NT_167245.1  138016-246351    3       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 
16  105858  chr6  NT_167244.1  1833271-1939129    4       AluSx (2)  (TATG)n (1)  MIR (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   175438       chr6  NT_167244.1  3180024-3355462    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   173140       chr6  NT_167247.1  4422006-4595146    LOC100507722  hypothetical_protein_LOC100507722
8   165456       chr6  NT_167247.1  1562671-1728127    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011