Distribution of restriction sites in the human genome

Enzyme:  TdeII               Longest uncut segments
Specificity:  CTCTTC               Repeats in uncut segments
Number of sites:  2259021               Genes in uncut segments
Mean distance between sites:  1266 base pairs
Standard deviation:  1391 base pairs
Site density 789.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488340  chr15  NT_037852.6  1397488-1885828    0.09 % in   4 repeats    0.00 % in 0 genes
2   405548  chr6  NT_167244.1  2356225-2761773    0.68 % in   12 repeats    0.00 % in 0 genes
3   213540  chr6  NT_167244.1  4388953-4602493    2.14 % in   15 repeats    0.00 % in 0 genes
4   181870  chr6  NT_167244.1  3788772-3970642    0.32 % in   6 repeats    0.00 % in 0 genes
5   176718  chr6  NT_167244.1  3179754-3356472    0.26 % in   6 repeats    0.43 % in 2 genes
6   174690  chr6  NT_167247.1  4421540-4596230    0.97 % in   6 repeats    100.00 % in 1 genes
7   167301  chr6  NT_167249.1  2135748-2303049    1.12 % in   9 repeats    0.00 % in 0 genes
8   165374  chr6  NT_167247.1  1561475-1726849    0.44 % in   2 repeats    0.89 % in 1 genes
9   163140  chr6  NT_167248.1  519530-682670    2.35 % in   2 repeats    0.00 % in 0 genes
10   156850  chr6  NT_167244.1  2007747-2164597    0.79 % in   5 repeats    0.00 % in 0 genes
11   151219  chr9  NT_008470.19  21693212-21844431    0.08 % in   2 repeats    0.00 % in 0 genes
12   144702  chr6  NT_167244.1  2893815-3038517    0.94 % in   9 repeats    0.00 % in 0 genes
13   118988  chr6  NT_167245.1  2606156-2725144    1.22 % in   4 repeats    0.00 % in 0 genes
14   116813  chr6  NT_167247.1  1176804-1293617    0.74 % in   1 repeats    0.00 % in 0 genes
15   115876  chr6  NT_167246.1  3259828-3375704    0.56 % in   4 repeats    0.00 % in 0 genes
16   112427  chr6  NT_167245.1  135649-248076    3.31 % in   10 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488340  chr15  NT_037852.6  1397488-1885828    4       MIRc (1)  MIRb (1)  L1M3 (1) 
405548  chr6  NT_167244.1  2356225-2761773    12  9       AluJb (3)  L4 (2)  MLT2D (1) 
213540  chr6  NT_167244.1  4388953-4602493    15  11       MER57-int (2)  HERVH-int (2)  AluSx (2) 
181870  chr6  NT_167244.1  3788772-3970642    5       AT_rich (2)  MLT1H-int (1)  MIR (1) 
176718  chr6  NT_167244.1  3179754-3356472    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
174690  chr6  NT_167247.1  4421540-4596230    6       (TTAAA)n (1)  MLT1J (1)  MER11A (1) 
167301  chr6  NT_167249.1  2135748-2303049    7       MLT1A (2)  AluJb (2)  MamGypLTR1b (1) 
165374  chr6  NT_167247.1  1561475-1726849    2       L1MC3 (1)  A-rich (1) 
163140  chr6  NT_167248.1  519530-682670    2       L1PREC2 (1)  HERVH-int (1) 
10  156850  chr6  NT_167244.1  2007747-2164597    4       AluSx (2)  MIRb (1)  MIR (1) 
11  151219  chr9  NT_008470.19  21693212-21844431    2       MIR3 (1)  L1M5 (1) 
12  144702  chr6  NT_167244.1  2893815-3038517    7       L1MC5 (2)  AluJo (2)  (TCC)n (1) 
13  118988  chr6  NT_167245.1  2606156-2725144    3       L2 (2)  MLT1E2 (1)  L2a (1) 
14  116813  chr6  NT_167247.1  1176804-1293617    1       ERV3-16A3_I-int (1) 
15  115876  chr6  NT_167246.1  3259828-3375704    3       MIRb (2)  MIR3 (1)  AluSx (1) 
16  112427  chr6  NT_167245.1  135649-248076    10  9       L2c (2)  (TTTC)n (1)  MLT1F (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   176718       chr6  NT_167244.1  3179754-3356472    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   174690       chr6  NT_167247.1  4421540-4596230    LOC100507722  hypothetical_protein_LOC100507722
8   165374       chr6  NT_167247.1  1561475-1726849    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011