Distribution of restriction sites in the human genome

Enzyme:  TfiI               Longest uncut segments
Specificity:  GAWTC               Repeats in uncut segments
Number of sites:  4692933               Genes in uncut segments
Mean distance between sites:  609 base pairs
Standard deviation:  635 base pairs
Site density1640.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488740  chr15  NT_037852.6  1397332-1886072    0.11 % in   5 repeats    0.00 % in 0 genes
2   401739  chr6  NT_167244.1  2359768-2761507    0.05 % in   1 repeats    0.00 % in 0 genes
3   209399  chr6  NT_167244.1  4389588-4598987    0.71 % in   7 repeats    0.00 % in 0 genes
4   181574  chr6  NT_167244.1  3789563-3971137    0.42 % in   4 repeats    0.00 % in 0 genes
5   177329  chr6  NT_167244.1  3179193-3356522    0.25 % in   6 repeats    0.77 % in 2 genes
6   174799  chr6  NT_167247.1  4421216-4596015    0.91 % in   6 repeats    100.00 % in 1 genes
7   165600  chr6  NT_167249.1  2137813-2303413    0.22 % in   4 repeats    0.00 % in 0 genes
8   165327  chr6  NT_167247.1  1562941-1728268    0.41 % in   4 repeats    0.01 % in 1 genes
9   160250  chr6  NT_167248.1  521804-682054    0.59 % in   2 repeats    0.00 % in 0 genes
10   157468  chr6  NT_167244.1  2008988-2166456    0.16 % in   3 repeats    0.00 % in 0 genes
11   150920  chr9  NT_008470.19  21692645-21843565    0.41 % in   2 repeats    0.00 % in 0 genes
12   143368  chr6  NT_167244.1  2894626-3037994    0.38 % in   5 repeats    0.00 % in 0 genes
13   118111  chr6  NT_167245.1  2605641-2723752    0.52 % in   2 repeats    0.00 % in 0 genes
14   116250  chr6  NT_167247.1  1177082-1293332    0.50 % in   1 repeats    0.00 % in 0 genes
15   109488  chr6  NT_167245.1  136566-246054    1.45 % in   3 repeats    0.00 % in 0 genes
16   105291  chr6  NT_167244.1  1451065-1556356    0.55 % in   3 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488740  chr15  NT_037852.6  1397332-1886072    5       MIRc (1)  MIRb (1)  L1M3 (1) 
401739  chr6  NT_167244.1  2359768-2761507    1       AluSp (1) 
209399  chr6  NT_167244.1  4389588-4598987    6       AluSx (2)  (TTCC)n (1)  MER57-int (1) 
181574  chr6  NT_167244.1  3789563-3971137    4       MLT1H-int (1)  MER52D (1)  AluSc (1) 
177329  chr6  NT_167244.1  3179193-3356522    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
174799  chr6  NT_167247.1  4421216-4596015    6       (TTAAA)n (1)  MIR (1)  MER11A (1) 
165600  chr6  NT_167249.1  2137813-2303413    4       L1MC4a (1)  L1MB8 (1)  AT_rich (1) 
165327  chr6  NT_167247.1  1562941-1728268    3       MIR (2)  (GGAA)n (1)  AluSq (1) 
160250  chr6  NT_167248.1  521804-682054    2       L1PREC2 (1)  HERVH-int (1) 
10  157468  chr6  NT_167244.1  2008988-2166456    3       MIRb (1)  MIR (1)  MER5A1 (1) 
11  150920  chr9  NT_008470.19  21692645-21843565    2       LTR67B (1)  L1M5 (1) 
12  143368  chr6  NT_167244.1  2894626-3037994    5       L1MC5 (1)  AluY (1)  AluSp (1) 
13  118111  chr6  NT_167245.1  2605641-2723752    2       L2a (1)  L2 (1) 
14  116250  chr6  NT_167247.1  1177082-1293332    1       ERV3-16A3_I-int (1) 
15  109488  chr6  NT_167245.1  136566-246054    3       MLT1E2 (1)  MER6 (1)  LTR12C (1) 
16  105291  chr6  NT_167244.1  1451065-1556356    3       ERV3-16A3_I-int (1)  AluY (1)  AluSg1 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   177329       chr6  NT_167244.1  3179193-3356522    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   174799       chr6  NT_167247.1  4421216-4596015    LOC100507722  hypothetical_protein_LOC100507722
8   165327       chr6  NT_167247.1  1562941-1728268    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011