Distribution of restriction sites in the human genome

Enzyme:  DraI               Longest uncut segments
Specificity:  TTTAAA               Repeats in uncut segments
Number of sites:  3403842               Genes in uncut segments
Mean distance between sites:  840 base pairs
Standard deviation:  1133 base pairs
Site density1189.6 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   402395  chr6  NT_167244.1  2359151-2761546    0.13 % in   2 repeats    0.00 % in 0 genes
2   208830  chr6  NT_167244.1  4389162-4597992    0.46 % in   6 repeats    0.00 % in 0 genes
3   183048  chr6  NT_167244.1  3788748-3971796    0.92 % in   9 repeats    0.00 % in 0 genes
4   177535  chr6  NT_167244.1  3178033-3355568    0.49 % in   9 repeats    1.23 % in 1 genes
5   176718  chr6  NT_167247.1  4421446-4598164    1.59 % in   11 repeats    100.00 % in 1 genes
6   165382  chr6  NT_167249.1  2138281-2303663    0.27 % in   5 repeats    0.00 % in 0 genes
7   164510  chr6  NT_167247.1  1562216-1726726    0.02 % in   1 repeats    0.45 % in 1 genes
8   162088  chr6  NT_167248.1  521126-683214    1.71 % in   2 repeats    0.00 % in 0 genes
9   157423  chr6  NT_167244.1  2009272-2166695    0.14 % in   2 repeats    0.00 % in 0 genes
10   152088  chr9  NT_008470.19  21691803-21843891    0.75 % in   5 repeats    0.00 % in 0 genes
11   144062  chr6  NT_167244.1  2893549-3037611    0.37 % in   5 repeats    0.00 % in 0 genes
12   120804  chr6  NT_167247.1  1174264-1295068    2.71 % in   6 repeats    0.00 % in 0 genes
13   118161  chr6  NT_167245.1  2605721-2723882    0.54 % in   3 repeats    0.00 % in 0 genes
14   116338  chr6  NT_167246.1  3258209-3374547    0.16 % in   1 repeats    0.00 % in 0 genes
15   115031  chr1  NT_004350.19  2059898-2174929    0.89 % in   3 repeats    0.00 % in 0 genes
16   113589  chr6  NT_167245.1  133786-247375    3.17 % in   10 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
402395  chr6  NT_167244.1  2359151-2761546    2       L4 (1)  AluSp (1) 
208830  chr6  NT_167244.1  4389162-4597992    5       MER57-int (2)  (TTCC)n (1)  AluY (1) 
183048  chr6  NT_167244.1  3788748-3971796    8       AT_rich (2)  MLT1H-int (1)  MIR (1) 
177535  chr6  NT_167244.1  3178033-3355568    7       GC_rich (3)  LTR23 (1)  L2a (1) 
176718  chr6  NT_167247.1  4421446-4598164    11  9       MLT1J (2)  AluSx (2)  (TTAAA)n (1) 
165382  chr6  NT_167249.1  2138281-2303663    3       L1MB8 (2)  AluSx (2)  AT_rich (1) 
164510  chr6  NT_167247.1  1562216-1726726    1       A-rich (1) 
162088  chr6  NT_167248.1  521126-683214    2       L1PREC2 (1)  HERVH-int (1) 
157423  chr6  NT_167244.1  2009272-2166695    2       MIRb (1)  MER5A1 (1) 
10  152088  chr9  NT_008470.19  21691803-21843891    4       LTR67B (2)  MSTA (1)  MIR3 (1) 
11  144062  chr6  NT_167244.1  2893549-3037611    5       (TCC)n (1)  L1MC5 (1)  AluY (1) 
12  120804  chr6  NT_167247.1  1174264-1295068    4       L2 (2)  ERV3-16A3_I-int (2)  MLT1E2 (1) 
13  118161  chr6  NT_167245.1  2605721-2723882    3       MLT1E2 (1)  L2a (1)  L2 (1) 
14  116338  chr6  NT_167246.1  3258209-3374547    1       MIR3 (1) 
15  115031  chr1  NT_004350.19  2059898-2174929    2       L1MB3 (2)  AluSg (1) 
16  113589  chr6  NT_167245.1  133786-247375    10  9       AluSx (2)  tRNA-Ala-GCY_ (1)  MLT1F (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   177535       chr6  NT_167244.1  3178033-3355568    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
5   176718       chr6  NT_167247.1  4421446-4598164    LOC100507722  hypothetical_protein_LOC100507722
7   164510       chr6  NT_167247.1  1562216-1726726    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011