Distribution of restriction sites in the human genome

Enzyme:  NhaXI               Longest uncut segments
Specificity:  CAAGRAG               Repeats in uncut segments
Number of sites:  1067863               Genes in uncut segments
Mean distance between sites:  2679 base pairs
Standard deviation:  2824 base pairs
Site density 373.2 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   491088  chr15  NT_037852.6  1396628-1887716    0.28 % in   9 repeats    0.00 % in 0 genes
2   404940  chr6  NT_167244.1  2356876-2761816    0.55 % in   9 repeats    0.00 % in 0 genes
3   218500  chr6  NT_167244.1  4385937-4604437    4.21 % in   21 repeats    0.00 % in 0 genes
4   182548  chr6  NT_167244.1  3788057-3970605    0.47 % in   6 repeats    0.00 % in 0 genes
5   181605  chr6  NT_167244.1  3174869-3356474    1.70 % in   25 repeats    3.11 % in 2 genes
6   174445  chr6  NT_167247.1  4420521-4594966    0.71 % in   6 repeats    100.00 % in 1 genes
7   167143  chr6  NT_167249.1  2138176-2305319    1.03 % in   8 repeats    0.00 % in 0 genes
8   166192  chr6  NT_167247.1  1561538-1727730    0.72 % in   6 repeats    0.85 % in 1 genes
9   160843  chr6  NT_167248.1  521672-682515    0.95 % in   2 repeats    0.00 % in 0 genes
10   158762  chr6  NT_167244.1  2009912-2168674    0.76 % in   5 repeats    0.00 % in 0 genes
11   156394  chr9  NT_008470.19  21691125-21847519    1.72 % in   13 repeats    0.00 % in 0 genes
12   145665  chr6  NT_167244.1  2893827-3039492    1.60 % in   14 repeats    0.00 % in 0 genes
13   119562  chr6  NT_167247.1  1173706-1293268    3.20 % in   7 repeats    0.00 % in 0 genes
14   118569  chr6  NT_167245.1  2605886-2724455    0.87 % in   4 repeats    0.00 % in 0 genes
15   117223  chr10  NT_008705.16  38711713-38828936    26.54 % in   213 repeats    0.00 % in 0 genes
16   116298  chr6  NT_167246.1  3259454-3375752    0.56 % in   4 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
491088  chr15  NT_037852.6  1396628-1887716    9       MLT1L (1)  MIRc (1)  MIRb (1) 
404940  chr6  NT_167244.1  2356876-2761816    7       L4 (2)  AluJb (2)  MER8 (1) 
218500  chr6  NT_167244.1  4385937-4604437    21  13       MER57-int (3)  HERVH-int (3)  AluSx (3) 
182548  chr6  NT_167244.1  3788057-3970605    5       AT_rich (2)  MIR (1)  MER52D (1) 
181605  chr6  NT_167244.1  3174869-3356474    25  15       L1MB3 (4)  AluSx (4)  GC_rich (3) 
174445  chr6  NT_167247.1  4420521-4594966    6       MIR (1)  MER11A (1)  L2b (1) 
167143  chr6  NT_167249.1  2138176-2305319    4       L1MB8 (3)  AluSx (3)  Charlie2b (1) 
166192  chr6  NT_167247.1  1561538-1727730    5       MIR (2)  L1MC3 (1)  (GGAA)n (1) 
160843  chr6  NT_167248.1  521672-682515    2       L1PREC2 (1)  HERVH-int (1) 
10  158762  chr6  NT_167244.1  2009912-2168674    5       MIR (1)  MER5A1 (1)  L1ME3C (1) 
11  156394  chr9  NT_008470.19  21691125-21847519    13  10       MIRb (2)  LTR67B (2)  L2 (2) 
12  145665  chr6  NT_167244.1  2893827-3039492    14  8       L1MC5 (4)  AluSc (3)  AluJo (2) 
13  119562  chr6  NT_167247.1  1173706-1293268    4       L2 (3)  ERV3-16A3_I-int (2)  MLT1E2 (1) 
14  118569  chr6  NT_167245.1  2605886-2724455    3       L2 (2)  MLT1E2 (1)  L2a (1) 
15  117223  chr10  NT_008705.16  38711713-38828936    213  27       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 
16  116298  chr6  NT_167246.1  3259454-3375752    3       MIRb (2)  MIR3 (1)  AluSx (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   181605       chr6  NT_167244.1  3174869-3356474    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   174445       chr6  NT_167247.1  4420521-4594966    LOC100507722  hypothetical_protein_LOC100507722
8   166192       chr6  NT_167247.1  1561538-1727730    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011