Distribution of restriction sites in the human genome

Enzyme:  NgoAVIII               Longest uncut segments
Specificity:  GACNNNNNTGA               Repeats in uncut segments
Number of sites:  1233348               Genes in uncut segments
Mean distance between sites:  2319 base pairs
Standard deviation:  2390 base pairs
Site density 431.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   489794  chr15  NT_037852.6  1397222-1887016    0.15 % in   6 repeats    0.00 % in 0 genes
2   405774  chr6  NT_167244.1  2359441-2765215    0.35 % in   6 repeats    0.00 % in 0 genes
3   210462  chr6  NT_167244.1  4387695-4598157    1.22 % in   6 repeats    0.00 % in 0 genes
4   183579  chr6  NT_167244.1  3789845-3973424    1.36 % in   13 repeats    0.00 % in 0 genes
5   181055  chr6  NT_167244.1  3175353-3356408    1.70 % in   25 repeats    2.81 % in 2 genes
6   176580  chr6  NT_167247.1  4419325-4595905    1.17 % in   10 repeats    100.00 % in 1 genes
7   167930  chr6  NT_167249.1  2136453-2304383    1.32 % in   11 repeats    0.00 % in 0 genes
8   166074  chr6  NT_167247.1  1561847-1727921    0.62 % in   6 repeats    0.67 % in 1 genes
9   161926  chr6  NT_167248.1  520299-682225    1.62 % in   2 repeats    0.00 % in 0 genes
10   150742  chr9  NT_008470.19  21692872-21843614    0.26 % in   1 repeats    0.00 % in 0 genes
11   144917  chr6  NT_167244.1  2893314-3038231    0.80 % in   8 repeats    0.00 % in 0 genes
12   123176  chr6  NT_167247.1  1169727-1292903    4.22 % in   11 repeats    0.00 % in 0 genes
13   119408  chr6  NT_167245.1  2605756-2725164    1.56 % in   4 repeats    0.00 % in 0 genes
14   117277  chr6  NT_167246.1  3259177-3376454    1.06 % in   9 repeats    0.00 % in 0 genes
15   111845  chr6  NT_167245.1  136543-248388    3.13 % in   10 repeats    0.00 % in 0 genes
16   110852  chr6  NT_167244.1  587940-698792    3.47 % in   15 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
489794  chr15  NT_037852.6  1397222-1887016    6       MLT1L (1)  MIRc (1)  MIRb (1) 
405774  chr6  NT_167244.1  2359441-2765215    5       LTR84b (2)  MLT1B (1)  L1MEg (1) 
210462  chr6  NT_167244.1  4387695-4598157    5       MER57-int (2)  (TTCC)n (1)  AluY (1) 
183579  chr6  NT_167244.1  3789845-3973424    13  11       MLT1H-int (2)  L2a (2)  (TA)n (1) 
181055  chr6  NT_167244.1  3175353-3356408    25  15       L1MB3 (4)  AluSx (4)  GC_rich (3) 
176580  chr6  NT_167247.1  4419325-4595905    10  10       (TTAAA)n (1)  MIRb (1)  MIR (1) 
167930  chr6  NT_167249.1  2136453-2304383    11  7       L1MB8 (3)  AluSx (3)  MLT1A (1) 
166074  chr6  NT_167247.1  1561847-1727921    5       MIR (2)  L1MC3 (1)  (GGAA)n (1) 
161926  chr6  NT_167248.1  520299-682225    2       L1PREC2 (1)  HERVH-int (1) 
10  150742  chr9  NT_008470.19  21692872-21843614    1       L1M5 (1) 
11  144917  chr6  NT_167244.1  2893314-3038231    7       AluJo (2)  (TCC)n (1)  L1MC5 (1) 
12  123176  chr6  NT_167247.1  1169727-1292903    11  7       L2 (3)  MIRb (2)  ERV3-16A3_I-int (2) 
13  119408  chr6  NT_167245.1  2605756-2725164    3       L2 (2)  MLT1E2 (1)  L2a (1) 
14  117277  chr6  NT_167246.1  3259177-3376454    6       AluSx (3)  MIRb (2)  (TTA)n (1) 
15  111845  chr6  NT_167245.1  136543-248388    10  9       L2c (2)  (TTTC)n (1)  MLT1F (1) 
16  110852  chr6  NT_167244.1  587940-698792    15  12       L1MA9 (3)  L1MC5 (2)  THE1D (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   181055       chr6  NT_167244.1  3175353-3356408    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   176580       chr6  NT_167247.1  4419325-4595905    LOC100507722  hypothetical_protein_LOC100507722
8   166074       chr6  NT_167247.1  1561847-1727921    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011