Distribution of restriction sites in the human genome

Enzyme:  CcoMI               Longest uncut segments
Specificity:  CAGCAG               Repeats in uncut segments
Number of sites:  2332201               Genes in uncut segments
Mean distance between sites:  1226 base pairs
Standard deviation:  1561 base pairs
Site density 815.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   490254  chr15  NT_037852.6  1395422-1885676    0.24 % in   7 repeats    0.00 % in 0 genes
2   403197  chr6  NT_167244.1  2358112-2761309    0.37 % in   7 repeats    0.00 % in 0 genes
3   212542  chr6  NT_167244.1  4388006-4600548    1.68 % in   14 repeats    0.00 % in 0 genes
4   183155  chr6  NT_167244.1  3789509-3972664    1.03 % in   11 repeats    0.00 % in 0 genes
5   176347  chr6  NT_167244.1  3179494-3355841    0.26 % in   6 repeats    0.41 % in 1 genes
6   172351  chr6  NT_167247.1  4422132-4594483    0.13 % in   2 repeats    100.00 % in 1 genes
7   168057  chr6  NT_167247.1  1560806-1728863    1.11 % in   8 repeats    1.28 % in 1 genes
8   167374  chr6  NT_167249.1  2137908-2305282    1.06 % in   9 repeats    0.00 % in 0 genes
9   161515  chr6  NT_167248.1  521134-682649    1.37 % in   2 repeats    0.00 % in 0 genes
10   156395  chr6  NT_167244.1  2008325-2164720    0.52 % in   4 repeats    0.00 % in 0 genes
11   151009  chr9  NT_008470.19  21692907-21843916    0.28 % in   2 repeats    0.00 % in 0 genes
12   150143  chr6  NT_167244.1  2890801-3040944    3.81 % in   29 repeats    0.00 % in 0 genes
13   121072  chr10  NT_008705.16  38711376-38832448    27.59 % in   220 repeats    0.00 % in 0 genes
14   118766  chr6  NT_167245.1  2605702-2724468    1.04 % in   4 repeats    0.00 % in 0 genes
15   117212  chr6  NT_167247.1  1176271-1293483    1.19 % in   2 repeats    0.00 % in 0 genes
16   114342  chr6  NT_167246.1  3260945-3375287    0.41 % in   3 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
490254  chr15  NT_037852.6  1395422-1885676    7       MIRc (1)  MIRb (1)  L1M3 (1) 
403197  chr6  NT_167244.1  2358112-2761309    5       L4 (2)  AluJb (2)  L1ME4a (1) 
212542  chr6  NT_167244.1  4388006-4600548    14  11       MER57-int (2)  AluSx (2)  AluSg/x (2) 
183155  chr6  NT_167244.1  3789509-3972664    11  10       MLT1H-int (2)  (TA)n (1)  MLT1H (1) 
176347  chr6  NT_167244.1  3179494-3355841    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
172351  chr6  NT_167247.1  4422132-4594483    2       MER11A (1)  AluSc (1) 
168057  chr6  NT_167247.1  1560806-1728863    7       MIR (2)  MIRc (1)  L1MEe (1) 
167374  chr6  NT_167249.1  2137908-2305282    5       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
161515  chr6  NT_167248.1  521134-682649    2       L1PREC2 (1)  HERVH-int (1) 
10  156395  chr6  NT_167244.1  2008325-2164720    4       MIRb (1)  MIR (1)  AluY (1) 
11  151009  chr9  NT_008470.19  21692907-21843916    2       MIR3 (1)  L1M5 (1) 
12  150143  chr6  NT_167244.1  2890801-3040944    29  15       L1MC5 (6)  AluY (5)  AluSc (3) 
13  121072  chr10  NT_008705.16  38711376-38832448    220  32       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 
14  118766  chr6  NT_167245.1  2605702-2724468    3       L2 (2)  MLT1E2 (1)  L2a (1) 
15  117212  chr6  NT_167247.1  1176271-1293483    1       ERV3-16A3_I-int (2) 
16  114342  chr6  NT_167246.1  3260945-3375287    2       MIRb (2)  AluSx (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   176347       chr6  NT_167244.1  3179494-3355841    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   172351       chr6  NT_167247.1  4422132-4594483    LOC100507722  hypothetical_protein_LOC100507722
7   168057       chr6  NT_167247.1  1560806-1728863    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011