Distribution of restriction sites in the human genome

Enzyme:  XcmI               Longest uncut segments
Specificity:  CCANNNNNNNNNTGG               Repeats in uncut segments
Number of sites:  816463               Genes in uncut segments
Mean distance between sites:  3504 base pairs
Standard deviation:  4010 base pairs
Site density 285.3 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   501360  chr15  NT_037852.6  1394711-1896071    1.11 % in   25 repeats    0.60 % in 1 genes
2   412712  chr6  NT_167244.1  2350984-2763696    1.48 % in   29 repeats    0.00 % in 0 genes
3   214916  chr6  NT_167244.1  4384619-4599535    2.32 % in   16 repeats    0.00 % in 0 genes
4   194531  chr6  NT_167247.1  4410498-4605029    4.05 % in   36 repeats    95.49 % in 3 genes
5   193838  chrY  NT_011875.12  8520708-8714546    74.11 % in   13 repeats    0.00 % in 0 genes
6   185611  chr6  NT_167244.1  3787765-3973376    1.63 % in   17 repeats    0.00 % in 0 genes
7   176151  chr6  NT_167244.1  3179564-3355715    0.26 % in   6 repeats    0.38 % in 1 genes
8   174602  chr6  NT_167249.1  2131612-2306214    4.17 % in   30 repeats    0.00 % in 0 genes
9   171877  chr6  NT_167247.1  1556070-1727947    2.74 % in   24 repeats    0.00 % in 0 genes
10   160196  chr6  NT_167248.1  521496-681692    0.55 % in   2 repeats    0.00 % in 0 genes
11   158938  chr6  NT_167244.1  2005584-2164522    1.48 % in   10 repeats    0.00 % in 0 genes
12   152917  chr6  NT_167244.1  2885401-3038318    5.10 % in   39 repeats    0.00 % in 0 genes
13   152505  chr9  NT_008470.19  21692597-21845102    0.68 % in   5 repeats    0.00 % in 0 genes
14   126036  chr6  NT_167249.1  4720096-4846132    11.68 % in   69 repeats    0.00 % in 0 genes
15   121660  chr6  NT_167246.1  3253842-3375502    0.78 % in   5 repeats    0.00 % in 0 genes
16   118345  chr10  NT_008705.16  38712011-38830356    27.09 % in   213 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
501360  chr15  NT_037852.6  1394711-1896071    25  19       L2a (3)  MER44C (2)  L1MDa (2) 
412712  chr6  NT_167244.1  2350984-2763696    29  20       AluJb (4)  L1ME4a (3)  MLT2D (2) 
214916  chr6  NT_167244.1  4384619-4599535    16  11       MER57-int (3)  AluSx (3)  AluY (2) 
194531  chr6  NT_167247.1  4410498-4605029    36  26       L2b (3)  AluSx (3)  MLT1J (2) 
193838  chrY  NT_011875.12  8520708-8714546    13  4       LTR12B (10)  L1PA8A (1)  L1PA16 (1) 
185611  chr6  NT_167244.1  3787765-3973376    17  14       MLT1H-int (2)  L2a (2)  AT_rich (2) 
176151  chr6  NT_167244.1  3179564-3355715    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
174602  chr6  NT_167249.1  2131612-2306214    30  15       AluSx (6)  L1MB8 (3)  Charlie2b (3) 
171877  chr6  NT_167247.1  1556070-1727947    24  19       L2c (3)  Tigger7 (2)  MSTD (2) 
10  160196  chr6  NT_167248.1  521496-681692    2       L1PREC2 (1)  HERVH-int (1) 
11  158938  chr6  NT_167244.1  2005584-2164522    10  6       AluSx (4)  AluJb (2)  MIRb (1) 
12  152917  chr6  NT_167244.1  2885401-3038318    39  22       AluY (5)  L2a (3)  AluSx (3) 
13  152505  chr9  NT_008470.19  21692597-21845102    4       L2 (2)  MIR3 (1)  LTR67B (1) 
14  126036  chr6  NT_167249.1  4720096-4846132    69  28       AluSx (12)  AluY (8)  L2a (5) 
15  121660  chr6  NT_167246.1  3253842-3375502    3       MIRb (2)  AluSx (2)  MIR3 (1) 
16  118345  chr10  NT_008705.16  38712011-38830356    213  28       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   501360       chr15  NT_037852.6  1394711-1896071    LOC100418897 
4   194531       chr6  NT_167247.1  4410498-4605029    COL11A2P 
LOC100507722  hypothetical_protein_LOC100507722
COL11A2  collagen_alpha-2(XI)_chain_isoform_4_precursor
7   176151       chr6  NT_167244.1  3179564-3355715    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b



Posfai@neb.com
May 11, 2011