Distribution of restriction sites in the human genome

Enzyme:  BsaXI               Longest uncut segments
Specificity:  ACNNNNNCTCC               Repeats in uncut segments
Number of sites:  1313246               Genes in uncut segments
Mean distance between sites:  2178 base pairs
Standard deviation:  2468 base pairs
Site density 459.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   490304  chr15  NT_037852.6  1394902-1885206    0.27 % in   7 repeats    0.00 % in 0 genes
2   402734  chr6  NT_167244.1  2358634-2761368    0.26 % in   4 repeats    0.00 % in 0 genes
3   299871  chrY  NT_011875.12  8415039-8714910    82.80 % in   28 repeats    0.00 % in 0 genes
4   208022  chr6  NT_167244.1  4389900-4597922    0.08 % in   2 repeats    0.00 % in 0 genes
5   182320  chr6  NT_167244.1  3788621-3970941    0.53 % in   7 repeats    0.00 % in 0 genes
6   175712  chr6  NT_167244.1  3179918-3355630    0.24 % in   5 repeats    0.17 % in 1 genes
7   174264  chr6  NT_167249.1  2130295-2304559    3.72 % in   29 repeats    0.00 % in 0 genes
8   172686  chr6  NT_167247.1  4421827-4594513    0.15 % in   2 repeats    100.00 % in 1 genes
9   160452  chr6  NT_167248.1  521225-681677    0.71 % in   2 repeats    0.00 % in 0 genes
10   158655  chr6  NT_167244.1  2009831-2168486    0.76 % in   5 repeats    0.00 % in 0 genes
11   158499  chr9  NT_008470.19  21687676-21846175    3.36 % in   17 repeats    0.00 % in 0 genes
12   147074  chr6  NT_167244.1  2894338-3041412    2.02 % in   18 repeats    0.00 % in 0 genes
13   120628  chr6  NT_167245.1  2605440-2726068    2.15 % in   5 repeats    0.00 % in 0 genes
14   119927  chr10  NT_008705.16  38712074-38832001    27.21 % in   215 repeats    0.00 % in 0 genes
15   119710  chr6  NT_167247.1  1173430-1293140    3.43 % in   7 repeats    0.00 % in 0 genes
16   118255  chr6  NT_167244.1  575098-693353    6.88 % in   23 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
490304  chr15  NT_037852.6  1394902-1885206    7       MIRc (1)  MIRb (1)  L1MDa (1) 
402734  chr6  NT_167244.1  2358634-2761368    3       AluJb (2)  L4 (1)  AluSp (1) 
299871  chrY  NT_011875.12  8415039-8714910    28  8       LTR12B (17)  L1PA7 (3)  LTR12D (2) 
208022  chr6  NT_167244.1  4389900-4597922    2       AluSg/x (1)  AluJo (1) 
182320  chr6  NT_167244.1  3788621-3970941    6       AT_rich (2)  MLT1H-int (1)  MIR (1) 
175712  chr6  NT_167244.1  3179918-3355630    4       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
174264  chr6  NT_167249.1  2130295-2304559    29  15       AluSx (5)  L1MB8 (3)  AluJo (3) 
172686  chr6  NT_167247.1  4421827-4594513    2       MER11A (1)  AluSc (1) 
160452  chr6  NT_167248.1  521225-681677    2       L1PREC2 (1)  HERVH-int (1) 
10  158655  chr6  NT_167244.1  2009831-2168486    5       MIR (1)  MER5A1 (1)  L1ME3C (1) 
11  158499  chr9  NT_008470.19  21687676-21846175    17  11       MER5B (2)  LTR67B (2)  L2 (2) 
12  147074  chr6  NT_167244.1  2894338-3041412    18  9       L1MC5 (6)  L2c (2)  AluY (2) 
13  120628  chr6  NT_167245.1  2605440-2726068    4       L2 (2)  MLT1E2 (1)  L2a (1) 
14  119927  chr10  NT_008705.16  38712074-38832001    215  30       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 
15  119710  chr6  NT_167247.1  1173430-1293140    4       L2 (3)  ERV3-16A3_I-int (2)  MLT1E2 (1) 
16  118255  chr6  NT_167244.1  575098-693353    23  19       L1M5 (3)  L1PA7 (2)  AluY (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   175712       chr6  NT_167244.1  3179918-3355630    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
8   172686       chr6  NT_167247.1  4421827-4594513    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011