Distribution of restriction sites in the human genome

Enzyme:  RpaB53I               Longest uncut segments
Specificity:  CWTCCAG               Repeats in uncut segments
Number of sites:  1091945               Genes in uncut segments
Mean distance between sites:  2620 base pairs
Standard deviation:  2846 base pairs
Site density 381.6 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488083  chr15  NT_037852.6  1398805-1886888    0.01 % in   1 repeats    0.00 % in 0 genes
2   409926  chr6  NT_167244.1  2352900-2762826    1.29 % in   22 repeats    0.00 % in 0 genes
3   209491  chr6  NT_167244.1  4389913-4599404    0.65 % in   7 repeats    0.00 % in 0 genes
4   183570  chr6  NT_167244.1  3790027-3973597    1.40 % in   14 repeats    0.00 % in 0 genes
5   181996  chr6  NT_167247.1  4414858-4596854    2.09 % in   13 repeats    98.76 % in 1 genes
6   177515  chr6  NT_167244.1  3177945-3355460    0.45 % in   9 repeats    1.28 % in 1 genes
7   167045  chr6  NT_167249.1  2136353-2303398    0.84 % in   8 repeats    0.00 % in 0 genes
8   166339  chr6  NT_167248.1  518482-684821    4.23 % in   2 repeats    0.00 % in 0 genes
9   166162  chr6  NT_167247.1  1562631-1728793    0.50 % in   5 repeats    0.00 % in 0 genes
10   152783  chr9  NT_008470.19  21692288-21845071    0.72 % in   6 repeats    0.00 % in 0 genes
11   146951  chr6  NT_167244.1  2893701-3040652    2.25 % in   20 repeats    0.00 % in 0 genes
12   119685  chr7  NT_023603.5  36751-156436    100.00 % in   1 repeats    0.00 % in 0 genes
13   119571  chr6  NT_167245.1  2605554-2725125    1.70 % in   4 repeats    0.00 % in 0 genes
14   119505  chr6  NT_167246.1  3260126-3379631    2.22 % in   16 repeats    0.00 % in 0 genes
15   117245  chr6  NT_167247.1  1176735-1293980    0.79 % in   1 repeats    0.00 % in 0 genes
16   115047  chr6  NT_167245.1  132195-247242    3.55 % in   11 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488083  chr15  NT_037852.6  1398805-1886888    1       AT_rich (1) 
409926  chr6  NT_167244.1  2352900-2762826    22  14       AluJb (4)  L1ME4a (3)  MLT2D (2) 
209491  chr6  NT_167244.1  4389913-4599404    6       AluSx (2)  L1PA15 (1)  L1ME3D (1) 
183570  chr6  NT_167244.1  3790027-3973597    14  12       MLT1H-int (2)  L2a (2)  (TA)n (1) 
181996  chr6  NT_167247.1  4414858-4596854    13  13       (TTAAA)n (1)  MLT1J (1)  MIRc (1) 
177515  chr6  NT_167244.1  3177945-3355460    7       GC_rich (3)  MER66C (1)  LTR23 (1) 
167045  chr6  NT_167249.1  2136353-2303398    8       MLT1A (1)  MamGypLTR1b (1)  L1MC4a (1) 
166339  chr6  NT_167248.1  518482-684821    2       L1PREC2 (1)  HERVH-int (1) 
166162  chr6  NT_167247.1  1562631-1728793    4       MIR (2)  L1MEe (1)  (GGAA)n (1) 
10  152783  chr9  NT_008470.19  21692288-21845071    4       LTR67B (2)  L2 (2)  MIR3 (1) 
11  146951  chr6  NT_167244.1  2893701-3040652    20  10       L1MC5 (6)  AluSc (3)  L2c (2) 
12  119685  chr7  NT_023603.5  36751-156436    1       ALR/Alpha (1) 
13  119571  chr6  NT_167245.1  2605554-2725125    3       L2 (2)  MLT1E2 (1)  L2a (1) 
14  119505  chr6  NT_167246.1  3260126-3379631    16  11       L1MC5 (3)  AluSx (3)  MIRb (2) 
15  117245  chr6  NT_167247.1  1176735-1293980    1       ERV3-16A3_I-int (1) 
16  115047  chr6  NT_167245.1  132195-247242    11  10       AluSx (2)  tRNA-Ala-GCY_ (1)  MLT1F (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   181996       chr6  NT_167247.1  4414858-4596854    LOC100507722  hypothetical_protein_LOC100507722
6   177515       chr6  NT_167244.1  3177945-3355460    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b



Posfai@neb.com
May 11, 2011