Distribution of restriction sites in the human genome

Enzyme:  OkrAI               Longest uncut segments
Specificity:  GGATCC               Repeats in uncut segments
Number of sites:  360918               Genes in uncut segments
Mean distance between sites:  7927 base pairs
Standard deviation:  8692 base pairs
Site density 126.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   542581  chr15  NT_037852.6  1380472-1923053    5.02 % in   106 repeats    1.84 % in 1 genes
2   417320  chr6  NT_167244.1  2344618-2761938    2.40 % in   45 repeats    0.00 % in 0 genes
3   318947  chrY  NT_011875.12  8417181-8736128    83.26 % in   65 repeats    0.25 % in 1 genes
4   215928  chr6  NT_167244.1  4388664-4604592    3.22 % in   16 repeats    0.00 % in 0 genes
5   212856  chr6  NT_167244.1  3785683-3998539    7.76 % in   64 repeats    1.37 % in 2 genes
6   192081  chr6  NT_167249.1  2116241-2308322    7.83 % in   70 repeats    0.00 % in 0 genes
7   184495  chr6  NT_167247.1  4414458-4598953    3.04 % in   24 repeats    98.56 % in 1 genes
8   178605  chr6  NT_167244.1  3179149-3357754    0.83 % in   10 repeats    1.48 % in 2 genes
9   173879  chr6  NT_167244.1  2872616-3046495    10.92 % in   94 repeats    0.00 % in 0 genes
10   171575  chr6  NT_167247.1  1559387-1730962    2.13 % in   16 repeats    0.00 % in 0 genes
11   165991  chr4  NT_006316.16  391712-557703    5.32 % in   59 repeats    0.00 % in 0 genes
12   165936  chr6  NT_167248.1  515336-681272    3.69 % in   7 repeats    0.00 % in 0 genes
13   159537  chr6  NT_167244.1  2005417-2164954    1.53 % in   11 repeats    0.00 % in 0 genes
14   158702  chr9  NT_008470.19  21689423-21848125    2.84 % in   16 repeats    0.00 % in 0 genes
15   152427  chr14  NT_026437.12  16167188-16319615    53.97 % in   341 repeats    0.00 % in 0 genes
16   145345  chr6  NT_167244.1  1420436-1565781    21.25 % in   101 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
542581  chr15  NT_037852.6  1380472-1923053    106  54       AT_rich (8)  Tigger2 (6)  L1MDa (6) 
417320  chr6  NT_167244.1  2344618-2761938    45  26       AluJb (5)  AluSx (4)  L1ME4a (3) 
318947  chrY  NT_011875.12  8417181-8736128    65  29       LTR12B (17)  L1PA16 (7)  L1ME3A (6) 
215928  chr6  NT_167244.1  4388664-4604592    16  11       HERVH-int (3)  MER57-int (2)  AluSx (2) 
212856  chr6  NT_167244.1  3785683-3998539    64  44       L2a (6)  AT_rich (4)  L1P3 (3) 
192081  chr6  NT_167249.1  2116241-2308322    70  37       AluSx (10)  Charlie2b (6)  AluJb (5) 
184495  chr6  NT_167247.1  4414458-4598953    24  19       AluSx (3)  MLT1J (2)  L2b (2) 
178605  chr6  NT_167244.1  3179149-3357754    10  6       GC_rich (3)  L2c (2)  AluSp (2) 
173879  chr6  NT_167244.1  2872616-3046495    94  29       AluSx (14)  AluJo (11)  AluY (8) 
10  171575  chr6  NT_167247.1  1559387-1730962    16  13       Tigger7 (2)  MIR (2)  L1MEe (2) 
11  165991  chr4  NT_006316.16  391712-557703    59  7       (CA)n (46)  L1M4 (7)  L1PA10 (2) 
12  165936  chr6  NT_167248.1  515336-681272    7       LTR7 (1)  L1PREC2 (1)  L1PA7 (1) 
13  159537  chr6  NT_167244.1  2005417-2164954    11  7       AluSx (4)  AluJb (2)  MIRb (1) 
14  158702  chr9  NT_008470.19  21689423-21848125    16  12       MIRb (2)  LTR67B (2)  L2 (2) 
15  152427  chr14  NT_026437.12  16167188-16319615    341  83       AluSx (57)  AluJb (27)  AluY (23) 
16  145345  chr6  NT_167244.1  1420436-1565781    101  56       L1MA1 (7)  AluY (6)  AluSx (5) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   542581       chr15  NT_037852.6  1380472-1923053    LOC100418897 
3   318947       chrY  NT_011875.12  8417181-8736128    ZNF884P 
5   212856       chr6  NT_167244.1  3785683-3998539    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
HLA-DQA2  HLA_class_II_histocompatibility_antigen,_DQ_alpha_2_chain_precursor
7   184495       chr6  NT_167247.1  4414458-4598953    LOC100507722  hypothetical_protein_LOC100507722
8   178605       chr6  NT_167244.1  3179149-3357754    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor



Posfai@neb.com
May 11, 2011