Distribution of restriction sites in the human genome

Enzyme:  EcoNI               Longest uncut segments
Specificity:  CCTNNNNNAGG               Repeats in uncut segments
Number of sites:  768378               Genes in uncut segments
Mean distance between sites:  3723 base pairs
Standard deviation:  4408 base pairs
Site density 268.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   499743  chr15  NT_037852.6  1396934-1896677    0.99 % in   22 repeats    0.72 % in 1 genes
2   404486  chr6  NT_167244.1  2357068-2761554    0.55 % in   9 repeats    0.00 % in 0 genes
3   211362  chr6  NT_167244.1  4387845-4599207    1.59 % in   11 repeats    0.00 % in 0 genes
4   198598  chr6  NT_167244.1  3782035-3980633    4.94 % in   38 repeats    2.75 % in 1 genes
5   181164  chr6  NT_167249.1  2135866-2317030    6.18 % in   49 repeats    0.00 % in 0 genes
6   176767  chr6  NT_167244.1  3179311-3356078    0.26 % in   6 repeats    0.52 % in 1 genes
7   174339  chr6  NT_167247.1  4421068-4595407    0.76 % in   4 repeats    100.00 % in 1 genes
8   168183  chr6  NT_167247.1  1561535-1729718    1.09 % in   9 repeats    0.84 % in 1 genes
9   164879  chr6  NT_167248.1  521866-686745    2.69 % in   3 repeats    0.00 % in 0 genes
10   158736  chr6  NT_167244.1  2882588-3041324    7.47 % in   59 repeats    0.00 % in 0 genes
11   158454  chr6  NT_167244.1  2007813-2166267    0.79 % in   5 repeats    0.00 % in 0 genes
12   157850  chr9  NT_008470.19  21686935-21844785    3.23 % in   15 repeats    0.00 % in 0 genes
13   154220  chr7  NT_023603.5  40294-194514    100.00 % in   2 repeats    0.00 % in 0 genes
14   125568  chr6  NT_167245.1  128521-254089    7.74 % in   30 repeats    0.00 % in 0 genes
15   120393  chr6  NT_167245.1  2604379-2724772    2.02 % in   7 repeats    0.00 % in 0 genes
16   117269  chr7  NT_007933.15  68181647-68298916    10.73 % in   19 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
499743  chr15  NT_037852.6  1396934-1896677    22  17       L2a (3)  MER44C (2)  L1M5 (2) 
404486  chr6  NT_167244.1  2357068-2761554    7       L4 (2)  AluJb (2)  MER8 (1) 
211362  chr6  NT_167244.1  4387845-4599207    11  9       MER57-int (2)  AluSx (2)  (TTCC)n (1) 
198598  chr6  NT_167244.1  3782035-3980633    38  25       L2a (9)  MLT1H-int (2)  L1M5 (2) 
181164  chr6  NT_167249.1  2135866-2317030    49  28       Charlie2b (6)  AluSx (6)  L1MB8 (3) 
176767  chr6  NT_167244.1  3179311-3356078    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
174339  chr6  NT_167247.1  4421068-4595407    4       MIR (1)  MER11A (1)  L2b (1) 
168183  chr6  NT_167247.1  1561535-1729718    7       MIR (2)  L1MEe (2)  L1MC3 (1) 
164879  chr6  NT_167248.1  521866-686745    3       L1PREC2 (1)  HERVH-int (1)  AT_rich (1) 
10  158736  chr6  NT_167244.1  2882588-3041324    59  25       AluY (7)  L1MC5 (6)  AluSx (5) 
11  158454  chr6  NT_167244.1  2007813-2166267    4       AluSx (2)  MIRb (1)  MIR (1) 
12  157850  chr9  NT_008470.19  21686935-21844785    15  10       MER5B (2)  LTR67B (2)  L2 (2) 
13  154220  chr7  NT_023603.5  40294-194514    2       L1PA2 (1)  ALR/Alpha (1) 
14  125568  chr6  NT_167245.1  128521-254089    30  26       MER57A1 (2)  L2c (2)  AT_rich (2) 
15  120393  chr6  NT_167245.1  2604379-2724772    6       L2 (2)  MLT1N2 (1)  MLT1E2 (1) 
16  117269  chr7  NT_007933.15  68181647-68298916    19  13       L1PB1 (4)  L1PA2 (2)  L1MB7 (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   499743       chr15  NT_037852.6  1396934-1896677    LOC100418897 
4   198598       chr6  NT_167244.1  3782035-3980633    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
6   176767       chr6  NT_167244.1  3179311-3356078    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   174339       chr6  NT_167247.1  4421068-4595407    LOC100507722  hypothetical_protein_LOC100507722
8   168183       chr6  NT_167247.1  1561535-1729718    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011