Distribution of restriction sites in the human genome

Enzyme:  AccI               Longest uncut segments
Specificity:  GTMKAC               Repeats in uncut segments
Number of sites:  1076648               Genes in uncut segments
Mean distance between sites:  2657 base pairs
Standard deviation:  2820 base pairs
Site density 376.3 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488368  chr15  NT_037852.6  1397253-1885621    0.13 % in   5 repeats    0.00 % in 0 genes
2   408531  chr6  NT_167244.1  2357950-2766481    0.87 % in   14 repeats    0.00 % in 0 genes
3   246045  chr6  NT_167244.1  2009166-2255211    0.88 % in   11 repeats    1.87 % in 2 genes
4   209860  chr6  NT_167244.1  4388426-4598286    0.92 % in   7 repeats    0.00 % in 0 genes
5   181153  chr6  NT_167244.1  3789514-3970667    0.18 % in   3 repeats    0.00 % in 0 genes
6   176547  chr6  NT_167244.1  3179727-3356274    0.26 % in   6 repeats    0.33 % in 2 genes
7   176146  chr6  NT_167247.1  4421558-4597704    1.35 % in   9 repeats    100.00 % in 1 genes
8   171011  chr6  NT_167249.1  2135079-2306090    2.65 % in   19 repeats    0.00 % in 0 genes
9   165572  chr6  NT_167247.1  1562164-1727736    0.34 % in   6 repeats    0.00 % in 0 genes
10   164661  chr6  NT_167248.1  517561-682222    3.25 % in   2 repeats    0.00 % in 0 genes
11   158997  chr6  NT_167244.1  2884289-3043286    6.76 % in   56 repeats    0.00 % in 0 genes
12   155346  chr9  NT_008470.19  21692385-21847731    1.40 % in   10 repeats    0.00 % in 0 genes
13   133267  chr6  NT_167245.1  2605363-2738630    5.74 % in   27 repeats    0.00 % in 0 genes
14   132798  chr6  NT_167246.1  3251553-3384351    4.35 % in   30 repeats    0.00 % in 0 genes
15   123513  chr6  NT_167247.1  1176539-1300052    3.90 % in   10 repeats    0.00 % in 0 genes
16   120195  chrX  NT_011786.16  4269298-4389493    9.37 % in   63 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488368  chr15  NT_037852.6  1397253-1885621    5       MIRc (1)  MIRb (1)  L1M3 (1) 
408531  chr6  NT_167244.1  2357950-2766481    14  10       LTR84b (2)  L4 (2)  AluY (2) 
246045  chr6  NT_167244.1  2009166-2255211    11  10       MIRb (2)  MIR (1)  MER5A1 (1) 
209860  chr6  NT_167244.1  4388426-4598286    6       MER57-int (2)  (TTCC)n (1)  AluY (1) 
181153  chr6  NT_167244.1  3789514-3970667    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
176547  chr6  NT_167244.1  3179727-3356274    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
176146  chr6  NT_167247.1  4421558-4597704    7       MLT1J (2)  AluSx (2)  (TTAAA)n (1) 
171011  chr6  NT_167249.1  2135079-2306090    19  10       AluSx (5)  L1MB8 (3)  MLT1A (2) 
165572  chr6  NT_167247.1  1562164-1727736    5       MIR (2)  L1MC3 (1)  (GGAA)n (1) 
10  164661  chr6  NT_167248.1  517561-682222    2       L1PREC2 (1)  HERVH-int (1) 
11  158997  chr6  NT_167244.1  2884289-3043286    56  25       L1MC5 (6)  AluY (6)  AluJo (5) 
12  155346  chr9  NT_008470.19  21692385-21847731    10  8       MIRb (2)  L2 (2)  MLT1A (1) 
13  133267  chr6  NT_167245.1  2605363-2738630    27  22       AluY (3)  Tigger1 (2)  LTR84b (2) 
14  132798  chr6  NT_167246.1  3251553-3384351    30  18       AluSx (5)  L1MC5 (3)  MLT1C (2) 
15  123513  chr6  NT_167247.1  1176539-1300052    10  7       ERV3-16A3_I-int (4)  (TATG)n (1)  (TAAA)n (1) 
16  120195  chrX  NT_011786.16  4269298-4389493    63  12       AluSx (15)  MER33 (14)  AluSc (13) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   246045       chr6  NT_167244.1  2009166-2255211    FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
6   176547       chr6  NT_167244.1  3179727-3356274    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
7   176146       chr6  NT_167247.1  4421558-4597704    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011