Distribution of restriction sites in the human genome

Enzyme:  HgiCI               Longest uncut segments
Specificity:  GGYRCC               Repeats in uncut segments
Number of sites:  1542683               Genes in uncut segments
Mean distance between sites:  1854 base pairs
Standard deviation:  2280 base pairs
Site density 539.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   490129  chr15  NT_037852.6  1397157-1887286    0.20 % in   7 repeats    0.00 % in 0 genes
2   402911  chr6  NT_167244.1  2359609-2762520    0.08 % in   1 repeats    0.00 % in 0 genes
3   213749  chr6  NT_167244.1  4387334-4601083    2.24 % in   14 repeats    0.00 % in 0 genes
4   189460  chrY  NT_011875.12  8433387-8622847    73.54 % in   10 repeats    0.00 % in 0 genes
5   182866  chr6  NT_167244.1  3788315-3971181    0.76 % in   8 repeats    0.00 % in 0 genes
6   176158  chr6  NT_167244.1  3179938-3356096    0.24 % in   5 repeats    0.16 % in 1 genes
7   173911  chr6  NT_167247.1  4421517-4595428    0.68 % in   3 repeats    100.00 % in 1 genes
8   168435  chr6  NT_167248.1  521445-689880    3.08 % in   6 repeats    0.67 % in 1 genes
9   167951  chr6  NT_167247.1  1559547-1727498    1.27 % in   9 repeats    0.00 % in 0 genes
10   167677  chr6  NT_167249.1  2137165-2304842    1.20 % in   10 repeats    0.00 % in 0 genes
11   161216  chr7  NT_023603.5  32972-194188    100.00 % in   4 repeats    0.00 % in 0 genes
12   152390  chr9  NT_008470.19  21692391-21844781    0.67 % in   5 repeats    0.00 % in 0 genes
13   146707  chr6  NT_167244.1  2893107-3039814    1.93 % in   17 repeats    0.00 % in 0 genes
14   122594  chr10  NT_008705.16  38712206-38834800    26.87 % in   218 repeats    0.00 % in 0 genes
15   120678  chr6  NT_167245.1  2603696-2724374    2.26 % in   7 repeats    0.00 % in 0 genes
16   118361  chr6  NT_167244.1  1451334-1569695    10.42 % in   23 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
490129  chr15  NT_037852.6  1397157-1887286    7       MLT1L (1)  MIRc (1)  MIRb (1) 
402911  chr6  NT_167244.1  2359609-2762520    1       AluSp (1) 
213749  chr6  NT_167244.1  4387334-4601083    14  11       MER57-int (2)  AluSx (2)  AluSg/x (2) 
189460  chrY  NT_011875.12  8433387-8622847    10  2       LTR12B (9)  LTR12D (1) 
182866  chr6  NT_167244.1  3788315-3971181    7       AT_rich (2)  MLT1H-int (1)  MIR (1) 
176158  chr6  NT_167244.1  3179938-3356096    4       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
173911  chr6  NT_167247.1  4421517-4595428    3       MER11A (1)  AluSg/x (1)  AluSc (1) 
168435  chr6  NT_167248.1  521445-689880    4       AT_rich (3)  L1PREC2 (1)  HERVH-int (1) 
167951  chr6  NT_167247.1  1559547-1727498    8       Tigger7 (2)  MIRc (1)  MIR (1) 
10  167677  chr6  NT_167249.1  2137165-2304842    10  6       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
11  161216  chr7  NT_023603.5  32972-194188    2       L1PA2 (3)  ALR/Alpha (1) 
12  152390  chr9  NT_008470.19  21692391-21844781    4       L2 (2)  MIR3 (1)  LTR67B (1) 
13  146707  chr6  NT_167244.1  2893107-3039814    17  8       L1MC5 (5)  AluY (3)  AluSc (3) 
14  122594  chr10  NT_008705.16  38712206-38834800    218  32       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 
15  120678  chr6  NT_167245.1  2603696-2724374    7       MLT1N2 (1)  MLT1E2 (1)  MER5B (1) 
16  118361  chr6  NT_167244.1  1451334-1569695    23  14       L1MA1 (7)  MSTA (2)  AluSx (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   176158       chr6  NT_167244.1  3179938-3356096    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   173911       chr6  NT_167247.1  4421517-4595428    LOC100507722  hypothetical_protein_LOC100507722
8   168435       chr6  NT_167248.1  521445-689880    OR12D1P 



Posfai@neb.com
May 11, 2011