Distribution of restriction sites in the human genome

Enzyme:  Hpy99III               Longest uncut segments
Specificity:  GCGC               Repeats in uncut segments
Number of sites:  1655611               Genes in uncut segments
Mean distance between sites:  1728 base pairs
Standard deviation:  3147 base pairs
Site density 578.6 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494438  chr15  NT_037852.6  1397158-1891596    0.82 % in   18 repeats    0.00 % in 0 genes
2   403668  chr6  NT_167244.1  2359603-2763271    0.13 % in   2 repeats    0.00 % in 0 genes
3   210716  chr6  NT_167244.1  4387608-4598324    1.33 % in   7 repeats    0.00 % in 0 genes
4   186146  chr6  NT_167244.1  3785036-3971182    1.27 % in   12 repeats    1.32 % in 1 genes
5   176686  chr6  NT_167247.1  4421806-4598492    1.74 % in   12 repeats    100.00 % in 1 genes
6   175199  chr6  NT_167244.1  3180243-3355442    0.09 % in   2 repeats    0.00 % in 0 genes
7   170250  chr6  NT_167247.1  1560013-1730263    1.88 % in   14 repeats    1.73 % in 1 genes
8   166739  chr6  NT_167249.1  2136319-2303058    0.78 % in   6 repeats    0.00 % in 0 genes
9   163659  chr6  NT_167248.1  517692-681351    2.66 % in   2 repeats    0.00 % in 0 genes
10   155593  chr6  NT_167244.1  2009061-2164654    0.07 % in   1 repeats    0.00 % in 0 genes
11   152024  chr9  NT_008470.19  21692758-21844782    0.57 % in   5 repeats    0.00 % in 0 genes
12   144648  chr6  NT_167244.1  2894194-3038842    0.99 % in   9 repeats    0.00 % in 0 genes
13   133820  chr6  NT_167245.1  2601116-2734936    6.20 % in   27 repeats    0.00 % in 0 genes
14   115265  chr6  NT_167247.1  1176965-1292230    0.61 % in   1 repeats    0.00 % in 0 genes
15   114566  chr6  NT_167246.1  3260883-3375449    0.41 % in   3 repeats    0.00 % in 0 genes
16   111463  chr6  NT_167244.1  588423-699886    3.69 % in   17 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494438  chr15  NT_037852.6  1397158-1891596    18  15       L2a (3)  L1M5 (2)  U2 (1) 
403668  chr6  NT_167244.1  2359603-2763271    2       L1MEg (1)  AluSp (1) 
210716  chr6  NT_167244.1  4387608-4598324    6       MER57-int (2)  (TTCC)n (1)  AluY (1) 
186146  chr6  NT_167244.1  3785036-3971182    12  10       AT_rich (2)  AluJb (2)  MLT1H-int (1) 
176686  chr6  NT_167247.1  4421806-4598492    12  9       AluSx (3)  MLT1J (2)  (TTAAA)n (1) 
175199  chr6  NT_167244.1  3180243-3355442    2       GC_rich (1)  AluSp (1) 
170250  chr6  NT_167247.1  1560013-1730263    14  11       Tigger7 (2)  MIR (2)  L1MEe (2) 
166739  chr6  NT_167249.1  2136319-2303058    6       MLT1A (1)  MamGypLTR1b (1)  L1MC4a (1) 
163659  chr6  NT_167248.1  517692-681351    2       L1PREC2 (1)  HERVH-int (1) 
10  155593  chr6  NT_167244.1  2009061-2164654    1       MIRb (1) 
11  152024  chr9  NT_008470.19  21692758-21844782    4       L2 (2)  MIR3 (1)  LTR67B (1) 
12  144648  chr6  NT_167244.1  2894194-3038842    6       L1MC5 (2)  AluSc (2)  AluJo (2) 
13  133820  chr6  NT_167245.1  2601116-2734936    27  24       Tigger1 (2)  MLT1N2 (2)  L2 (2) 
14  115265  chr6  NT_167247.1  1176965-1292230    1       ERV3-16A3_I-int (1) 
15  114566  chr6  NT_167246.1  3260883-3375449    2       MIRb (2)  AluSx (1) 
16  111463  chr6  NT_167244.1  588423-699886    17  14       L1MA9 (3)  L1MC5 (2)  THE1D (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   186146       chr6  NT_167244.1  3785036-3971182    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
5   176686       chr6  NT_167247.1  4421806-4598492    LOC100507722  hypothetical_protein_LOC100507722
7   170250       chr6  NT_167247.1  1560013-1730263    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011