Distribution of restriction sites in the human genome

Enzyme:  TaqII               Longest uncut segments
Specificity:  GACCGA               Repeats in uncut segments
Number of sites:  128582               Genes in uncut segments
Mean distance between sites:  22253 base pairs
Standard deviation:  26740 base pairs
Site density 44.9 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   520234  chr15  NT_037852.6  1385264-1905498    3.28 % in   59 repeats    1.92 % in 1 genes
2   421597  chr6  NT_167244.1  2345308-2766905    2.85 % in   52 repeats    0.00 % in 0 genes
3   392101  chr1  NT_032977.9  19900986-20293087    73.20 % in   692 repeats    100.00 % in 1 genes
4   356560  chr4  NT_006316.16  3393818-3750378    57.56 % in   577 repeats    0.00 % in 0 genes
5   351316  chr4  NT_016354.19  85523398-85874714    57.79 % in   491 repeats    0.00 % in 0 genes
6   326421  chr5  NT_006576.16  25409137-25735558    55.34 % in   528 repeats    0.00 % in 0 genes
7   326325  chr4  NT_016354.19  61060093-61386418    53.00 % in   494 repeats    14.31 % in 1 genes
8   324324  chr7  NT_007933.15  61840597-62164921    49.78 % in   495 repeats    0.47 % in 2 genes
9   318638  chr14  NT_026437.12  32506750-32825388    52.17 % in   585 repeats    0.00 % in 0 genes
10   310256  chr6  NT_025741.15  45251326-45561582    54.65 % in   482 repeats    0.00 % in 0 genes
11   302066  chr14  NT_026437.12  24640204-24942270    62.45 % in   451 repeats    0.00 % in 0 genes
12   301155  chr18  NT_010966.14  21025257-21326412    46.49 % in   506 repeats    0.00 % in 0 genes
13   301121  chr10  NT_008705.16  8838758-9139879    38.91 % in   500 repeats    0.00 % in 0 genes
14   300621  chr13  NT_024524.14  54620133-54920754    48.12 % in   643 repeats    0.00 % in 0 genes
15   287266  chr6  NT_007592.15  57803423-58090689    55.11 % in   278 repeats    0.00 % in 0 genes
16   285916  chr3  NT_005612.16  8947811-9233727    53.23 % in   454 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
520234  chr15  NT_037852.6  1385264-1905498    59  36       L1MDa (6)  AT_rich (5)  Tigger2 (3) 
421597  chr6  NT_167244.1  2345308-2766905    52  31       AluJb (5)  AluSx (4)  L1ME4a (3) 
392101  chr1  NT_032977.9  19900986-20293087    692  189       MIRb (59)  L2c (36)  MIR (32) 
356560  chr4  NT_006316.16  3393818-3750378    577  172       AT_rich (39)  MIRb (35)  MIR (24) 
351316  chr4  NT_016354.19  85523398-85874714    491  171       AT_rich (52)  L2a (20)  (TA)n (17) 
326421  chr5  NT_006576.16  25409137-25735558    528  183       AT_rich (71)  AluSx (15)  (TA)n (14) 
326325  chr4  NT_016354.19  61060093-61386418    494  183       AT_rich (72)  L2a (22)  MIR (14) 
324324  chr7  NT_007933.15  61840597-62164921    495  159       AT_rich (43)  AluSx (22)  L2 (19) 
318638  chr14  NT_026437.12  32506750-32825388    585  181       AluSx (31)  AT_rich (28)  MIRb (27) 
10  310256  chr6  NT_025741.15  45251326-45561582    482  167       AT_rich (43)  L1ME1 (16)  L1MEe (13) 
11  302066  chr14  NT_026437.12  24640204-24942270    451  157       AT_rich (65)  (TA)n (11)  L1M5 (11) 
12  301155  chr18  NT_010966.14  21025257-21326412    506  167       AT_rich (43)  AluSx (25)  MIRb (24) 
13  301121  chr10  NT_008705.16  8838758-9139879    500  143       AT_rich (56)  MIRb (27)  L2a (24) 
14  300621  chr13  NT_024524.14  54620133-54920754    643  154       AluSx (74)  AluJo (31)  AT_rich (29) 
15  287266  chr6  NT_007592.15  57803423-58090689    278  114       AT_rich (30)  SATR1 (14)  MIR (14) 
16  285916  chr3  NT_005612.16  8947811-9233727    454  171       AT_rich (48)  MIR (17)  L2a (16) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   520234       chr15  NT_037852.6  1385264-1905498    LOC100418897 
3   392101       chr1  NT_032977.9  19900986-20293087    LOC100507490  BEN_domain-containing_protein_5
7   326325       chr4  NT_016354.19  61060093-61386418    LOC100507528  hypothetical_LOC100507528
8   324324       chr7  NT_007933.15  61840597-62164921    LOC136157 
RPS2P31 



Posfai@neb.com
May 11, 2011