Distribution of restriction sites in the human genome

Enzyme:  HauI               Longest uncut segments
Specificity:  GGCCAAG               Repeats in uncut segments
Number of sites:  597582               Genes in uncut segments
Mean distance between sites:  4788 base pairs
Standard deviation:  6098 base pairs
Site density 208.8 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   500899  chr15  NT_037852.6  1388998-1889897    1.90 % in   25 repeats    0.00 % in 0 genes
2   401791  chr6  NT_167244.1  2359923-2761714    0.01 % in   1 repeats    0.00 % in 0 genes
3   304364  chrY  NT_011875.12  8417608-8721972    83.06 % in   39 repeats    0.26 % in 1 genes
4   294541  chr7  NT_077528.2  2718-297259    82.86 % in   56 repeats    0.00 % in 0 genes
5   246857  chr6  NT_167244.1  2009915-2256772    1.41 % in   14 repeats    1.56 % in 2 genes
6   233979  chr19  NT_011109.16  15423-249402    99.80 % in   57 repeats    0.00 % in 0 genes
7   224454  chr12  NT_029419.12  128208-352662    98.83 % in   50 repeats    0.00 % in 0 genes
8   213294  chr6  NT_167244.1  4384629-4597923    1.77 % in   11 repeats    0.00 % in 0 genes
9   192036  chr11  NT_167190.1  145742-337778    98.36 % in   58 repeats    0.00 % in 0 genes
10   186593  chr4  NT_006316.16  366819-553412    8.77 % in   91 repeats    0.00 % in 0 genes
11   185761  chr6  NT_167244.1  3784841-3970602    1.10 % in   10 repeats    0.00 % in 0 genes
12   180291  chr6  NT_167244.1  3178989-3359280    1.23 % in   13 repeats    0.00 % in 0 genes
13   175320  chr6  NT_167247.1  4420547-4595867    1.07 % in   8 repeats    0.00 % in 0 genes
14   169856  chr6  NT_167247.1  1560870-1730726    1.61 % in   11 repeats    0.00 % in 0 genes
15   168568  chr6  NT_167249.1  2137265-2305833    1.72 % in   12 repeats    0.00 % in 0 genes
16   166565  chr5  NT_006713.15  1-166566    97.69 % in   55 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
500899  chr15  NT_037852.6  1388998-1889897    25  18       L1MDa (6)  L2a (3)  U2 (1) 
401791  chr6  NT_167244.1  2359923-2761714    1       AluSp (1) 
304364  chrY  NT_011875.12  8417608-8721972    39  15       LTR12B (17)  L1PA16 (6)  LTR12D (2) 
294541  chr7  NT_077528.2  2718-297259    56  7       ALR/Alpha (32)  L1PA2 (6)  L1PA4 (5) 
246857  chr6  NT_167244.1  2009915-2256772    14  14       MIRb (1)  MIR (1)  MER5A1 (1) 
233979  chr19  NT_011109.16  15423-249402    57  11       ALR/Alpha (32)  L1PA3 (13)  L1PA4 (3) 
224454  chr12  NT_029419.12  128208-352662    50  20       ALR/Alpha (19)  L1PA3 (8)  AluY (3) 
213294  chr6  NT_167244.1  4384629-4597923    11  8       MER57-int (3)  AluY (2)  (TTTTA)n (1) 
192036  chr11  NT_167190.1  145742-337778    58  16       ALR/Alpha (31)  L1PA4 (4)  L1PA3 (3) 
10  186593  chr4  NT_006316.16  366819-553412    91  32       (CA)n (48)  L1M4 (7)  AT_rich (4) 
11  185761  chr6  NT_167244.1  3784841-3970602    10  8       AT_rich (2)  AluJb (2)  MIR (1) 
12  180291  chr6  NT_167244.1  3178989-3359280    13  8       GC_rich (3)  L2c (2)  AluSx (2) 
13  175320  chr6  NT_167247.1  4420547-4595867    8       (TTAAA)n (1)  MIR (1)  MER11A (1) 
14  169856  chr6  NT_167247.1  1560870-1730726    11  9       MIR (2)  L1MEe (2)  MIRc (1) 
15  168568  chr6  NT_167249.1  2137265-2305833    12  7       L1MB8 (3)  AluSx (3)  Charlie2b (2) 
16  166565  chr5  NT_006713.15  1-166566    55  22       ALR/Alpha (14)  L1PA3 (9)  L1MCb (7) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   304364       chrY  NT_011875.12  8417608-8721972    ZNF884P 
5   246857       chr6  NT_167244.1  2009915-2256772    FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c



Posfai@neb.com
May 11, 2011