Distribution of restriction sites in the human genome

Enzyme:  BsrGI               Longest uncut segments
Specificity:  TGTACA               Repeats in uncut segments
Number of sites:  824649               Genes in uncut segments
Mean distance between sites:  3469 base pairs
Standard deviation:  3899 base pairs
Site density 288.2 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   501728  chr15  NT_037852.6  1395093-1896821    1.07 % in   24 repeats    0.75 % in 1 genes
2   410293  chr6  NT_167244.1  2350950-2761243    1.44 % in   28 repeats    0.00 % in 0 genes
3   212116  chr6  NT_167244.1  4387060-4599176    1.94 % in   14 repeats    0.00 % in 0 genes
4   184681  chr6  NT_167244.1  3788323-3973004    1.49 % in   16 repeats    0.00 % in 0 genes
5   184541  chr6  NT_167244.1  3174056-3358597    2.76 % in   32 repeats    4.65 % in 2 genes
6   180785  chr6  NT_167247.1  4413736-4594521    1.55 % in   11 repeats    98.13 % in 1 genes
7   173325  chr6  NT_167249.1  2132119-2305444    3.54 % in   26 repeats    0.00 % in 0 genes
8   166607  chr6  NT_167247.1  1561640-1728247    0.74 % in   6 repeats    0.79 % in 1 genes
9   165836  chr6  NT_167244.1  1999423-2165259    2.10 % in   18 repeats    0.00 % in 0 genes
10   164134  chr6  NT_167248.1  520944-685078    2.94 % in   2 repeats    0.00 % in 0 genes
11   161438  chr4  NT_006316.16  395937-557375    5.37 % in   57 repeats    0.00 % in 0 genes
12   155137  chr9  NT_008470.19  21692937-21848074    1.19 % in   9 repeats    0.00 % in 0 genes
13   149597  chr6  NT_167244.1  2890466-3040063    3.66 % in   27 repeats    0.00 % in 0 genes
14   130343  chr6  NT_167245.1  116948-247291    13.21 % in   36 repeats    0.00 % in 0 genes
15   125364  chr6  NT_167249.1  4716764-4842128    10.06 % in   61 repeats    0.00 % in 0 genes
16   123640  chr6  NT_167247.1  1177214-1300854    3.60 % in   13 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
501728  chr15  NT_037852.6  1395093-1896821    24  19       L2a (3)  MER44C (2)  L1M5 (2) 
410293  chr6  NT_167244.1  2350950-2761243    28  19       AluJb (4)  L1ME4a (3)  MLT2D (2) 
212116  chr6  NT_167244.1  4387060-4599176    14  11       MER57-int (3)  AluSx (2)  (TTTTA)n (1) 
184681  chr6  NT_167244.1  3788323-3973004    16  13       MLT1H-int (2)  L2a (2)  AT_rich (2) 
184541  chr6  NT_167244.1  3174056-3358597    32  18       AluSx (6)  L1MB3 (4)  GC_rich (3) 
180785  chr6  NT_167247.1  4413736-4594521    11  10       L2b (2)  MIRc (1)  MIRb (1) 
173325  chr6  NT_167249.1  2132119-2305444    26  14       AluSx (5)  L1MB8 (3)  AluJo (3) 
166607  chr6  NT_167247.1  1561640-1728247    5       MIR (2)  L1MC3 (1)  (GGAA)n (1) 
165836  chr6  NT_167244.1  1999423-2165259    18  13       AluSx (4)  FRAM (2)  AluJb (2) 
10  164134  chr6  NT_167248.1  520944-685078    2       L1PREC2 (1)  HERVH-int (1) 
11  161438  chr4  NT_006316.16  395937-557375    57  7       (CA)n (44)  L1M4 (7)  L1PA10 (2) 
12  155137  chr9  NT_008470.19  21692937-21848074    7       MIRb (2)  L2 (2)  MLT1A (1) 
13  149597  chr6  NT_167244.1  2890466-3040063    27  13       L1MC5 (6)  AluY (5)  AluSc (3) 
14  130343  chr6  NT_167245.1  116948-247291    36  25       AluSx (4)  L1MEg (3)  MER57A1 (2) 
15  125364  chr6  NT_167249.1  4716764-4842128    61  29       AluSx (10)  AluY (8)  MLT1C (4) 
16  123640  chr6  NT_167247.1  1177214-1300854    13  10       ERV3-16A3_I-int (4)  (TATG)n (1)  (TAAA)n (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   501728       chr15  NT_037852.6  1395093-1896821    LOC100418897 
5   184541       chr6  NT_167244.1  3174056-3358597    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   180785       chr6  NT_167247.1  4413736-4594521    LOC100507722  hypothetical_protein_LOC100507722
8   166607       chr6  NT_167247.1  1561640-1728247    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011