Distribution of restriction sites in the human genome

Enzyme:  TmaI               Longest uncut segments
Specificity:  CGCG               Repeats in uncut segments
Number of sites:  725442               Genes in uncut segments
Mean distance between sites:  3944 base pairs
Standard deviation:  8713 base pairs
Site density 253.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494791  chr15  NT_037852.6  1396892-1891683    0.86 % in   19 repeats    0.00 % in 0 genes
2   413882  chr6  NT_167244.1  2350573-2764455    1.60 % in   32 repeats    0.00 % in 0 genes
3   246991  chr6  NT_167244.1  2008485-2255476    1.20 % in   15 repeats    2.14 % in 2 genes
4   236371  chr7  NT_077528.2  27004-263375    78.65 % in   44 repeats    0.00 % in 0 genes
5   221843  chr5  NT_006576.16  45932273-46154116    94.58 % in   82 repeats    0.00 % in 0 genes
6   213919  chr6  NT_167244.1  4386353-4600272    2.33 % in   17 repeats    0.00 % in 0 genes
7   212109  chr6  NT_167244.1  3780100-3992209    7.59 % in   58 repeats    3.48 % in 1 genes
8   207592  chr12  NT_029419.12  52620748-52828340    52.96 % in   358 repeats    2.19 % in 1 genes
9   205843  chr10  NT_030059.13  42974797-43180640    66.41 % in   313 repeats    0.00 % in 0 genes
10   205172  chr12  NT_029419.12  23502058-23707230    64.77 % in   320 repeats    0.00 % in 0 genes
11   202333  chr6  NT_007299.13  228031-430364    57.09 % in   154 repeats    0.00 % in 0 genes
12   196620  chr6  NT_167248.1  503156-699776    13.83 % in   42 repeats    0.00 % in 0 genes
13   192017  chr7  NT_007933.15  60815574-61007591    48.57 % in   312 repeats    0.00 % in 0 genes
14   182371  chr12  NT_009714.17  26601895-26784266    63.36 % in   266 repeats    0.00 % in 0 genes
15   181308  chr4  NT_016354.19  60223849-60405157    51.23 % in   228 repeats    0.00 % in 0 genes
16   180195  chr6  NT_167247.1  4421603-4601798    2.32 % in   21 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494791  chr15  NT_037852.6  1396892-1891683    19  16       L2a (3)  L1M5 (2)  U2 (1) 
413882  chr6  NT_167244.1  2350573-2764455    32  23       AluJb (4)  L1ME4a (3)  MLT2D (2) 
246991  chr6  NT_167244.1  2008485-2255476    15  13       MIRb (2)  MIR (2)  MER5A1 (1) 
236371  chr7  NT_077528.2  27004-263375    44  6       ALR/Alpha (28)  L1PA4 (5)  L1P1 (4) 
221843  chr5  NT_006576.16  45932273-46154116    82  31       ALR/Alpha (28)  AT_rich (8)  L1PA4 (5) 
213919  chr6  NT_167244.1  4386353-4600272    17  12       MER57-int (3)  AluSx (3)  AluY (2) 
212109  chr6  NT_167244.1  3780100-3992209    58  40       L2a (9)  L1P3 (3)  AT_rich (3) 
207592  chr12  NT_029419.12  52620748-52828340    358  142       AT_rich (24)  L2a (15)  MIR (14) 
205843  chr10  NT_030059.13  42974797-43180640    313  119       AT_rich (18)  MIR (15)  L2c (14) 
10  205172  chr12  NT_029419.12  23502058-23707230    320  135       AT_rich (30)  (TA)n (12)  L2a (9) 
11  202333  chr6  NT_007299.13  228031-430364    154  82       ALR/Alpha (16)  LTR49-int (12)  AT_rich (7) 
12  196620  chr6  NT_167248.1  503156-699776    42  32       AT_rich (5)  L1MA9 (3)  MER4D (2) 
13  192017  chr7  NT_007933.15  60815574-61007591    312  120       AT_rich (23)  MIRb (19)  L2a (16) 
14  182371  chr12  NT_009714.17  26601895-26784266    266  122       AT_rich (20)  L1MA9 (15)  THE1B (8) 
15  181308  chr4  NT_016354.19  60223849-60405157    228  99       AT_rich (39)  L2a (10)  (TA)n (8) 
16  180195  chr6  NT_167247.1  4421603-4601798    21  16       AluSx (3)  MLT1J (2)  L1MC5 (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   246991       chr6  NT_167244.1  2008485-2255476    FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
7   212109       chr6  NT_167244.1  3780100-3992209    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
8   207592       chr12  NT_029419.12  52620748-52828340    LOC100507594  hypothetical_LOC100507594



Posfai@neb.com
May 11, 2011