Distribution of restriction sites in the human genome

Enzyme:  SmlI               Longest uncut segments
Specificity:  CTYRAG               Repeats in uncut segments
Number of sites:  2701116               Genes in uncut segments
Mean distance between sites:  1059 base pairs
Standard deviation:  1112 base pairs
Site density 944.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488951  chr15  NT_037852.6  1397203-1886154    0.14 % in   5 repeats    0.00 % in 0 genes
2   403563  chr6  NT_167244.1  2359198-2762761    0.17 % in   3 repeats    0.00 % in 0 genes
3   208032  chr6  NT_167244.1  4389921-4597953    0.08 % in   2 repeats    0.00 % in 0 genes
4   185630  chr6  NT_167244.1  3788055-3973685    1.77 % in   18 repeats    0.00 % in 0 genes
5   181164  chr6  NT_167244.1  3179180-3360344    1.45 % in   15 repeats    2.87 % in 2 genes
6   174884  chr6  NT_167247.1  4421002-4595886    0.88 % in   7 repeats    100.00 % in 1 genes
7   167014  chr6  NT_167249.1  2137112-2304126    1.00 % in   9 repeats    0.00 % in 0 genes
8   165722  chr6  NT_167247.1  1561536-1727258    0.43 % in   3 repeats    0.85 % in 1 genes
9   162492  chr6  NT_167248.1  519493-681985    1.96 % in   2 repeats    0.00 % in 0 genes
10   156457  chr6  NT_167244.1  2008865-2165322    0.18 % in   2 repeats    0.00 % in 0 genes
11   152788  chr9  NT_008470.19  21690884-21843672    1.06 % in   7 repeats    0.00 % in 0 genes
12   145666  chr6  NT_167244.1  2892056-3037722    1.26 % in   10 repeats    0.00 % in 0 genes
13   119161  chr6  NT_167245.1  2605818-2724979    1.36 % in   4 repeats    0.00 % in 0 genes
14   116135  chr6  NT_167247.1  1177593-1293728    0.06 % in   1 repeats    0.00 % in 0 genes
15   113706  chr6  NT_167246.1  3261336-3375042    0.28 % in   2 repeats    0.00 % in 0 genes
16   109364  chr6  NT_167245.1  137504-246868    1.30 % in   4 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488951  chr15  NT_037852.6  1397203-1886154    5       MIRc (1)  MIRb (1)  L1M3 (1) 
403563  chr6  NT_167244.1  2359198-2762761    3       L4 (1)  L1MEg (1)  AluSp (1) 
208032  chr6  NT_167244.1  4389921-4597953    2       AluSg/x (1)  AluJo (1) 
185630  chr6  NT_167244.1  3788055-3973685    18  15       MLT1H-int (2)  L2a (2)  AT_rich (2) 
181164  chr6  NT_167244.1  3179180-3360344    15  8       GC_rich (3)  AluSx (3)  MIRb (2) 
174884  chr6  NT_167247.1  4421002-4595886    7       (TTAAA)n (1)  MIR (1)  MER11A (1) 
167014  chr6  NT_167249.1  2137112-2304126    5       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
165722  chr6  NT_167247.1  1561536-1727258    3       MIR (1)  L1MC3 (1)  A-rich (1) 
162492  chr6  NT_167248.1  519493-681985    2       L1PREC2 (1)  HERVH-int (1) 
10  156457  chr6  NT_167244.1  2008865-2165322    2       MIRb (1)  MIR (1) 
11  152788  chr9  NT_008470.19  21690884-21843672    6       LTR67B (2)  MSTA (1)  MIR3 (1) 
12  145666  chr6  NT_167244.1  2892056-3037722    10  9       AluY (2)  (TG)n (1)  (TCC)n (1) 
13  119161  chr6  NT_167245.1  2605818-2724979    3       L2 (2)  MLT1E2 (1)  L2a (1) 
14  116135  chr6  NT_167247.1  1177593-1293728    1       ERV3-16A3_I-int (1) 
15  113706  chr6  NT_167246.1  3261336-3375042    2       MIRb (1)  AluSx (1) 
16  109364  chr6  NT_167245.1  137504-246868    4       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   181164       chr6  NT_167244.1  3179180-3360344    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   174884       chr6  NT_167247.1  4421002-4595886    LOC100507722  hypothetical_protein_LOC100507722
8   165722       chr6  NT_167247.1  1561536-1727258    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011