Distribution of restriction sites in the human genome

Enzyme:  SdeOSI               Longest uncut segments
Specificity:  GACNNNNRTGA               Repeats in uncut segments
Number of sites:  563799               Genes in uncut segments
Mean distance between sites:  5075 base pairs
Standard deviation:  5131 base pairs
Site density 197.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   499853  chr15  NT_037852.6  1393849-1893702    1.29 % in   27 repeats    0.12 % in 1 genes
2   413758  chr6  NT_167244.1  2359441-2773199    1.20 % in   22 repeats    0.00 % in 0 genes
3   214600  chr6  NT_167244.1  4387503-4602103    2.63 % in   15 repeats    0.00 % in 0 genes
4   191838  chr6  NT_167244.1  3164570-3356408    3.92 % in   50 repeats    8.28 % in 2 genes
5   187834  chr6  NT_167246.1  3050900-3238734    14.82 % in   116 repeats    6.12 % in 3 genes
6   183579  chr6  NT_167244.1  3789845-3973424    1.36 % in   13 repeats    0.00 % in 0 genes
7   180030  chr6  NT_167247.1  4419325-4599355    2.38 % in   21 repeats    100.00 % in 1 genes
8   179491  chr6  NT_167248.1  519108-698599    7.40 % in   21 repeats    1.76 % in 2 genes
9   171801  chr6  NT_167247.1  1558847-1730648    2.36 % in   19 repeats    0.00 % in 0 genes
10   167930  chr6  NT_167249.1  2136453-2304383    1.32 % in   11 repeats    0.00 % in 0 genes
11   164288  chr7  NT_023603.5  31900-196188    100.00 % in   5 repeats    0.00 % in 0 genes
12   160290  chr9  NT_008470.19  21684835-21845125    4.05 % in   20 repeats    0.00 % in 0 genes
13   150230  chr6  NT_167244.1  2893314-3043544    2.22 % in   21 repeats    0.00 % in 0 genes
14   138076  chr6  NT_167247.1  1169024-1307100    9.47 % in   35 repeats    0.00 % in 0 genes
15   121946  chr6  NT_167245.1  128006-249952    6.67 % in   26 repeats    0.00 % in 0 genes
16   120924  chr6  NT_167245.1  2604240-2725164    2.45 % in   7 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
499853  chr15  NT_037852.6  1393849-1893702    27  20       L2a (3)  L1MDa (3)  MER44C (2) 
413758  chr6  NT_167244.1  2359441-2773199    22  16       AluY (3)  LTR84b (2)  L2b (2) 
214600  chr6  NT_167244.1  4387503-4602103    15  11       MER57-int (2)  HERVH-int (2)  AluSx (2) 
191838  chr6  NT_167244.1  3164570-3356408    50  29       L1MC5 (6)  AluSx (5)  L1MB3 (4) 
187834  chr6  NT_167246.1  3050900-3238734    116  46       AluSx (18)  AluY (12)  AluJb (7) 
183579  chr6  NT_167244.1  3789845-3973424    13  11       MLT1H-int (2)  L2a (2)  (TA)n (1) 
180030  chr6  NT_167247.1  4419325-4599355    21  17       AluSx (3)  MLT1J (2)  L1MC5 (2) 
179491  chr6  NT_167248.1  519108-698599    21  14       AT_rich (5)  L1MA9 (3)  L1MC5 (2) 
171801  chr6  NT_167247.1  1558847-1730648    19  15       Tigger7 (2)  MSTD (2)  MIR (2) 
10  167930  chr6  NT_167249.1  2136453-2304383    11  7       L1MB8 (3)  AluSx (3)  MLT1A (1) 
11  164288  chr7  NT_023603.5  31900-196188    2       L1PA2 (4)  ALR/Alpha (1) 
12  160290  chr9  NT_008470.19  21684835-21845125    20  13       L1M5 (3)  MER5B (2)  LTR67B (2) 
13  150230  chr6  NT_167244.1  2893314-3043544    21  10       L1MC5 (6)  L2c (3)  AluSc (3) 
14  138076  chr6  NT_167247.1  1169024-1307100    35  22       ERV3-16A3_I-int (5)  L2 (4)  L2a (3) 
15  121946  chr6  NT_167245.1  128006-249952    26  23       MER57A1 (2)  L2c (2)  AluSx (2) 
16  120924  chr6  NT_167245.1  2604240-2725164    6       L2 (2)  MLT1N2 (1)  MLT1E2 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   499853       chr15  NT_037852.6  1393849-1893702    LOC100418897 
4   191838       chr6  NT_167244.1  3164570-3356408    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
5   187834       chr6  NT_167246.1  3050900-3238734    MSH5  mutS_protein_homolog_5_isoform_c
NEU1  sialidase-1_precursor
C2  complement_C2_isoform_3
7   180030       chr6  NT_167247.1  4419325-4599355    LOC100507722  hypothetical_protein_LOC100507722
8   179491       chr6  NT_167248.1  519108-698599    OR12D1P 
OR11A1  olfactory_receptor_11A1



Posfai@neb.com
May 11, 2011