Distribution of restriction sites in the human genome

Enzyme:  SinI               Longest uncut segments
Specificity:  GGWCC               Repeats in uncut segments
Number of sites:  2669440               Genes in uncut segments
Mean distance between sites:  1071 base pairs
Standard deviation:  1381 base pairs
Site density 932.9 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488935  chr15  NT_037852.6  1396668-1885603    0.18 % in   6 repeats    0.00 % in 0 genes
2   403120  chr6  NT_167244.1  2358170-2761290    0.35 % in   7 repeats    0.00 % in 0 genes
3   209499  chr6  NT_167244.1  4389632-4599131    0.71 % in   8 repeats    0.00 % in 0 genes
4   181632  chr6  NT_167244.1  3790033-3971665    0.68 % in   6 repeats    0.00 % in 0 genes
5   176933  chr6  NT_167244.1  3180016-3356949    0.41 % in   6 repeats    0.55 % in 2 genes
6   172560  chr6  NT_167247.1  4421893-4594453    0.12 % in   2 repeats    100.00 % in 1 genes
7   168147  chr6  NT_167249.1  2138463-2306610    1.76 % in   13 repeats    0.00 % in 0 genes
8   159436  chr6  NT_167248.1  521878-681314    0.08 % in   2 repeats    0.00 % in 0 genes
9   151431  chr9  NT_008470.19  21692246-21843677    0.54 % in   4 repeats    0.00 % in 0 genes
10   143521  chr6  NT_167244.1  2894289-3037810    0.29 % in   4 repeats    0.00 % in 0 genes
11   119144  chr6  NT_167245.1  2605169-2724313    1.36 % in   3 repeats    0.00 % in 0 genes
12   114888  chr6  NT_167247.1  1177472-1292360    0.17 % in   1 repeats    0.00 % in 0 genes
13   113970  chr6  NT_167246.1  3261230-3375200    0.41 % in   3 repeats    0.00 % in 0 genes
14   109378  chr6  NT_167244.1  3486974-3596352    4.42 % in   14 repeats    0.00 % in 0 genes
15   108608  chr6  NT_167245.1  137796-246404    0.65 % in   3 repeats    0.00 % in 0 genes
16   107280  chr5  NW_003315917.1  1145634-1252914    2.86 % in   13 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488935  chr15  NT_037852.6  1396668-1885603    6       MIRc (1)  MIRb (1)  L1M3 (1) 
403120  chr6  NT_167244.1  2358170-2761290    5       L4 (2)  AluJb (2)  L1ME4a (1) 
209499  chr6  NT_167244.1  4389632-4599131    7       AluSx (2)  (TTCC)n (1)  MER57-int (1) 
181632  chr6  NT_167244.1  3790033-3971665    6       MLT1H-int (1)  MER52D (1)  LTR19B (1) 
176933  chr6  NT_167244.1  3180016-3356949    5       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
172560  chr6  NT_167247.1  4421893-4594453    2       MER11A (1)  AluSc (1) 
168147  chr6  NT_167249.1  2138463-2306610    13  5       Charlie2b (4)  AluSx (4)  L1MB8 (3) 
159436  chr6  NT_167248.1  521878-681314    2       L1PREC2 (1)  HERVH-int (1) 
151431  chr9  NT_008470.19  21692246-21843677    3       LTR67B (2)  MIR3 (1)  L1M5 (1) 
10  143521  chr6  NT_167244.1  2894289-3037810    4       L1MC5 (1)  AluY (1)  AluSg1 (1) 
11  119144  chr6  NT_167245.1  2605169-2724313    3       MLT1E2 (1)  L2a (1)  L2 (1) 
12  114888  chr6  NT_167247.1  1177472-1292360    1       ERV3-16A3_I-int (1) 
13  113970  chr6  NT_167246.1  3261230-3375200    2       MIRb (2)  AluSx (1) 
14  109378  chr6  NT_167244.1  3486974-3596352    14  8       L1M2 (4)  AluSg (3)  AluSx (2) 
15  108608  chr6  NT_167245.1  137796-246404    3       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 
16  107280  chr5  NW_003315917.1  1145634-1252914    13  9       AluSg (3)  L1M2 (2)  AT_rich (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   176933       chr6  NT_167244.1  3180016-3356949    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   172560       chr6  NT_167247.1  4421893-4594453    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011