Distribution of restriction sites in the human genome

Enzyme:  SspI               Longest uncut segments
Specificity:  AATATT               Repeats in uncut segments
Number of sites:  2345485               Genes in uncut segments
Mean distance between sites:  1219 base pairs
Standard deviation:  1781 base pairs
Site density 819.7 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   486724  chr15  NT_037852.6  1398520-1885244    0.01 % in   1 repeats    0.00 % in 0 genes
2   405010  chr6  NT_167244.1  2356723-2761733    0.56 % in   10 repeats    0.00 % in 0 genes
3   214953  chr6  NT_167244.1  4386145-4601098    2.73 % in   19 repeats    0.00 % in 0 genes
4   189543  chrY  NT_011875.12  8439355-8628898    73.56 % in   9 repeats    0.00 % in 0 genes
5   181744  chr6  NT_167244.1  3788972-3970716    0.36 % in   6 repeats    0.00 % in 0 genes
6   176833  chr6  NT_167244.1  3178669-3355502    0.22 % in   6 repeats    0.88 % in 1 genes
7   172843  chr6  NT_167247.1  4421487-4594330    0.04 % in   2 repeats    100.00 % in 1 genes
8   166947  chr6  NT_167249.1  2138430-2305377    1.04 % in   7 repeats    0.00 % in 0 genes
9   165326  chr6  NT_167247.1  1561682-1727008    0.32 % in   2 repeats    0.00 % in 0 genes
10   161524  chr6  NT_167248.1  520683-682207    1.37 % in   2 repeats    0.00 % in 0 genes
11   160127  chr6  NT_167244.1  2008857-2168984    0.98 % in   8 repeats    0.00 % in 0 genes
12   153068  chr9  NT_008470.19  21691211-21844279    0.90 % in   6 repeats    0.00 % in 0 genes
13   143628  chr6  NT_167244.1  2893948-3037576    0.33 % in   3 repeats    0.00 % in 0 genes
14   138123  chr1  NT_004350.19  2037262-2175385    5.80 % in   30 repeats    0.00 % in 0 genes
15   129246  chr6  NT_167246.1  3245250-3374496    4.25 % in   33 repeats    0.00 % in 0 genes
16   128355  chr6  NT_167247.1  1166758-1295113    4.46 % in   15 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
486724  chr15  NT_037852.6  1398520-1885244    1       AT_rich (1) 
405010  chr6  NT_167244.1  2356723-2761733    10  8       L4 (2)  AluJb (2)  MER8 (1) 
214953  chr6  NT_167244.1  4386145-4601098    19  13       MER57-int (3)  AluSx (3)  AluY (2) 
189543  chrY  NT_011875.12  8439355-8628898    2       LTR12B (8)  LTR12D (1) 
181744  chr6  NT_167244.1  3788972-3970716    5       AT_rich (2)  MLT1H-int (1)  MIR (1) 
176833  chr6  NT_167244.1  3178669-3355502    4       GC_rich (3)  L2a (1)  (CCG)n (1) 
172843  chr6  NT_167247.1  4421487-4594330    2       MER11A (1)  AluSc (1) 
166947  chr6  NT_167249.1  2138430-2305377    3       L1MB8 (3)  AluSx (3)  Charlie2b (1) 
165326  chr6  NT_167247.1  1561682-1727008    2       L1MC3 (1)  A-rich (1) 
10  161524  chr6  NT_167248.1  520683-682207    2       L1PREC2 (1)  HERVH-int (1) 
11  160127  chr6  NT_167244.1  2008857-2168984    7       MIR (2)  MIRb (1)  MER5A1 (1) 
12  153068  chr9  NT_008470.19  21691211-21844279    5       LTR67B (2)  MSTA (1)  MIR3 (1) 
13  143628  chr6  NT_167244.1  2893948-3037576    3       AluY (1)  AluSg1 (1)  AluSc (1) 
14  138123  chr1  NT_004350.19  2037262-2175385    30  18       L1MEf (4)  (TG)n (3)  L1MB3 (3) 
15  129246  chr6  NT_167246.1  3245250-3374496    33  20       AluSx (8)  AT_rich (3)  MLT1C (2) 
16  128355  chr6  NT_167247.1  1166758-1295113    15  11       L2 (3)  MIRb (2)  ERV3-16A3_I-int (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   176833       chr6  NT_167244.1  3178669-3355502    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   172843       chr6  NT_167247.1  4421487-4594330    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011