Distribution of restriction sites in the human genome

Enzyme:  SacI               Longest uncut segments
Specificity:  GAGCTC               Repeats in uncut segments
Number of sites:  595174               Genes in uncut segments
Mean distance between sites:  4807 base pairs
Standard deviation:  5456 base pairs
Site density 208.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   498774  chr15  NT_037852.6  1396294-1895068    1.05 % in   23 repeats    0.40 % in 1 genes
2   411689  chr6  NT_167244.1  2357156-2768845    1.32 % in   22 repeats    0.00 % in 0 genes
3   221308  chr6  NT_167244.1  4378896-4600204    3.04 % in   22 repeats    2.15 % in 1 genes
4   195651  chr6  NT_167244.1  3787380-3983031    3.98 % in   35 repeats    0.06 % in 1 genes
5   177388  chr6  NT_167244.1  3178748-3356136    0.25 % in   6 repeats    0.83 % in 1 genes
6   177280  chr6  NT_167247.1  4419334-4596614    1.44 % in   11 repeats    100.00 % in 1 genes
7   169933  chr6  NT_167249.1  2135698-2305631    2.30 % in   17 repeats    0.00 % in 0 genes
8   166459  chr6  NT_167247.1  1562927-1729386    0.60 % in   6 repeats    0.02 % in 1 genes
9   164450  chr6  NT_167248.1  516885-681335    3.13 % in   3 repeats    0.00 % in 0 genes
10   159161  chr6  NT_167244.1  2006736-2165897    1.02 % in   7 repeats    0.00 % in 0 genes
11   155881  chr9  NT_008470.19  21691195-21847076    1.57 % in   12 repeats    0.00 % in 0 genes
12   144528  chr6  NT_167244.1  2893724-3038252    0.81 % in   8 repeats    0.00 % in 0 genes
13   140054  chr6  NT_167247.1  1153891-1293945    11.33 % in   40 repeats    0.00 % in 0 genes
14   134665  chr10  NT_008705.16  38700844-38835509    28.61 % in   242 repeats    0.00 % in 0 genes
15   133299  chr6  NT_167244.1  1432437-1565736    17.02 % in   67 repeats    0.00 % in 0 genes
16   126193  chr6  NT_167244.1  3486053-3612246    8.35 % in   33 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
498774  chr15  NT_037852.6  1396294-1895068    23  18       L2a (3)  MER44C (2)  L1M5 (2) 
411689  chr6  NT_167244.1  2357156-2768845    22  16       AluY (3)  LTR84b (2)  L4 (2) 
221308  chr6  NT_167244.1  4378896-4600204    22  17       MER57-int (3)  AluSx (3)  AluY (2) 
195651  chr6  NT_167244.1  3787380-3983031    35  27       L2a (6)  MLT1H-int (2)  L1M5 (2) 
177388  chr6  NT_167244.1  3178748-3356136    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
177280  chr6  NT_167247.1  4419334-4596614    11  11       (TTAAA)n (1)  MLT1J (1)  MIRb (1) 
169933  chr6  NT_167249.1  2135698-2305631    17  10       AluSx (4)  L1MB8 (3)  MLT1A (2) 
166459  chr6  NT_167247.1  1562927-1729386    4       MIR (2)  L1MEe (2)  (GGAA)n (1) 
164450  chr6  NT_167248.1  516885-681335    3       LTR7 (1)  L1PREC2 (1)  HERVH-int (1) 
10  159161  chr6  NT_167244.1  2006736-2165897    5       AluSx (3)  MIRb (1)  MIR (1) 
11  155881  chr9  NT_008470.19  21691195-21847076    12  9       MIRb (2)  LTR67B (2)  L2 (2) 
12  144528  chr6  NT_167244.1  2893724-3038252    7       AluJo (2)  (TCC)n (1)  L1MC5 (1) 
13  140054  chr6  NT_167247.1  1153891-1293945    40  29       L2 (3)  L1M4 (3)  ERV3-16A3_I-int (3) 
14  134665  chr10  NT_008705.16  38700844-38835509    242  49       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 
15  133299  chr6  NT_167244.1  1432437-1565736    67  36       L1MA1 (7)  AluY (5)  MER41C (3) 
16  126193  chr6  NT_167244.1  3486053-3612246    33  15       AluSx (6)  AluSg (5)  L1M2 (4) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   498774       chr15  NT_037852.6  1396294-1895068    LOC100418897 
3   221308       chr6  NT_167244.1  4378896-4600204    HLA-DPB2  major_histocompatibility_complex,_class_II,_DP_beta_2_(pseudogene)
4   195651       chr6  NT_167244.1  3787380-3983031    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
5   177388       chr6  NT_167244.1  3178748-3356136    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   177280       chr6  NT_167247.1  4419334-4596614    LOC100507722  hypothetical_protein_LOC100507722
8   166459       chr6  NT_167247.1  1562927-1729386    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011