Distribution of restriction sites in the human genome

Enzyme:  R2.BssIMI               Longest uncut segments
Specificity:  GGGTC               Repeats in uncut segments
Number of sites:  3130449               Genes in uncut segments
Mean distance between sites:  914 base pairs
Standard deviation:  1168 base pairs
Site density1094.0 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   489594  chr15  NT_037852.6  1397411-1887005    0.11 % in   6 repeats    0.00 % in 0 genes
2   402587  chr6  NT_167244.1  2359036-2761623    0.16 % in   3 repeats    0.00 % in 0 genes
3   208493  chr6  NT_167244.1  4389631-4598124    0.30 % in   4 repeats    0.00 % in 0 genes
4   182470  chr6  NT_167244.1  3788380-3970850    0.60 % in   7 repeats    0.00 % in 0 genes
5   175763  chr6  NT_167244.1  3180256-3356019    0.19 % in   3 repeats    0.00 % in 0 genes
6   172616  chr6  NT_167247.1  4422021-4594637    0.22 % in   2 repeats    100.00 % in 1 genes
7   166102  chr6  NT_167249.1  2137835-2303937    0.53 % in   6 repeats    0.00 % in 0 genes
8   165453  chr6  NT_167247.1  1562848-1728301    0.41 % in   4 repeats    0.06 % in 1 genes
9   160675  chr6  NT_167248.1  520820-681495    0.85 % in   2 repeats    0.00 % in 0 genes
10   156941  chr6  NT_167244.1  2007725-2164666    0.79 % in   5 repeats    0.00 % in 0 genes
11   152195  chr9  NT_008470.19  21691555-21843750    0.89 % in   5 repeats    0.00 % in 0 genes
12   143304  chr6  NT_167244.1  2894396-3037700    0.21 % in   4 repeats    0.00 % in 0 genes
13   120628  chr6  NT_167245.1  2604294-2724922    2.21 % in   7 repeats    0.00 % in 0 genes
14   114803  chr6  NT_167246.1  3260031-3374834    0.26 % in   3 repeats    0.00 % in 0 genes
15   114653  chr6  NT_167247.1  1177621-1292274    0.04 % in   1 repeats    0.00 % in 0 genes
16   110472  chr6  NT_167245.1  135955-246427    2.21 % in   5 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
489594  chr15  NT_037852.6  1397411-1887005    6       MLT1L (1)  MIRc (1)  MIRb (1) 
402587  chr6  NT_167244.1  2359036-2761623    3       L4 (1)  AluSp (1)  AluJb (1) 
208493  chr6  NT_167244.1  4389631-4598124    4       (TTCC)n (1)  MER57-int (1)  AluSg/x (1) 
182470  chr6  NT_167244.1  3788380-3970850    6       AT_rich (2)  MLT1H-int (1)  MIR (1) 
175763  chr6  NT_167244.1  3180256-3356019    3       GC_rich (1)  Charlie4a (1)  AluSp (1) 
172616  chr6  NT_167247.1  4422021-4594637    2       MER11A (1)  AluSc (1) 
166102  chr6  NT_167249.1  2137835-2303937    4       L1MB8 (2)  AluSx (2)  L1MC4a (1) 
165453  chr6  NT_167247.1  1562848-1728301    3       MIR (2)  (GGAA)n (1)  AluSq (1) 
160675  chr6  NT_167248.1  520820-681495    2       L1PREC2 (1)  HERVH-int (1) 
10  156941  chr6  NT_167244.1  2007725-2164666    4       AluSx (2)  MIRb (1)  MIR (1) 
11  152195  chr9  NT_008470.19  21691555-21843750    4       LTR67B (2)  MSTA (1)  MIR3 (1) 
12  143304  chr6  NT_167244.1  2894396-3037700    4       L1MC5 (1)  AluY (1)  AluSg1 (1) 
13  120628  chr6  NT_167245.1  2604294-2724922    6       L2 (2)  MLT1N2 (1)  MLT1E2 (1) 
14  114803  chr6  NT_167246.1  3260031-3374834    3       MIRb (1)  MIR3 (1)  AluSx (1) 
15  114653  chr6  NT_167247.1  1177621-1292274    1       ERV3-16A3_I-int (1) 
16  110472  chr6  NT_167245.1  135955-246427    5       MLT1F (1)  MLT1E2 (1)  MER6 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   172616       chr6  NT_167247.1  4422021-4594637    LOC100507722  hypothetical_protein_LOC100507722
8   165453       chr6  NT_167247.1  1562848-1728301    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011