Distribution of restriction sites in the human genome

Enzyme:  BslIB               Longest uncut segments
Specificity:  CCNNNNNNNGG               Repeats in uncut segments
Number of sites:  7495047               Genes in uncut segments
Mean distance between sites:  381 base pairs
Standard deviation:  551 base pairs
Site density2619.4 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   488872  chr15  NT_037852.6  1397345-1886217    0.11 % in   5 repeats    0.00 % in 0 genes
2   401805  chr6  NT_167244.1  2359749-2761554    0.06 % in   1 repeats    0.00 % in 0 genes
3   209258  chr6  NT_167244.1  4389949-4599207    0.60 % in   7 repeats    0.00 % in 0 genes
4   181100  chr6  NT_167244.1  3789586-3970686    0.19 % in   3 repeats    0.00 % in 0 genes
5   175343  chr6  NT_167244.1  3180238-3355581    0.18 % in   3 repeats    0.00 % in 0 genes
6   172851  chr6  NT_167247.1  4421883-4594734    0.28 % in   2 repeats    100.00 % in 1 genes
7   166679  chr6  NT_167249.1  2137818-2304497    0.76 % in   8 repeats    0.00 % in 0 genes
8   164322  chr6  NT_167247.1  1562925-1727247    0.02 % in   1 repeats    0.02 % in 1 genes
9   159475  chr6  NT_167248.1  521866-681341    0.10 % in   2 repeats    0.00 % in 0 genes
10   151544  chr9  NT_008470.19  21692428-21843972    0.48 % in   3 repeats    0.00 % in 0 genes
11   143813  chr6  NT_167244.1  2894162-3037975    0.47 % in   6 repeats    0.00 % in 0 genes
12   117834  chr6  NT_167245.1  2606244-2724078    0.27 % in   2 repeats    0.00 % in 0 genes
13   114738  chr6  NT_167247.1  1177538-1292276    0.11 % in   1 repeats    0.00 % in 0 genes
14   108681  chr6  NT_167245.1  137757-246438    0.71 % in   3 repeats    0.00 % in 0 genes
15   104940  chr6  NT_167244.1  1451387-1556327    0.33 % in   3 repeats    0.00 % in 0 genes
16   104863  chr6  NT_167244.1  588273-693136    0.25 % in   2 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
488872  chr15  NT_037852.6  1397345-1886217    5       MIRc (1)  MIRb (1)  L1M3 (1) 
401805  chr6  NT_167244.1  2359749-2761554    1       AluSp (1) 
209258  chr6  NT_167244.1  4389949-4599207    6       AluSx (2)  L1PA15 (1)  L1ME3D (1) 
181100  chr6  NT_167244.1  3789586-3970686    3       MLT1H-int (1)  MER52D (1)  AluJb (1) 
175343  chr6  NT_167244.1  3180238-3355581    3       GC_rich (1)  Charlie4a (1)  AluSp (1) 
172851  chr6  NT_167247.1  4421883-4594734    2       MER11A (1)  AluSc (1) 
166679  chr6  NT_167249.1  2137818-2304497    4       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
164322  chr6  NT_167247.1  1562925-1727247    1       MIR (1) 
159475  chr6  NT_167248.1  521866-681341    2       L1PREC2 (1)  HERVH-int (1) 
10  151544  chr9  NT_008470.19  21692428-21843972    3       MIR3 (1)  LTR67B (1)  L1M5 (1) 
11  143813  chr6  NT_167244.1  2894162-3037975    6       L1MC5 (1)  AluY (1)  AluSp (1) 
12  117834  chr6  NT_167245.1  2606244-2724078    2       MLT1E2 (1)  L2 (1) 
13  114738  chr6  NT_167247.1  1177538-1292276    1       ERV3-16A3_I-int (1) 
14  108681  chr6  NT_167245.1  137757-246438    3       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 
15  104940  chr6  NT_167244.1  1451387-1556327    3       ERV3-16A3_I-int (1)  AluY (1)  AluSg1 (1) 
16  104863  chr6  NT_167244.1  588273-693136    2       L1ME3D (1)  L1MA9 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
6   172851       chr6  NT_167247.1  4421883-4594734    LOC100507722  hypothetical_protein_LOC100507722
8   164322       chr6  NT_167247.1  1562925-1727247    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011