Distribution of restriction sites in the human genome

Enzyme:  BsiHKAI               Longest uncut segments
Specificity:  GWGCWC               Repeats in uncut segments
Number of sites:  2034720               Genes in uncut segments
Mean distance between sites:  1406 base pairs
Standard deviation:  1600 base pairs
Site density 711.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   487849  chr15  NT_037852.6  1398572-1886421    0.01 % in   1 repeats    0.00 % in 0 genes
2   403287  chr6  NT_167244.1  2357987-2761274    0.40 % in   7 repeats    0.00 % in 0 genes
3   209699  chr6  NT_167244.1  4388443-4598142    0.86 % in   6 repeats    0.00 % in 0 genes
4   183265  chr6  NT_167244.1  3787380-3970645    0.48 % in   7 repeats    0.06 % in 1 genes
5   176214  chr6  NT_167244.1  3179922-3356136    0.24 % in   5 repeats    0.17 % in 1 genes
6   172681  chr6  NT_167247.1  4421972-4594653    0.23 % in   2 repeats    100.00 % in 1 genes
7   169919  chr6  NT_167249.1  2135698-2305617    2.29 % in   17 repeats    0.00 % in 0 genes
8   166014  chr6  NT_167247.1  1562927-1728941    0.50 % in   5 repeats    0.02 % in 1 genes
9   164450  chr6  NT_167248.1  516885-681335    3.13 % in   3 repeats    0.00 % in 0 genes
10   159161  chr6  NT_167244.1  2006736-2165897    1.02 % in   7 repeats    0.00 % in 0 genes
11   152268  chr9  NT_008470.19  21692627-21844895    0.67 % in   5 repeats    0.00 % in 0 genes
12   144528  chr6  NT_167244.1  2893724-3038252    0.81 % in   8 repeats    0.00 % in 0 genes
13   119773  chr6  NT_167245.1  2605188-2724961    1.87 % in   4 repeats    0.00 % in 0 genes
14   118264  chr6  NT_167244.1  3490019-3608283    5.54 % in   17 repeats    0.00 % in 0 genes
15   117359  chr6  NT_167247.1  1176334-1293693    1.13 % in   1 repeats    0.00 % in 0 genes
16   116523  chr6  NT_167246.1  3260337-3376860    1.34 % in   11 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
487849  chr15  NT_037852.6  1398572-1886421    1       AT_rich (1) 
403287  chr6  NT_167244.1  2357987-2761274    5       L4 (2)  AluJb (2)  L1ME4a (1) 
209699  chr6  NT_167244.1  4388443-4598142    5       MER57-int (2)  (TTCC)n (1)  AluY (1) 
183265  chr6  NT_167244.1  3787380-3970645    6       AT_rich (2)  MLT1H-int (1)  MIR (1) 
176214  chr6  NT_167244.1  3179922-3356136    4       GC_rich (2)  Charlie4a (1)  (CCG)n (1) 
172681  chr6  NT_167247.1  4421972-4594653    2       MER11A (1)  AluSc (1) 
169919  chr6  NT_167249.1  2135698-2305617    17  10       AluSx (4)  L1MB8 (3)  MLT1A (2) 
166014  chr6  NT_167247.1  1562927-1728941    4       MIR (2)  L1MEe (1)  (GGAA)n (1) 
164450  chr6  NT_167248.1  516885-681335    3       LTR7 (1)  L1PREC2 (1)  HERVH-int (1) 
10  159161  chr6  NT_167244.1  2006736-2165897    5       AluSx (3)  MIRb (1)  MIR (1) 
11  152268  chr9  NT_008470.19  21692627-21844895    4       L2 (2)  MIR3 (1)  LTR67B (1) 
12  144528  chr6  NT_167244.1  2893724-3038252    7       AluJo (2)  (TCC)n (1)  L1MC5 (1) 
13  119773  chr6  NT_167245.1  2605188-2724961    3       L2 (2)  MLT1E2 (1)  L2a (1) 
14  118264  chr6  NT_167244.1  3490019-3608283    17  12       MER102a (2)  L2a (2)  L1PA13 (2) 
15  117359  chr6  NT_167247.1  1176334-1293693    1       ERV3-16A3_I-int (1) 
16  116523  chr6  NT_167246.1  3260337-3376860    11  7       AluSx (3)  MIRb (2)  L1MC5 (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   183265       chr6  NT_167244.1  3787380-3970645    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
5   176214       chr6  NT_167244.1  3179922-3356136    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   172681       chr6  NT_167247.1  4421972-4594653    LOC100507722  hypothetical_protein_LOC100507722
8   166014       chr6  NT_167247.1  1562927-1728941    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011