Distribution of restriction sites in the human genome

Enzyme:  BclI               Longest uncut segments
Specificity:  TGATCA               Repeats in uncut segments
Number of sites:  731188               Genes in uncut segments
Mean distance between sites:  3913 base pairs
Standard deviation:  4075 base pairs
Site density 255.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   497960  chr15  NT_037852.6  1390687-1888647    1.32 % in   23 repeats    0.00 % in 0 genes
2   404116  chr6  NT_167244.1  2359337-2763453    0.14 % in   3 repeats    0.00 % in 0 genes
3   248114  chr6  NT_167244.1  2009696-2257810    1.49 % in   15 repeats    1.64 % in 2 genes
4   225528  chr6  NT_167244.1  4376655-4602183    4.78 % in   29 repeats    3.10 % in 1 genes
5   188269  chr6  NT_167244.1  3177672-3365941    2.93 % in   28 repeats    6.54 % in 2 genes
6   187617  chr6  NT_167244.1  3789750-3977367    2.39 % in   19 repeats    0.00 % in 0 genes
7   178020  chr6  NT_167247.1  4421312-4599332    2.08 % in   17 repeats    100.00 % in 1 genes
8   171223  chr6  NT_167247.1  1558884-1730107    2.26 % in   18 repeats    2.38 % in 1 genes
9   171008  chr7  NT_023603.5  24165-195173    99.74 % in   7 repeats    0.00 % in 0 genes
10   168170  chr6  NT_167249.1  2138151-2306321    1.62 % in   13 repeats    0.00 % in 0 genes
11   166163  chr6  NT_167248.1  515794-681957    3.85 % in   6 repeats    0.00 % in 0 genes
12   151506  chr9  NT_008470.19  21692367-21843873    0.48 % in   3 repeats    0.00 % in 0 genes
13   148664  chr6  NT_167244.1  2894560-3043224    2.00 % in   18 repeats    0.00 % in 0 genes
14   125080  chr12  NT_009714.17  27183021-27308101    81.13 % in   131 repeats    0.00 % in 0 genes
15   124421  chr9  NT_008470.19  21487642-21612063    10.20 % in   50 repeats    0.00 % in 0 genes
16   119652  chr6  NT_167245.1  2605146-2724798    1.77 % in   4 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
497960  chr15  NT_037852.6  1390687-1888647    23  16       L1MDa (6)  L2a (3)  (TA)n (1) 
404116  chr6  NT_167244.1  2359337-2763453    3       L4 (1)  L1MEg (1)  AluSp (1) 
248114  chr6  NT_167244.1  2009696-2257810    15  15       MIRb (1)  MIR (1)  MER5A1 (1) 
225528  chr6  NT_167244.1  4376655-4602183    29  20       MER57-int (3)  HUERS-P3-int (3)  AluSx (3) 
188269  chr6  NT_167244.1  3177672-3365941    28  17       AluSx (4)  MIR (3)  GC_rich (3) 
187617  chr6  NT_167244.1  3789750-3977367    19  16       L2a (3)  MLT1H-int (2)  THE1B (1) 
178020  chr6  NT_167247.1  4421312-4599332    17  13       AluSx (3)  MLT1J (2)  L1MC5 (2) 
171223  chr6  NT_167247.1  1558884-1730107    18  14       Tigger7 (2)  MSTD (2)  MIR (2) 
171008  chr7  NT_023603.5  24165-195173    4       L1PA2 (3)  ALR/Alpha (2)  (TATG)n (1) 
10  168170  chr6  NT_167249.1  2138151-2306321    13  5       Charlie2b (4)  AluSx (4)  L1MB8 (3) 
11  166163  chr6  NT_167248.1  515794-681957    6       LTR7 (1)  L1PREC2 (1)  L1P4 (1) 
12  151506  chr9  NT_008470.19  21692367-21843873    3       MIR3 (1)  LTR67B (1)  L1M5 (1) 
13  148664  chr6  NT_167244.1  2894560-3043224    18  9       L1MC5 (6)  L2c (2)  AluY (2) 
14  125080  chr12  NT_009714.17  27183021-27308101    131  17       GSATII (108)  GSATX (4)  ALR/Alpha (3) 
15  124421  chr9  NT_008470.19  21487642-21612063    50  31       L1ME4a (7)  MLT1F2 (4)  MLT1G1 (3) 
16  119652  chr6  NT_167245.1  2605146-2724798    3       L2 (2)  MLT1E2 (1)  L2a (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   248114       chr6  NT_167244.1  2009696-2257810    FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
4   225528       chr6  NT_167244.1  4376655-4602183    HLA-DPB2  major_histocompatibility_complex,_class_II,_DP_beta_2_(pseudogene)
5   188269       chr6  NT_167244.1  3177672-3365941    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
7   178020       chr6  NT_167247.1  4421312-4599332    LOC100507722  hypothetical_protein_LOC100507722
8   171223       chr6  NT_167247.1  1558884-1730107    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011