Distribution of restriction sites in the human genome

Enzyme:  BspMI               Longest uncut segments
Specificity:  ACCTGC               Repeats in uncut segments
Number of sites:  1366056               Genes in uncut segments
Mean distance between sites:  2094 base pairs
Standard deviation:  2374 base pairs
Site density 477.4 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   508763  chr15  NT_037852.6  1396564-1905327    1.43 % in   39 repeats    1.96 % in 1 genes
2   415314  chr6  NT_167244.1  2347488-2762802    2.11 % in   40 repeats    0.00 % in 0 genes
3   211729  chr6  NT_167244.1  4386497-4598226    1.80 % in   11 repeats    0.00 % in 0 genes
4   189759  chr6  NT_167244.1  3782118-3971877    2.41 % in   19 repeats    2.83 % in 1 genes
5   178818  chr6  NT_167244.1  3176924-3355742    1.05 % in   20 repeats    1.85 % in 1 genes
6   172187  chr6  NT_167247.1  4422154-4594341    0.05 % in   2 repeats    100.00 % in 1 genes
7   170356  chr6  NT_167247.1  1557817-1728173    2.09 % in   17 repeats    3.01 % in 1 genes
8   166638  chr6  NT_167249.1  2137875-2304513    0.73 % in   8 repeats    0.00 % in 0 genes
9   162658  chr6  NT_167244.1  2003353-2166011    1.74 % in   14 repeats    0.00 % in 0 genes
10   160827  chr6  NT_167248.1  521775-682602    0.94 % in   2 repeats    0.00 % in 0 genes
11   151627  chr9  NT_008470.19  21691741-21843368    0.75 % in   4 repeats    0.00 % in 0 genes
12   151253  chr6  NT_167244.1  2889533-3040786    4.42 % in   34 repeats    0.00 % in 0 genes
13   120674  chr10  NT_008705.16  38710807-38831481    27.74 % in   219 repeats    0.00 % in 0 genes
14   119371  chr6  NT_167245.1  2606083-2725454    1.42 % in   5 repeats    0.00 % in 0 genes
15   116542  chr6  NT_167246.1  3259948-3376490    1.10 % in   9 repeats    0.00 % in 0 genes
16   116020  chr6  NT_167247.1  1176693-1292713    0.84 % in   1 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
508763  chr15  NT_037852.6  1396564-1905327    39  26       AT_rich (5)  (TA)n (3)  L2a (3) 
415314  chr6  NT_167244.1  2347488-2762802    40  26       AluJb (4)  L1ME4a (3)  AluSx (3) 
211729  chr6  NT_167244.1  4386497-4598226    11  8       MER57-int (3)  AluSx (2)  (TTTTA)n (1) 
189759  chr6  NT_167244.1  3782118-3971877    19  13       L2a (3)  MLT1H-int (2)  AT_rich (2) 
178818  chr6  NT_167244.1  3176924-3355742    20  14       GC_rich (3)  AluSx (3)  MER44B (2) 
172187  chr6  NT_167247.1  4422154-4594341    2       MER11A (1)  AluSc (1) 
170356  chr6  NT_167247.1  1557817-1728173    17  14       Tigger7 (2)  MSTD (2)  MIR (2) 
166638  chr6  NT_167249.1  2137875-2304513    4       L1MB8 (3)  AluSx (3)  L1MC4a (1) 
162658  chr6  NT_167244.1  2003353-2166011    14  9       AluSx (4)  FRAM (2)  AluJb (2) 
10  160827  chr6  NT_167248.1  521775-682602    2       L1PREC2 (1)  HERVH-int (1) 
11  151627  chr9  NT_008470.19  21691741-21843368    3       LTR67B (2)  MSTA (1)  L1M5 (1) 
12  151253  chr6  NT_167244.1  2889533-3040786    34  16       L1MC5 (6)  AluY (5)  AluSc (3) 
13  120674  chr10  NT_008705.16  38710807-38831481    219  31       GA-rich (24)  (GAATG)n (22)  (AAATG)n (22) 
14  119371  chr6  NT_167245.1  2606083-2725454    4       L2 (2)  MLT1E2 (1)  L2a (1) 
15  116542  chr6  NT_167246.1  3259948-3376490    6       AluSx (3)  MIRb (2)  (TTA)n (1) 
16  116020  chr6  NT_167247.1  1176693-1292713    1       ERV3-16A3_I-int (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   508763       chr15  NT_037852.6  1396564-1905327    LOC100418897 
4   189759       chr6  NT_167244.1  3782118-3971877    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
5   178818       chr6  NT_167244.1  3176924-3355742    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   172187       chr6  NT_167247.1  4422154-4594341    LOC100507722  hypothetical_protein_LOC100507722
7   170356       chr6  NT_167247.1  1557817-1728173    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011