Distribution of restriction sites in the human genome

Enzyme:  MunI               Longest uncut segments
Specificity:  CAATTG               Repeats in uncut segments
Number of sites:  546791               Genes in uncut segments
Mean distance between sites:  5232 base pairs
Standard deviation:  5927 base pairs
Site density 191.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   495845  chr15  NT_037852.6  1390941-1886786    1.05 % in   17 repeats    0.00 % in 0 genes
2   416078  chr6  NT_167244.1  2355864-2771942    1.78 % in   33 repeats    0.00 % in 0 genes
3   303973  chrY  NT_011875.12  8414266-8718239    82.77 % in   36 repeats    0.00 % in 0 genes
4   274999  chr6  NT_167244.1  2000122-2275121    5.81 % in   69 repeats    6.72 % in 4 genes
5   247652  chr6  NT_167244.1  3179431-3427083    5.65 % in   59 repeats    5.35 % in 2 genes
6   215041  chr6  NT_167244.1  4389234-4604275    2.83 % in   16 repeats    0.00 % in 0 genes
7   205843  chr6  NT_167247.1  4419610-4625453    3.32 % in   36 repeats    98.40 % in 2 genes
8   193670  chr6  NT_167244.1  3783773-3977443    3.77 % in   30 repeats    1.92 % in 1 genes
9   171143  chr6  NT_167248.1  511928-683071    6.62 % in   7 repeats    0.00 % in 0 genes
10   169336  chr6  NT_167249.1  2136169-2305505    1.96 % in   14 repeats    0.00 % in 0 genes
11   167945  chr6  NT_167247.1  1558888-1726833    1.38 % in   11 repeats    0.00 % in 0 genes
12   162970  chr4  NT_006316.16  391246-554216    3.58 % in   55 repeats    0.00 % in 0 genes
13   154870  chr9  NT_008470.19  21689371-21844241    2.01 % in   9 repeats    0.00 % in 0 genes
14   151956  chr16  NT_010393.16  598833-750789    21.20 % in   173 repeats    0.00 % in 0 genes
15   151398  chr4  NT_037622.5  924458-1075856    29.75 % in   216 repeats    0.00 % in 0 genes
16   148289  chr9  NT_024000.16  561787-710076    29.94 % in   217 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
495845  chr15  NT_037852.6  1390941-1886786    17  12       L1MDa (6)  MIRc (1)  MIRb (1) 
416078  chr6  NT_167244.1  2355864-2771942    33  20       L4 (3)  AluY (3)  AluJb (3) 
303973  chrY  NT_011875.12  8414266-8718239    36  12       LTR12B (17)  L1PA16 (4)  L1PA7 (3) 
274999  chr6  NT_167244.1  2000122-2275121    69  39       AluSx (9)  MIR (5)  MIRb (3) 
247652  chr6  NT_167244.1  3179431-3427083    59  23       AluSx (10)  MIR (4)  L2a (4) 
215041  chr6  NT_167244.1  4389234-4604275    16  11       HERVH-int (3)  MER57-int (2)  AluSx (2) 
205843  chr6  NT_167247.1  4419610-4625453    36  25       AluSx (5)  MLT1J (2)  MIR (2) 
193670  chr6  NT_167244.1  3783773-3977443    30  21       L2a (6)  MLT1H-int (2)  AT_rich (2) 
171143  chr6  NT_167248.1  511928-683071    7       LTR7 (1)  L1PREC2 (1)  L1PA7 (1) 
10  169336  chr6  NT_167249.1  2136169-2305505    14  9       AluSx (4)  L1MB8 (3)  MLT1A (1) 
11  167945  chr6  NT_167247.1  1558888-1726833    11  9       Tigger7 (2)  MSTD (2)  MIRc (1) 
12  162970  chr4  NT_006316.16  391246-554216    55  4       (CA)n (46)  L1M4 (7)  MER5B (1) 
13  154870  chr9  NT_008470.19  21689371-21844241    7       LTR67B (2)  L1M4b (2)  MSTA (1) 
14  151956  chr16  NT_010393.16  598833-750789    173  57       AluSx (20)  AluY (17)  GC_rich (15) 
15  151398  chr4  NT_037622.5  924458-1075856    216  81       L1MEc (14)  AluSx (14)  AluJb (11) 
16  148289  chr9  NT_024000.16  561787-710076    217  76       AluSx (26)  AluY (17)  AluJb (17) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   274999       chr6  NT_167244.1  2000122-2275121    LOC100294090  hypothetical_LOC100294090,_transcript_variant_1
FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
MUC21  mucin-21_precursor
5   247652       chr6  NT_167244.1  3179431-3427083    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
7   205843       chr6  NT_167247.1  4419610-4625453    LOC100507722  hypothetical_protein_LOC100507722
COL11A2  collagen_alpha-2(XI)_chain_isoform_4_precursor
8   193670       chr6  NT_167244.1  3783773-3977443    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor



Posfai@neb.com
May 11, 2011