Distribution of restriction sites in the human genome

Enzyme:  MaqI               Longest uncut segments
Specificity:  CRTTGAC               Repeats in uncut segments
Number of sites:  276950               Genes in uncut segments
Mean distance between sites:  10331 base pairs
Standard deviation:  10900 base pairs
Site density 96.8 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   498312  chr15  NT_037852.6  1394681-1892993    1.13 % in   25 repeats    0.00 % in 0 genes
2   474827  chr6  NT_167244.1  2315059-2789886    8.32 % in   151 repeats    3.16 % in 2 genes
3   259800  chr6  NT_167244.1  2007434-2267234    3.58 % in   42 repeats    4.02 % in 3 genes
4   251374  chr6  NT_167244.1  3178980-3430354    6.34 % in   68 repeats    5.45 % in 2 genes
5   224047  chr6  NT_167247.1  4390430-4614477    8.72 % in   61 repeats    89.51 % in 5 genes
6   213925  chr6  NT_167249.1  2092480-2306405    10.04 % in   96 repeats    0.00 % in 0 genes
7   213409  chr7  NT_023603.5  12349-225758    97.33 % in   32 repeats    0.00 % in 0 genes
8   204347  chr6  NT_167246.1  3254114-3458461    10.01 % in   93 repeats    19.76 % in 3 genes
9   200682  chrY  NT_011875.12  8540178-8740860    72.84 % in   67 repeats    0.00 % in 0 genes
10   199624  chr6  NT_167247.1  1552452-1752076    10.63 % in   84 repeats    0.00 % in 0 genes
11   190780  chr6  NT_167244.1  3787404-3978184    2.80 % in   25 repeats    0.00 % in 0 genes
12   181093  chr6  NT_167244.1  1802296-1983389    23.40 % in   181 repeats    0.00 % in 0 genes
13   178401  chr12  NT_029419.12  184524-362925    99.79 % in   41 repeats    0.00 % in 0 genes
14   170246  chr6  NT_167244.1  2876914-3047160    9.57 % in   81 repeats    0.00 % in 0 genes
15   164550  chr6  NT_167248.1  519622-684172    3.18 % in   2 repeats    0.00 % in 0 genes
16   164423  chr9  NT_008470.19  21689526-21853949    4.36 % in   24 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
498312  chr15  NT_037852.6  1394681-1892993    25  19       L2a (3)  MER44C (2)  L1MDa (2) 
474827  chr6  NT_167244.1  2315059-2789886    151  65       AluSx (11)  AluY (8)  AluJo (8) 
259800  chr6  NT_167244.1  2007434-2267234    42  26       MIR (5)  AluSx (5)  MIRb (3) 
251374  chr6  NT_167244.1  3178980-3430354    68  25       AluSx (11)  AluSq (5)  MIR (4) 
224047  chr6  NT_167247.1  4390430-4614477    61  39       L1PB1 (5)  MIR (3)  L2b (3) 
213925  chr6  NT_167249.1  2092480-2306405    96  45       AluSx (11)  AluJb (9)  AluJo (5) 
213409  chr7  NT_023603.5  12349-225758    32  19       AT_rich (5)  L1PA2 (4)  ALR/Alpha (4) 
204347  chr6  NT_167246.1  3254114-3458461    93  36       AluSx (14)  AluSq (7)  AluY (5) 
200682  chrY  NT_011875.12  8540178-8740860    67  29       LTR12B (10)  A-rich (9)  L1PA16 (7) 
10  199624  chr6  NT_167247.1  1552452-1752076    84  50       L1MEf (6)  L1PB2 (4)  AluSq (4) 
11  190780  chr6  NT_167244.1  3787404-3978184    25  20       L2a (3)  MLT1H-int (2)  L1M5 (2) 
12  181093  chr6  NT_167244.1  1802296-1983389    181  52       AluSx (25)  L1MC4 (16)  AluJb (12) 
13  178401  chr12  NT_029419.12  184524-362925    41  9       ALR/Alpha (22)  L1PA3 (9)  (TTA)n (2) 
14  170246  chr6  NT_167244.1  2876914-3047160    81  27       AluJo (11)  AluY (8)  AluSx (8) 
15  164550  chr6  NT_167248.1  519622-684172    2       L1PREC2 (1)  HERVH-int (1) 
16  164423  chr9  NT_008470.19  21689526-21853949    24  18       MIRb (2)  LTR67B (2)  L2 (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
2   474827       chr6  NT_167244.1  2315059-2789886    HCG22  HLA_complex_group_22
MICB  MHC_class_I_polypeptide-related_sequence_B_precursor
3   259800       chr6  NT_167244.1  2007434-2267234    FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
MUC21  mucin-21_precursor
4   251374       chr6  NT_167244.1  3178980-3430354    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
5   224047       chr6  NT_167247.1  4390430-4614477    RPL32P1  HLA_class_II_histocompatibility_antigen,_DP_beta_1_chain_precursor
HLA-DPA2 
COL11A2P 
LOC100507722  hypothetical_protein_LOC100507722
COL11A2  collagen_alpha-2(XI)_chain_isoform_4_precursor
8   204347       chr6  NT_167246.1  3254114-3458461    C2  complement_C2_isoform_3
CFB  complement_factor_B_preproprotein_preproprotein
TNXB  tenascin-X_isoform_1_precursor



Posfai@neb.com
May 11, 2011