Distribution of restriction sites in the human genome

Enzyme:  NdeI               Longest uncut segments
Specificity:  CATATG               Repeats in uncut segments
Number of sites:  897043               Genes in uncut segments
Mean distance between sites:  3189 base pairs
Standard deviation:  3866 base pairs
Site density 313.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   492894  chr15  NT_037852.6  1397923-1890817    0.65 % in   13 repeats    0.00 % in 0 genes
2   416551  chr6  NT_167244.1  2348339-2764890    2.11 % in   38 repeats    0.00 % in 0 genes
3   196091  chr6  NT_167244.1  3166153-3362244    5.17 % in   58 repeats    10.27 % in 2 genes
4   185739  chr6  NT_167244.1  3786883-3972622    1.30 % in   14 repeats    0.33 % in 1 genes
5   177602  chr6  NT_167247.1  4419501-4597103    1.37 % in   11 repeats    100.00 % in 1 genes
6   174271  chr6  NT_167249.1  2132090-2306361    4.06 % in   32 repeats    0.00 % in 0 genes
7   173622  chr6  NT_167244.1  1993701-2167323    3.89 % in   34 repeats    8.34 % in 4 genes
8   169038  chr6  NT_167247.1  1558264-1727302    1.62 % in   14 repeats    2.77 % in 1 genes
9   165260  chr6  NT_167248.1  518966-684226    3.60 % in   2 repeats    0.00 % in 0 genes
10   159520  chr6  NT_167244.1  2884430-3043950    6.73 % in   56 repeats    0.00 % in 0 genes
11   156157  chr9  NT_008470.19  21691161-21847318    1.59 % in   13 repeats    0.00 % in 0 genes
12   140699  chr6  NT_167244.1  1819092-1959791    12.95 % in   81 repeats    0.00 % in 0 genes
13   132628  chr6  NT_167245.1  133176-265804    10.34 % in   56 repeats    0.00 % in 0 genes
14   119315  chr6  NT_167245.1  2606171-2725486    1.37 % in   5 repeats    0.00 % in 0 genes
15   119233  chr6  NT_167247.1  1174589-1293822    2.54 % in   4 repeats    0.00 % in 0 genes
16   119078  chr6  NT_167246.1  3259010-3378088    2.23 % in   16 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
492894  chr15  NT_037852.6  1397923-1890817    13  10       L2a (3)  L1M5 (2)  U2 (1) 
416551  chr6  NT_167244.1  2348339-2764890    38  27       AluJb (4)  L1ME4a (3)  AluSx (3) 
196091  chr6  NT_167244.1  3166153-3362244    58  28       AluSx (9)  L1MC5 (6)  L1MB3 (4) 
185739  chr6  NT_167244.1  3786883-3972622    14  12       MLT1H-int (2)  AT_rich (2)  (TA)n (1) 
177602  chr6  NT_167247.1  4419501-4597103    11  10       MLT1J (2)  (TTAAA)n (1)  MIR (1) 
174271  chr6  NT_167249.1  2132090-2306361    32  16       AluSx (6)  Charlie2b (4)  L1MB8 (3) 
173622  chr6  NT_167244.1  1993701-2167323    34  20       AluSx (6)  L2c (3)  MIR (2) 
169038  chr6  NT_167247.1  1558264-1727302    14  12       Tigger7 (2)  MSTD (2)  (TG)n (1) 
165260  chr6  NT_167248.1  518966-684226    2       L1PREC2 (1)  HERVH-int (1) 
10  159520  chr6  NT_167244.1  2884430-3043950    56  25       L1MC5 (6)  AluY (6)  AluJo (5) 
11  156157  chr9  NT_008470.19  21691161-21847318    13  10       MIRb (2)  LTR67B (2)  L2 (2) 
12  140699  chr6  NT_167244.1  1819092-1959791    81  28       AluSx (11)  L2c (7)  L2a (6) 
13  132628  chr6  NT_167245.1  133176-265804    56  37       AluSx (7)  L1MC5 (4)  AluY (4) 
14  119315  chr6  NT_167245.1  2606171-2725486    4       L2 (2)  MLT1E2 (1)  L2a (1) 
15  119233  chr6  NT_167247.1  1174589-1293822    3       ERV3-16A3_I-int (2)  LTR16B2 (1)  L2 (1) 
16  119078  chr6  NT_167246.1  3259010-3378088    16  11       L1MC5 (3)  AluSx (3)  MIRb (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   196091       chr6  NT_167244.1  3166153-3362244    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
4   185739       chr6  NT_167244.1  3786883-3972622    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
5   177602       chr6  NT_167247.1  4419501-4597103    LOC100507722  hypothetical_protein_LOC100507722
7   173622       chr6  NT_167244.1  1993701-2167323    MDC1  mediator_of_DNA_damage_checkpoint_protein_1
LOC100294090  hypothetical_LOC100294090,_transcript_variant_1
FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
8   169038       chr6  NT_167247.1  1558264-1727302    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011