Distribution of restriction sites in the human genome

Enzyme:  NcoI               Longest uncut segments
Specificity:  CCATGG               Repeats in uncut segments
Number of sites:  751508               Genes in uncut segments
Mean distance between sites:  3807 base pairs
Standard deviation:  4230 base pairs
Site density 262.6 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   491389  chr15  NT_037852.6  1397762-1889151    0.38 % in   9 repeats    0.00 % in 0 genes
2   406121  chr6  NT_167244.1  2356909-2763030    0.60 % in   10 repeats    0.00 % in 0 genes
3   246281  chr6  NT_167244.1  2009529-2255810    1.07 % in   11 repeats    1.72 % in 2 genes
4   228684  chr6  NT_167244.1  4377889-4606573    6.05 % in   34 repeats    2.52 % in 1 genes
5   191189  chr6  NT_167244.1  3785039-3976228    3.07 % in   26 repeats    1.28 % in 1 genes
6   184307  chr6  NT_167244.1  3171816-3356123    2.80 % in   35 repeats    4.56 % in 1 genes
7   178666  chr6  NT_167247.1  4420283-4598949    2.19 % in   20 repeats    100.00 % in 1 genes
8   176109  chr6  NT_167248.1  510529-686638    8.67 % in   8 repeats    0.00 % in 0 genes
9   167132  chr6  NT_167249.1  2138201-2305333    1.04 % in   8 repeats    0.00 % in 0 genes
10   166208  chr6  NT_167247.1  1561942-1728150    0.56 % in   6 repeats    0.00 % in 0 genes
11   164179  chr7  NT_023603.5  31957-196136    100.00 % in   5 repeats    0.00 % in 0 genes
12   152180  chr6  NT_167244.1  2889478-3041658    4.43 % in   35 repeats    0.00 % in 0 genes
13   151595  chr9  NT_008470.19  21693226-21844821    0.28 % in   4 repeats    0.00 % in 0 genes
14   134845  chr6  NT_167244.1  1437765-1572610    15.93 % in   57 repeats    0.00 % in 0 genes
15   121575  chr5  NW_003315917.1  1126680-1248255    8.38 % in   51 repeats    0.00 % in 0 genes
16   121336  chr6  NT_167247.1  1173489-1294825    3.34 % in   7 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
491389  chr15  NT_037852.6  1397762-1889151    7       L2a (3)  (TA)n (1)  MLT1L (1) 
406121  chr6  NT_167244.1  2356909-2763030    10  8       L4 (2)  AluJb (2)  MER8 (1) 
246281  chr6  NT_167244.1  2009529-2255810    11  11       MIRb (1)  MIR (1)  MER5A1 (1) 
228684  chr6  NT_167244.1  4377889-4606573    34  22       HERVH-int (4)  AluSx (4)  MER57-int (3) 
191189  chr6  NT_167244.1  3785039-3976228    26  20       L2a (4)  MLT1H-int (2)  AT_rich (2) 
184307  chr6  NT_167244.1  3171816-3356123    35  19       AluSx (5)  L1MC5 (4)  L1MB3 (4) 
178666  chr6  NT_167247.1  4420283-4598949    20  16       AluSx (3)  MLT1J (2)  L1MC5 (2) 
176109  chr6  NT_167248.1  510529-686638    8       LTR7 (1)  L1PREC2 (1)  L1PA7 (1) 
167132  chr6  NT_167249.1  2138201-2305333    4       L1MB8 (3)  AluSx (3)  Charlie2b (1) 
10  166208  chr6  NT_167247.1  1561942-1728150    5       MIR (2)  L1MC3 (1)  (GGAA)n (1) 
11  164179  chr7  NT_023603.5  31957-196136    2       L1PA2 (4)  ALR/Alpha (1) 
12  152180  chr6  NT_167244.1  2889478-3041658    35  16       L1MC5 (6)  AluY (5)  AluSc (3) 
13  151595  chr9  NT_008470.19  21693226-21844821    3       L2 (2)  MIR3 (1)  L1M5 (1) 
14  134845  chr6  NT_167244.1  1437765-1572610    57  33       L1MA1 (7)  AluY (5)  L4 (3) 
15  121575  chr5  NW_003315917.1  1126680-1248255    51  25       AluJo (9)  AluSx (5)  AluSg (5) 
16  121336  chr6  NT_167247.1  1173489-1294825    4       L2 (3)  ERV3-16A3_I-int (2)  MLT1E2 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   246281       chr6  NT_167244.1  2009529-2255810    FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
4   228684       chr6  NT_167244.1  4377889-4606573    HLA-DPB2  major_histocompatibility_complex,_class_II,_DP_beta_2_(pseudogene)
5   191189       chr6  NT_167244.1  3785039-3976228    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
6   184307       chr6  NT_167244.1  3171816-3356123    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
7   178666       chr6  NT_167247.1  4420283-4598949    LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011