Distribution of restriction sites in the human genome

Enzyme:  DraRI               Longest uncut segments
Specificity:  CAAGNAC               Repeats in uncut segments
Number of sites:  1250002               Genes in uncut segments
Mean distance between sites:  2289 base pairs
Standard deviation:  2385 base pairs
Site density 436.9 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   489583  chr15  NT_037852.6  1395796-1885379    0.24 % in   7 repeats    0.00 % in 0 genes
2   404556  chr6  NT_167244.1  2358662-2763218    0.30 % in   5 repeats    0.00 % in 0 genes
3   218784  chr6  NT_167244.1  4381228-4600012    2.57 % in   19 repeats    1.11 % in 1 genes
4   186187  chr6  NT_167244.1  3787705-3973892    1.87 % in   18 repeats    0.00 % in 0 genes
5   177671  chr6  NT_167244.1  3178657-3356328    0.29 % in   7 repeats    0.96 % in 2 genes
6   174644  chr6  NT_167247.1  4421773-4596417    1.07 % in   6 repeats    100.00 % in 1 genes
7   172802  chr6  NT_167247.1  1557893-1730695    2.66 % in   21 repeats    2.93 % in 1 genes
8   168210  chr6  NT_167249.1  2135063-2303273    1.25 % in   9 repeats    0.00 % in 0 genes
9   167698  chr6  NT_167248.1  518752-686450    4.48 % in   2 repeats    0.00 % in 0 genes
10   162759  chr7  NT_023603.5  32667-195426    100.00 % in   5 repeats    0.00 % in 0 genes
11   157775  chr6  NT_167244.1  2009145-2166920    0.22 % in   3 repeats    0.00 % in 0 genes
12   154269  chr9  NT_008470.19  21689997-21844266    1.63 % in   8 repeats    0.00 % in 0 genes
13   149524  chr6  NT_167244.1  2892950-3042474    2.42 % in   22 repeats    0.00 % in 0 genes
14   124600  chr6  NT_167244.1  583589-708189    9.43 % in   41 repeats    0.00 % in 0 genes
15   120839  chr6  NT_167246.1  3254646-3375485    0.79 % in   5 repeats    0.00 % in 0 genes
16   118653  chr6  NT_167247.1  1174436-1293089    2.61 % in   5 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
489583  chr15  NT_037852.6  1395796-1885379    7       MIRc (1)  MIRb (1)  L1M3 (1) 
404556  chr6  NT_167244.1  2358662-2763218    4       AluJb (2)  L4 (1)  L1MEg (1) 
218784  chr6  NT_167244.1  4381228-4600012    19  14       MER57-int (3)  AluSx (3)  AluY (2) 
186187  chr6  NT_167244.1  3787705-3973892    18  15       MLT1H-int (2)  L2a (2)  AT_rich (2) 
177671  chr6  NT_167244.1  3178657-3356328    5       GC_rich (3)  L2a (1)  Charlie4a (1) 
174644  chr6  NT_167247.1  4421773-4596417    6       (TTAAA)n (1)  MLT1J (1)  MER11A (1) 
172802  chr6  NT_167247.1  1557893-1730695    21  17       Tigger7 (2)  MSTD (2)  MIR (2) 
168210  chr6  NT_167249.1  2135063-2303273    7       MLT1A (2)  AluJb (2)  MamGypLTR1b (1) 
167698  chr6  NT_167248.1  518752-686450    2       L1PREC2 (1)  HERVH-int (1) 
10  162759  chr7  NT_023603.5  32667-195426    2       L1PA2 (4)  ALR/Alpha (1) 
11  157775  chr6  NT_167244.1  2009145-2166920    3       MIRb (1)  MER5A1 (1)  L1MC4a (1) 
12  154269  chr9  NT_008470.19  21689997-21844266    6       LTR67B (2)  L1M4b (2)  MSTA (1) 
13  149524  chr6  NT_167244.1  2892950-3042474    22  11       L1MC5 (6)  AluY (3)  AluSc (3) 
14  124600  chr6  NT_167244.1  583589-708189    41  28       L2c (3)  L2b (3)  L1MA9 (3) 
15  120839  chr6  NT_167246.1  3254646-3375485    3       MIRb (2)  AluSx (2)  MIR3 (1) 
16  118653  chr6  NT_167247.1  1174436-1293089    3       L2 (2)  ERV3-16A3_I-int (2)  LTR16B2 (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   218784       chr6  NT_167244.1  4381228-4600012    HLA-DPB2  major_histocompatibility_complex,_class_II,_DP_beta_2_(pseudogene)
5   177671       chr6  NT_167244.1  3178657-3356328    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
6   174644       chr6  NT_167247.1  4421773-4596417    LOC100507722  hypothetical_protein_LOC100507722
7   172802       chr6  NT_167247.1  1557893-1730695    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011