Distribution of restriction sites in the human genome

Enzyme:  CspCI               Longest uncut segments
Specificity:  CAANNNNNGTGG               Repeats in uncut segments
Number of sites:  429470               Genes in uncut segments
Mean distance between sites:  6662 base pairs
Standard deviation:  6799 base pairs
Site density 150.1 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   509466  chr15  NT_037852.6  1395530-1904996    1.40 % in   39 repeats    1.96 % in 1 genes
2   409761  chr6  NT_167244.1  2354931-2764692    1.05 % in   20 repeats    0.00 % in 0 genes
3   255915  chrY  NT_011875.12  8413218-8669133    79.39 % in   23 repeats    0.00 % in 0 genes
4   213312  chr6  NT_167244.1  4384757-4598069    1.84 % in   11 repeats    0.00 % in 0 genes
5   198437  chr6  NT_167244.1  3773563-3972000    3.05 % in   29 repeats    6.58 % in 1 genes
6   188920  chr6  NT_167248.1  519250-708170    9.25 % in   37 repeats    1.78 % in 2 genes
7   184426  chr6  NT_167247.1  1557893-1742319    7.25 % in   48 repeats    2.74 % in 1 genes
8   182361  chr6  NT_167244.1  3176922-3359283    2.00 % in   27 repeats    3.51 % in 2 genes
9   175320  chr6  NT_167247.1  4420550-4595870    1.07 % in   9 repeats    0.00 % in 0 genes
10   172104  chr6  NT_167244.1  1996437-2168541    3.33 % in   28 repeats    0.00 % in 0 genes
11   168740  chr6  NT_167249.1  2134821-2303561    1.44 % in   12 repeats    0.00 % in 0 genes
12   165990  chr4  NT_006316.16  389440-555430    4.83 % in   62 repeats    0.00 % in 0 genes
13   158827  chr6  NT_167244.1  2894006-3052833    3.06 % in   28 repeats    0.00 % in 0 genes
14   154502  chr9  NT_008470.19  21692328-21846830    1.09 % in   9 repeats    0.00 % in 0 genes
15   132157  chr1  NT_077389.3  258917-391074    97.17 % in   65 repeats    0.00 % in 0 genes
16   128863  chr1  NT_004350.19  2045875-2174738    4.61 % in   19 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
509466  chr15  NT_037852.6  1395530-1904996    39  26       AT_rich (5)  (TA)n (3)  L2a (3) 
409761  chr6  NT_167244.1  2354931-2764692    20  13       L1ME4a (3)  AluJb (3)  MLT2D (2) 
255915  chrY  NT_011875.12  8413218-8669133    23  7       LTR12B (13)  L1PA7 (3)  LTR12D (2) 
213312  chr6  NT_167244.1  4384757-4598069    11  8       MER57-int (3)  AluY (2)  (TTTTA)n (1) 
198437  chr6  NT_167244.1  3773563-3972000    29  20       MIR (3)  L2a (3)  AT_rich (3) 
188920  chr6  NT_167248.1  519250-708170    37  24       AT_rich (6)  L2c (3)  L2b (3) 
184426  chr6  NT_167247.1  1557893-1742319    48  30       L1PB2 (4)  L1MEf (4)  Tigger7 (2) 
182361  chr6  NT_167244.1  3176922-3359283    27  17       AluSx (5)  GC_rich (3)  MER44B (2) 
175320  chr6  NT_167247.1  4420550-4595870    9       (TTAAA)n (1)  MIR (1)  MER11A (1) 
10  172104  chr6  NT_167244.1  1996437-2168541    28  20       AluSx (4)  MIR (2)  FRAM (2) 
11  168740  chr6  NT_167249.1  2134821-2303561    12  9       MLT1A (2)  AluSx (2)  AluJb (2) 
12  165990  chr4  NT_006316.16  389440-555430    62  9       (CA)n (47)  L1M4 (7)  L1PA10 (2) 
13  158827  chr6  NT_167244.1  2894006-3052833    28  15       L1MC5 (6)  AluSc (4)  L2c (3) 
14  154502  chr9  NT_008470.19  21692328-21846830    7       LTR67B (2)  L2 (2)  MIRb (1) 
15  132157  chr1  NT_077389.3  258917-391074    65  12       ALR/Alpha (52)  MLT1J (2)  L1MB1 (2) 
16  128863  chr1  NT_004350.19  2045875-2174738    19  13       L1MEf (4)  MER4A1 (2)  LTR27 (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   509466       chr15  NT_037852.6  1395530-1904996    LOC100418897 
5   198437       chr6  NT_167244.1  3773563-3972000    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
6   188920       chr6  NT_167248.1  519250-708170    OR12D1P 
OR11A1  olfactory_receptor_11A1
7   184426       chr6  NT_167247.1  1557893-1742319    LOC100421582  tripartite_motif-containing_protein_26
8   182361       chr6  NT_167244.1  3176922-3359283    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor



Posfai@neb.com
May 11, 2011