Distribution of restriction sites in the human genome

Enzyme:  AspCNI               Longest uncut segments
Specificity:  GCCGC               Repeats in uncut segments
Number of sites:  897333               Genes in uncut segments
Mean distance between sites:  3188 base pairs
Standard deviation:  6458 base pairs
Site density 313.6 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   506322  chr15  NT_037852.6  1396899-1903221    1.26 % in   35 repeats    1.97 % in 1 genes
2   408532  chr6  NT_167244.1  2354827-2763359    0.94 % in   18 repeats    0.00 % in 0 genes
3   217166  chr6  NT_167244.1  4381397-4598563    2.25 % in   15 repeats    1.04 % in 1 genes
4   187944  chr6  NT_167244.1  3788247-3976191    2.59 % in   22 repeats    0.00 % in 0 genes
5   183002  chr6  NT_167247.1  1562936-1745938    6.38 % in   42 repeats    0.01 % in 1 genes
6   182124  chr6  NT_167249.1  2134963-2317087    6.36 % in   50 repeats    0.00 % in 0 genes
7   181536  chr7  NT_077528.2  60209-241745    72.25 % in   37 repeats    0.00 % in 0 genes
8   175997  chr6  NT_167244.1  3180302-3356299    0.18 % in   2 repeats    0.07 % in 1 genes
9   172732  chr6  NT_167247.1  4421692-4594424    0.10 % in   2 repeats    0.00 % in 0 genes
10   172543  chr6  NT_007299.13  182144-354687    52.46 % in   109 repeats    0.00 % in 0 genes
11   161236  chr6  NT_167248.1  520121-681357    1.19 % in   2 repeats    0.00 % in 0 genes
12   155620  chr9  NT_008470.19  21692258-21847878    1.46 % in   11 repeats    0.00 % in 0 genes
13   154648  chr6  NT_167244.1  2886078-3040726    6.00 % in   49 repeats    0.00 % in 0 genes
14   145459  chr5  NT_023133.13  9663566-9809025    54.60 % in   281 repeats    0.00 % in 0 genes
15   140181  chr6  NT_025741.15  8600444-8740625    50.13 % in   203 repeats    0.00 % in 0 genes
16   137037  chr1  NT_004487.19  42946741-43083778    47.67 % in   247 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
506322  chr15  NT_037852.6  1396899-1903221    35  23       AT_rich (5)  (TA)n (3)  L2a (3) 
408532  chr6  NT_167244.1  2354827-2763359    18  11       L1ME4a (3)  AluJb (3)  MLT2D (2) 
217166  chr6  NT_167244.1  4381397-4598563    15  11       MER57-int (3)  AluY (2)  AluSx (2) 
187944  chr6  NT_167244.1  3788247-3976191    22  18       L2a (3)  MLT1H-int (2)  AT_rich (2) 
183002  chr6  NT_167247.1  1562936-1745938    42  24       L1MEf (6)  L1PB2 (4)  MSTB (2) 
182124  chr6  NT_167249.1  2134963-2317087    50  28       Charlie2b (6)  AluSx (6)  L1MB8 (3) 
181536  chr7  NT_077528.2  60209-241745    37  6       ALR/Alpha (21)  L1PA4 (5)  L1P1 (4) 
175997  chr6  NT_167244.1  3180302-3356299    2       Charlie4a (1)  AluSp (1) 
172732  chr6  NT_167247.1  4421692-4594424    2       MER11A (1)  AluSc (1) 
10  172543  chr6  NT_007299.13  182144-354687    109  54       ALR/Alpha (16)  AT_rich (11)  L1PA3 (6) 
11  161236  chr6  NT_167248.1  520121-681357    2       L1PREC2 (1)  HERVH-int (1) 
12  155620  chr9  NT_008470.19  21692258-21847878    11  8       MIRb (2)  LTR67B (2)  L2 (2) 
13  154648  chr6  NT_167244.1  2886078-3040726    49  22       L1MC5 (6)  AluY (6)  AluSx (4) 
14  145459  chr5  NT_023133.13  9663566-9809025    281  95       MIRb (19)  AT_rich (18)  L2a (12) 
15  140181  chr6  NT_025741.15  8600444-8740625    203  88       AT_rich (20)  (TA)n (9)  MIRb (8) 
16  137037  chr1  NT_004487.19  42946741-43083778    247  116       AT_rich (28)  L2a (11)  L2 (9) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   506322       chr15  NT_037852.6  1396899-1903221    LOC100418897 
3   217166       chr6  NT_167244.1  4381397-4598563    HLA-DPB2  major_histocompatibility_complex,_class_II,_DP_beta_2_(pseudogene)
5   183002       chr6  NT_167247.1  1562936-1745938    LOC100421582  tripartite_motif-containing_protein_26
8   175997       chr6  NT_167244.1  3180302-3356299    TNXB  tenascin-X_isoform_1_precursor



Posfai@neb.com
May 11, 2011