Distribution of restriction sites in the human genome

Enzyme:  PsiI               Longest uncut segments
Specificity:  TTATAA               Repeats in uncut segments
Number of sites:  1637157               Genes in uncut segments
Mean distance between sites:  1747 base pairs
Standard deviation:  2462 base pairs
Site density 572.2 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   487167  chr15  NT_037852.6  1398341-1885508    0.01 % in   1 repeats    0.00 % in 0 genes
2   406088  chr6  NT_167244.1  2355357-2761445    0.89 % in   17 repeats    0.00 % in 0 genes
3   226648  chrY  NT_011875.12  8490264-8716912    77.82 % in   19 repeats    0.00 % in 0 genes
4   209914  chr6  NT_167244.1  4389412-4599326    0.88 % in   11 repeats    0.00 % in 0 genes
5   187831  chr6  NT_167244.1  3786817-3974648    2.22 % in   20 repeats    0.36 % in 1 genes
6   182413  chr6  NT_167247.1  4412792-4595205    2.05 % in   12 repeats    97.63 % in 1 genes
7   180578  chr6  NT_167244.1  3178200-3358778    1.32 % in   13 repeats    2.56 % in 2 genes
8   170379  chr6  NT_167247.1  1561398-1731777    1.56 % in   12 repeats    0.91 % in 1 genes
9   168542  chr6  NT_167249.1  2137740-2306282    1.74 % in   14 repeats    0.00 % in 0 genes
10   167156  chr6  NT_167244.1  2000236-2167392    2.48 % in   22 repeats    0.00 % in 0 genes
11   164909  chr6  NT_167248.1  521106-686015    3.13 % in   2 repeats    0.00 % in 0 genes
12   162105  chr4  NT_006316.16  391102-553207    3.21 % in   55 repeats    0.00 % in 0 genes
13   158613  chr6  NT_167244.1  2890922-3049535    4.02 % in   32 repeats    0.00 % in 0 genes
14   155795  chr9  NT_008470.19  21691636-21847431    1.60 % in   12 repeats    0.00 % in 0 genes
15   140145  chr12  NT_009714.17  27198885-27339030    84.70 % in   127 repeats    0.00 % in 0 genes
16   126297  chr1  NT_004350.19  2049133-2175430    3.61 % in   16 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
487167  chr15  NT_037852.6  1398341-1885508    1       AT_rich (1) 
406088  chr6  NT_167244.1  2355357-2761445    17  10       L1ME4a (3)  AluJb (3)  MLT2D (2) 
226648  chrY  NT_011875.12  8490264-8716912    19  7       LTR12B (12)  L1PA16 (2)  (TATAA)n (1) 
209914  chr6  NT_167244.1  4389412-4599326    11  9       MER57-int (2)  AluSx (2)  (TTCC)n (1) 
187831  chr6  NT_167244.1  3786817-3974648    20  17       MLT1H-int (2)  L2a (2)  AT_rich (2) 
182413  chr6  NT_167247.1  4412792-4595205    12  10       L2b (3)  MIRc (1)  MIRb (1) 
180578  chr6  NT_167244.1  3178200-3358778    13  9       GC_rich (3)  L2c (2)  AluSp (2) 
170379  chr6  NT_167247.1  1561398-1731777    12  10       MIR (2)  L1MEe (2)  MSTB (1) 
168542  chr6  NT_167249.1  2137740-2306282    14  6       Charlie2b (4)  AluSx (4)  L1MB8 (3) 
10  167156  chr6  NT_167244.1  2000236-2167392    22  17       AluSx (4)  FRAM (2)  AluJb (2) 
11  164909  chr6  NT_167248.1  521106-686015    2       L1PREC2 (1)  HERVH-int (1) 
12  162105  chr4  NT_006316.16  391102-553207    55  3       (CA)n (47)  L1M4 (7)  MER5B (1) 
13  158613  chr6  NT_167244.1  2890922-3049535    32  16       L1MC5 (6)  AluY (5)  L2c (3) 
14  155795  chr9  NT_008470.19  21691636-21847431    12  9       MIRb (2)  LTR67B (2)  L2 (2) 
15  140145  chr12  NT_009714.17  27198885-27339030    127  7       GSATII (116)  GSATX (4)  LTR12E (2) 
16  126297  chr1  NT_004350.19  2049133-2175430    16  10       L1MEf (4)  L1MB3 (3)  AluSg (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   187831       chr6  NT_167244.1  3786817-3974648    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor
6   182413       chr6  NT_167247.1  4412792-4595205    LOC100507722  hypothetical_protein_LOC100507722
7   180578       chr6  NT_167244.1  3178200-3358778    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
8   170379       chr6  NT_167247.1  1561398-1731777    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011