Distribution of restriction sites in the human genome

Enzyme:  SapI               Longest uncut segments
Specificity:  GCTCTTC               Repeats in uncut segments
Number of sites:  373304               Genes in uncut segments
Mean distance between sites:  7664 base pairs
Standard deviation:  8282 base pairs
Site density 130.5 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   497976  chr15  NT_037852.6  1396296-1894272    1.06 % in   23 repeats    0.24 % in 1 genes
2   412948  chr6  NT_167244.1  2349804-2762752    1.71 % in   33 repeats    0.00 % in 0 genes
3   317234  chrY  NT_011875.12  8415597-8732831    83.02 % in   68 repeats    0.25 % in 1 genes
4   263468  chr6  NT_167244.1  2003608-2267076    4.13 % in   51 repeats    4.84 % in 4 genes
5   246212  chr7  NT_077528.2  37698-283910    79.50 % in   47 repeats    0.00 % in 0 genes
6   195500  chr7  NT_023603.5  1-195501    93.98 % in   60 repeats    0.00 % in 0 genes
7   193991  chr6  NT_167244.1  3163980-3357971    4.74 % in   55 repeats    9.30 % in 2 genes
8   186998  chr6  NT_167244.1  3783644-3970642    1.74 % in   14 repeats    2.06 % in 1 genes
9   179328  chr6  NT_167246.1  3051658-3230986    13.42 % in   100 repeats    0.00 % in 0 genes
10   174691  chr6  NT_167247.1  4421539-4596230    0.97 % in   6 repeats    0.00 % in 0 genes
11   171321  chrX  NT_011630.14  5705236-5876557    99.42 % in   78 repeats    0.00 % in 0 genes
12   171034  chr6  NT_167248.1  519530-690564    4.17 % in   7 repeats    0.00 % in 0 genes
13   168067  chr6  NT_167249.1  2134982-2303049    1.25 % in   9 repeats    0.00 % in 0 genes
14   167871  chr6  NT_167247.1  1559995-1727866    1.31 % in   10 repeats    0.00 % in 0 genes
15   160297  chr9  NT_008470.19  21684133-21844430    4.16 % in   21 repeats    0.00 % in 0 genes
16   155307  chr6  NT_167244.1  2886454-3041761    5.82 % in   48 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
497976  chr15  NT_037852.6  1396296-1894272    23  18       L2a (3)  MER44C (2)  L1M5 (2) 
412948  chr6  NT_167244.1  2349804-2762752    33  23       AluJb (4)  L1ME4a (3)  AluSx (3) 
317234  chrY  NT_011875.12  8415597-8732831    68  29       LTR12B (17)  L1PA16 (7)  L1ME3A (6) 
263468  chr6  NT_167244.1  2003608-2267076    51  28       AluSx (7)  MIR (5)  MIRb (3) 
246212  chr7  NT_077528.2  37698-283910    47  7       ALR/Alpha (29)  L1PA4 (5)  L1P1 (4) 
195500  chr7  NT_023603.5  1-195501    60  34       AT_rich (8)  L1PA2 (4)  (TA)n (3) 
193991  chr6  NT_167244.1  3163980-3357971    55  30       L1MC5 (6)  AluSx (6)  L1MB3 (4) 
186998  chr6  NT_167244.1  3783644-3970642    14  10       L2a (3)  AT_rich (2)  AluJb (2) 
179328  chr6  NT_167246.1  3051658-3230986    100  40       AluSx (15)  AluY (10)  AluJb (7) 
10  174691  chr6  NT_167247.1  4421539-4596230    6       (TTAAA)n (1)  MLT1J (1)  MER11A (1) 
11  171321  chrX  NT_011630.14  5705236-5876557    78  20       ALR/Alpha (21)  HSAT4 (20)  GSATX (13) 
12  171034  chr6  NT_167248.1  519530-690564    4       AT_rich (4)  L1PREC2 (1)  HERVH-int (1) 
13  168067  chr6  NT_167249.1  2134982-2303049    7       MLT1A (2)  AluJb (2)  MamGypLTR1b (1) 
14  167871  chr6  NT_167247.1  1559995-1727866    10  8       Tigger7 (2)  MIR (2)  MIRc (1) 
15  160297  chr9  NT_008470.19  21684133-21844430    21  14       L1M5 (3)  MER5B (2)  LTR67B (2) 
16  155307  chr6  NT_167244.1  2886454-3041761    48  22       L1MC5 (6)  AluY (6)  AluSx (4) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
1   497976       chr15  NT_037852.6  1396296-1894272    LOC100418897 
3   317234       chrY  NT_011875.12  8415597-8732831    ZNF884P 
4   263468       chr6  NT_167244.1  2003608-2267076    LOC100294090  hypothetical_LOC100294090,_transcript_variant_1
FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
MUC21  mucin-21_precursor
7   193991       chr6  NT_167244.1  3163980-3357971    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
TNXB  tenascin-X_isoform_1_precursor
8   186998       chr6  NT_167244.1  3783644-3970642    HLA-DRB3  major_histocompatibility_complex,_class_II,_DR_beta_3_precursor



Posfai@neb.com
May 11, 2011