Distribution of restriction sites in the human genome

Enzyme:  SfaNI               Longest uncut segments
Specificity:  GCATC               Repeats in uncut segments
Number of sites:  3600418               Genes in uncut segments
Mean distance between sites:  794 base pairs
Standard deviation:  870 base pairs
Site density1258.3 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   487205  chr15  NT_037852.6  1398427-1885632    0.01 % in   1 repeats    0.00 % in 0 genes
2   405470  chr6  NT_167244.1  2358068-2763538    0.43 % in   8 repeats    0.00 % in 0 genes
3   212422  chr6  NT_167244.1  4387189-4599611    1.91 % in   13 repeats    0.00 % in 0 genes
4   181605  chr6  NT_167244.1  3790276-3971881    0.71 % in   6 repeats    0.00 % in 0 genes
5   175872  chr6  NT_167244.1  3179736-3355608    0.25 % in   6 repeats    0.28 % in 1 genes
6   175089  chr6  NT_167247.1  4421385-4596474    1.12 % in   7 repeats    100.00 % in 1 genes
7   166507  chr6  NT_167249.1  2138023-2304530    0.66 % in   7 repeats    0.00 % in 0 genes
8   165172  chr6  NT_167247.1  1561817-1726989    0.24 % in   2 repeats    0.69 % in 1 genes
9   160073  chr6  NT_167248.1  521649-681722    0.48 % in   2 repeats    0.00 % in 0 genes
10   152761  chr9  NT_008470.19  21692309-21845070    0.71 % in   6 repeats    0.00 % in 0 genes
11   144460  chr6  NT_167244.1  2893853-3038313    0.84 % in   7 repeats    0.00 % in 0 genes
12   117571  chr6  NT_167245.1  2606226-2723797    0.06 % in   2 repeats    0.00 % in 0 genes
13   116331  chr6  NT_167247.1  1177439-1293770    0.19 % in   1 repeats    0.00 % in 0 genes
14   114683  chr6  NT_167246.1  3261007-3375690    0.41 % in   3 repeats    0.00 % in 0 genes
15   109749  chr6  NT_167245.1  136754-246503    1.68 % in   3 repeats    0.00 % in 0 genes
16   106029  chr6  NT_167244.1  587269-693298    0.96 % in   5 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
487205  chr15  NT_037852.6  1398427-1885632    1       AT_rich (1) 
405470  chr6  NT_167244.1  2358068-2763538    6       L4 (2)  AluJb (2)  L1MEg (1) 
212422  chr6  NT_167244.1  4387189-4599611    13  10       MER57-int (3)  AluSx (2)  (TTTTA)n (1) 
181605  chr6  NT_167244.1  3790276-3971881    5       MLT1H-int (2)  MER52D (1)  LTR19B (1) 
175872  chr6  NT_167244.1  3179736-3355608    4       GC_rich (3)  Charlie4a (1)  (CCG)n (1) 
175089  chr6  NT_167247.1  4421385-4596474    7       (TTAAA)n (1)  MLT1J (1)  MIR (1) 
166507  chr6  NT_167249.1  2138023-2304530    3       L1MB8 (3)  AluSx (3)  AT_rich (1) 
165172  chr6  NT_167247.1  1561817-1726989    2       L1MC3 (1)  A-rich (1) 
160073  chr6  NT_167248.1  521649-681722    2       L1PREC2 (1)  HERVH-int (1) 
10  152761  chr9  NT_008470.19  21692309-21845070    4       LTR67B (2)  L2 (2)  MIR3 (1) 
11  144460  chr6  NT_167244.1  2893853-3038313    6       AluJo (2)  L1MC5 (1)  AluY (1) 
12  117571  chr6  NT_167245.1  2606226-2723797    2       L2a (1)  L2 (1) 
13  116331  chr6  NT_167247.1  1177439-1293770    1       ERV3-16A3_I-int (1) 
14  114683  chr6  NT_167246.1  3261007-3375690    2       MIRb (2)  AluSx (1) 
15  109749  chr6  NT_167245.1  136754-246503    3       MLT1F (1)  MLT1E2 (1)  LTR12C (1) 
16  106029  chr6  NT_167244.1  587269-693298    5       MER77 (1)  L1PB1 (1)  L1ME3D (1) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
5   175872       chr6  NT_167244.1  3179736-3355608    EHMT2  histone-lysine_N-methyltransferase,_H3_lysine-9_specific_3_isoform_b
6   175089       chr6  NT_167247.1  4421385-4596474    LOC100507722  hypothetical_protein_LOC100507722
8   165172       chr6  NT_167247.1  1561817-1726989    LOC100421582  tripartite_motif-containing_protein_26



Posfai@neb.com
May 11, 2011