Distribution of restriction sites in the human genome

Enzyme:  HgiGI               Longest uncut segments
Specificity:  GRCGYC               Repeats in uncut segments
Number of sites:  457481               Genes in uncut segments
Mean distance between sites:  6254 base pairs
Standard deviation:  9605 base pairs
Site density 159.9 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   494438  chr15  NT_037852.6  1397157-1891595    0.82 % in   18 repeats    0.00 % in 0 genes
2   411005  chr6  NT_167244.1  2357670-2768675    1.25 % in   21 repeats    0.00 % in 0 genes
3   319218  chrY  NT_011875.12  8412519-8731737    82.55 % in   71 repeats    0.25 % in 1 genes
4   238966  chr8  NT_008046.16  3045071-3284037    55.29 % in   333 repeats    0.00 % in 0 genes
5   217544  chr6  NT_167244.1  4385013-4602557    3.37 % in   20 repeats    0.00 % in 0 genes
6   198098  chr6  NT_167247.1  1548586-1746684    9.98 % in   82 repeats    7.29 % in 2 genes
7   195641  chr6  NT_167248.1  504051-699692    13.86 % in   42 repeats    1.72 % in 2 genes
8   187721  chr6  NT_167247.1  4410770-4598491    3.29 % in   24 repeats    97.09 % in 2 genes
9   186551  chr7  NT_023603.5  10259-196810    96.07 % in   35 repeats    0.00 % in 0 genes
10   183131  chr6  NT_167244.1  3788050-3971181    0.76 % in   8 repeats    0.00 % in 0 genes
11   177337  chr6  NT_167244.1  3179938-3357275    0.55 % in   8 repeats    0.00 % in 0 genes
12   176893  chr3  NT_005612.16  14625027-14801920    40.70 % in   306 repeats    0.00 % in 0 genes
13   176707  chr6  NT_167249.1  2129852-2306559    4.86 % in   38 repeats    0.00 % in 0 genes
14   163103  chr5  NT_006576.16  45924614-46087717    98.93 % in   46 repeats    0.00 % in 0 genes
15   161972  chr6  NT_025741.15  45724384-45886356    60.25 % in   270 repeats    0.00 % in 0 genes
16   161930  chr6  NT_167244.1  2002805-2164735    1.75 % in   14 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
494438  chr15  NT_037852.6  1397157-1891595    18  15       L2a (3)  L1M5 (2)  U2 (1) 
411005  chr6  NT_167244.1  2357670-2768675    21  15       AluY (3)  LTR84b (2)  L4 (2) 
319218  chrY  NT_011875.12  8412519-8731737    71  31       LTR12B (17)  L1PA16 (7)  L1ME3A (6) 
238966  chr8  NT_008046.16  3045071-3284037    333  134       AT_rich (35)  L2a (18)  L2c (12) 
217544  chr6  NT_167244.1  4385013-4602557    20  13       MER57-int (3)  AluSx (3)  HERVH-int (2) 
198098  chr6  NT_167247.1  1548586-1746684    82  46       L1MEf (6)  MIR3 (4)  L1PB2 (4) 
195641  chr6  NT_167248.1  504051-699692    42  32       AT_rich (5)  L1MA9 (3)  MER4D (2) 
187721  chr6  NT_167247.1  4410770-4598491    24  18       L2b (3)  AluSx (3)  MLT1J (2) 
186551  chr7  NT_023603.5  10259-196810    35  20       AT_rich (7)  L1PA2 (4)  ALR/Alpha (3) 
10  183131  chr6  NT_167244.1  3788050-3971181    7       AT_rich (2)  MLT1H-int (1)  MIR (1) 
11  177337  chr6  NT_167244.1  3179938-3357275    6       GC_rich (2)  AluSp (2)  L2c (1) 
12  176893  chr3  NT_005612.16  14625027-14801920    306  121       AT_rich (25)  MIRb (16)  AluSx (15) 
13  176707  chr6  NT_167249.1  2129852-2306559    38  19       AluSx (6)  Charlie2b (4)  MamGypLTR1b (3) 
14  163103  chr5  NT_006576.16  45924614-46087717    46  12       ALR/Alpha (25)  L1PA3 (5)  L1PA2 (3) 
15  161972  chr6  NT_025741.15  45724384-45886356    270  112       AT_rich (41)  (TA)n (9)  L1ME1 (8) 
16  161930  chr6  NT_167244.1  2002805-2164735    14  9       AluSx (4)  FRAM (2)  AluJb (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
3   319218       chrY  NT_011875.12  8412519-8731737    ZNF884P 
6   198098       chr6  NT_167247.1  1548586-1746684    LOC100421582  tripartite_motif-containing_protein_26
LOC100507720 
7   195641       chr6  NT_167248.1  504051-699692    OR12D1P 
OR11A1  olfactory_receptor_11A1
8   187721       chr6  NT_167247.1  4410770-4598491    COL11A2P 
LOC100507722  hypothetical_protein_LOC100507722



Posfai@neb.com
May 11, 2011