Distribution of restriction sites in the human genome

Enzyme:  PpiI               Longest uncut segments
Specificity:  GAACNNNNNCTC               Repeats in uncut segments
Number of sites:  247036               Genes in uncut segments
Mean distance between sites:  11582 base pairs
Standard deviation:  12233 base pairs
Site density 86.3 per megabase               Help


Distribution of closely spaced sites

Distribution of sites within 7 STD distance


Help
Longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeat content Gene content
1   492484  chr15  NT_037852.6  1393977-1886461    0.45 % in   11 repeats    0.00 % in 0 genes
2   414133  chr6  NT_167244.1  2357156-2771289    1.53 % in   26 repeats    0.00 % in 0 genes
3   267434  chr11  NT_009237.18  50327635-50595069    99.79 % in   64 repeats    0.00 % in 0 genes
4   251042  chr6  NT_167244.1  2003693-2254735    1.80 % in   22 repeats    3.47 % in 3 genes
5   227084  chr9  NT_078070.3  923207-1150291    57.78 % in   243 repeats    0.85 % in 1 genes
6   211213  chr5  NT_006576.16  46121633-46332846    99.83 % in   45 repeats    0.00 % in 0 genes
7   202562  chr6  NT_167247.1  1545006-1747568    10.15 % in   88 repeats    9.34 % in 2 genes
8   196576  chr6  NT_167246.1  3050006-3246582    16.68 % in   136 repeats    9.98 % in 3 genes
9   194410  chr6  NT_167244.1  3780353-3974763    3.67 % in   30 repeats    0.00 % in 0 genes
10   193772  chr6  NT_167249.1  2124520-2318292    9.12 % in   74 repeats    0.00 % in 0 genes
11   192101  chr6  NT_167248.1  490215-682316    10.78 % in   36 repeats    0.00 % in 0 genes
12   181412  chr6  NT_167244.1  3179373-3360785    1.68 % in   16 repeats    0.00 % in 0 genes
13   176174  chr6  NT_167247.1  4421825-4597999    1.50 % in   9 repeats    0.00 % in 0 genes
14   169076  chr9  NT_167189.1  893427-1062503    45.50 % in   192 repeats    0.00 % in 0 genes
15   160954  chr6  NT_167244.1  2883265-3044219    7.25 % in   59 repeats    0.00 % in 0 genes
16   160893  chr9  NT_008470.19  21687268-21848161    3.89 % in   20 repeats    0.00 % in 0 genes


Help
Repeats in longest uncut segments
# Length  Chr  Scaffold  Coordinates  Repeats
Total  Distinct    Most  Second  Third 
492484  chr15  NT_037852.6  1393977-1886461    11  9       L1MDa (3)  MIRc (1)  MIRb (1) 
414133  chr6  NT_167244.1  2357156-2771289    26  19       AluY (3)  LTR84b (2)  L4 (2) 
267434  chr11  NT_009237.18  50327635-50595069    64  14       ALR/Alpha (30)  L1PA4 (7)  MER11C (6) 
251042  chr6  NT_167244.1  2003693-2254735    22  15       AluSx (4)  MIRb (2)  MIR (2) 
227084  chr9  NT_078070.3  923207-1150291    243  102       AT_rich (18)  AluSx (15)  AluY (14) 
211213  chr5  NT_006576.16  46121633-46332846    45  9       ALR/Alpha (29)  L1PA4 (4)  L1PA3 (3) 
202562  chr6  NT_167247.1  1545006-1747568    88  47       L1MEf (6)  MIR3 (5)  MIRc (4) 
196576  chr6  NT_167246.1  3050006-3246582    136  52       AluSx (21)  AluY (12)  L2c (7) 
194410  chr6  NT_167244.1  3780353-3974763    30  22       L2a (5)  MLT1H-int (2)  AT_rich (2) 
10  193772  chr6  NT_167249.1  2124520-2318292    74  36       AluSx (9)  Charlie2b (6)  HAL1 (4) 
11  192101  chr6  NT_167248.1  490215-682316    36  30       AT_rich (3)  MER4D (2)  L1PA14 (2) 
12  181412  chr6  NT_167244.1  3179373-3360785    16  8       AluSx (4)  GC_rich (3)  MIRb (2) 
13  176174  chr6  NT_167247.1  4421825-4597999    7       MLT1J (2)  AluSx (2)  (TTAAA)n (1) 
14  169076  chr9  NT_167189.1  893427-1062503    192  87       AT_rich (15)  (CAGGG)n (8)  AluSx (8) 
15  160954  chr6  NT_167244.1  2883265-3044219    59  25       AluY (7)  L1MC5 (6)  AluJo (5) 
16  160893  chr9  NT_008470.19  21687268-21848161    20  13       MIRb (2)  MER5B (2)  LTR67B (2) 


Help
Genes in longest uncut segments
Sgmnt   Length (bp)  Chr  Scaffold  Coordinates  Gene symbol  Gene function 
4   251042       chr6  NT_167244.1  2003693-2254735    LOC100294090  hypothetical_LOC100294090,_transcript_variant_1
FLOT1  flotillin-1
DDR1  epithelial_discoidin_domain-containing_receptor_1_isoform_DDR1c
5   227084       chr9  NT_078070.3  923207-1150291    LOC644684  hypothetical_LOC644684
7   202562       chr6  NT_167247.1  1545006-1747568    LOC100421582  tripartite_motif-containing_protein_26
LOC100507720 
8   196576       chr6  NT_167246.1  3050006-3246582    MSH5  mutS_protein_homolog_5_isoform_c
NEU1  sialidase-1_precursor
C2  complement_C2_isoform_3



Posfai@neb.com
May 11, 2011