Expected fragment lengths in PROTOZOA

    For prototype restriction enzymes, recognition sites are counted, and the count is divided by genome length.
    Expected fragment lengths are listed in base pair units, while genome sizes in million base pair units.
    More on restriction enzymes in REBASE. For more detail contact me at New England Biolabs Posfai@neb.com.


        
  Enzyme     Specificity  
   Cryptosporidium
parvum
   Dictyostelium
discoideum
   Leishmania
major
   Plasmodium
falciparum
   Theileria
parva
   Trypanosoma
brucei
      9.1 M bp 34.0 M bp 32.8 M bp 23.3 M bp 4.6 M bp 26.1 M bp
 
  AclI   AACGTT   9250    8090    9828    6265    3957    4033  
  HindIII   AAGCTT   1823    7831    9093    7092    3743    4667  
  SspI   AATATT   387    377    34471    273    641    2117  
  MluCI   AATT   59    45    1735    65    72    237  
  PciI   ACATGT   5105    6090    4559    2525    3458    3329  
  AgeI   ACCGGT   15720    39096    6395    96959    15587    6478  
  BspMI   ACCTGC   7746    7132    1290    14635    4796    2196  
  SexAI   ACCWGGT   21569    9654    14042    43906    9194    15098  
  MluI   ACGCGT   75225    354308    2585    136083    32744    5758  
  BceAI   ACGGC   6154    12869    267    14672    2065    566  
  MaeII   ACGT   1119    1392    272    883    503    323  
  HpyCH4III   ACNGT   682    960    350    1146    306    268  
  AflIII   ACRYGT   2952    4227    784    1878    1830    1031  
  SpeI   ACTAGT   5550    9575    30842    11491    3667    11119  
  BsrI   ACTGG   963    1322    731    3931    560    637  
  BfiI   ACTGGG   6307    22072    3534    28979    2992    3029  
  BglII   AGATCT   2742    6426    11438    9026    5431    10864  
  AfeI   AGCGCT   26537    125976    2326    144536    17573    4601  
  AluI   AGCT   288    971    245    914    391    333  
  StuI   AGGCCT   14379    109368    6087    56895    7888    10430  
  ScaI   AGTACT   4139    8094    8963    7463    3165    6603  
  ClaI   ATCGAT   6916    3943    6952    8761    6330    7028  
  TspDTI   ATGAA   179    172    729    134    241    322  
  AvaIII   ATGCAT   2409    5279    4727    2821    7002    3330  
  AseI   ATTAAT   477    353    80040    455    761    4112  
  SwaI   ATTTAAAT   4194    1774    1312671    2720    5007    40616  
  MfeI   CAATTG   2214    1187    31524    7560    2934    4457  
  BssSI   CACGAG   15170    22001    1196    36531    6980    2426  
  BmgBIA   CACGTC   16732    28800    1196    25404    6234    2649  
  PmlI   CACGTG   35417    25009    2041    36190    16857    3539  
  PvuII   CAGCTG   9111    15252    1382    26264    6012    2927  
  BtsIMutIA   CAGTG   1621    1968    376    3717    600    397  
  TspRI   CASTG   1621    1968    376    3717    600    397  
  NdeI   CATATG   4620    4512    10023    1762    4878    3655  
  CviAII FatI NlaIII   CATG   413    696    228    448    417    260  
  BspNCI   CCAGA   619    1192    711    2482    543    846  
  BccI   CCATC   757    643    363    1523    763    469  
  NcoI   CCATGG   11033    14648    4333    24572    8397    5241  
  BseYIA   CCCAGC   10771    37667    1581    56481    6634    3014  
  FauI   CCCGC   4653    33087    312    34992    4602    673  
  SmaI XmaI   CCCGGG   128201    336768    8554    684420    32052    12399  
  BscGI   CCCGT   6268    21021    581    12404    1961    755  
  AciI   CCGC   1151    3369    58    4920    787    131  
  SacII   CCGCGG   325083    1259762    1859    802424    82754    5321  
  BsrBI   CCGCTC   20593    61065    942    111341    11238    2166  
  HpaII   CCGG   2646    9180    277    10808    1318    493  
  ScrFI SsoII   CCNGG   1382    2981    361    5483    708    589  
  BtgI   CCRYGG   8274    11909    667    19311    4269    1246  
 
             Cryptosporidium
parvum
   Dictyostelium
discoideum
   Leishmania
major
   Plasmodium
falciparum
   Theileria
parva
   Trypanosoma
brucei
 
  BcnI   CCSGG   10215    36811    766    39109    3288    1286  
  AvrII   CCTAGG   39065    163526    29942    46540    14922    32553  
  MnlI   CCTC   244    517    65    599    181    104  
  BbvCIA   CCTCAGC   25354    101837    3693    116351    12893    5802  
  SbfI   CCTGCAGG   337123    971816    29779    2327030    227574    65352  
  Bpu10IA   CCTNAGC   6843    41429    2181    23017    4020    2824  
  Bsu36I   CCTNAGG   18963    88118    10938    27280    5918    7183  
  Hin4II   CCTTC   665    1348    276    1162    574    299  
  BstNI EcoRII   CCWGG   1598    3243    684    6377    903    1089  
  StyI   CCWWGG   2940    5968    1384    7406    1947    1816  
  PvuI   CGATCG   57976    64419    4197    108233    42938    10253  
  FnuDII   CGCG   5434    27320    114    18294    3603    364  
  EagI   CGGCCG   379263    409802    1992    775676    61506    6881  
  RsrII   CGGWCCG   535430    872143    12501    2908788    119776    22556  
  BsiEI   CGRYCG   31495    36184    748    61399    13876    1993  
  BsiWI   CGTACG   130033    216647    3596    73873    26931    6112  
  Esp3I   CGTCTC   10192    37709    1013    31110    7294    2543  
  Hpy99I   CGWCG   9481    11111    221    10758    2099    675  
  MspA1I   CMGCKG   6752    9893    346    18751    3485    806  
  SgrAI   CRCCGGYG   159689    548606    3242    802424    79850    16185  
  BfaIA   CTAG   540    1695    1061    1331    516    875  
  XhoI   CTCGAG   17437    74591    2843    109765    10025    7022  
  CatHI   CTCTTC   1224    2389    716    2641    1550    960  
  PstI   CTGCAG   8677    28703    1252    38654    7860    2203  
  DdeI   CTNAG   429    2020    475    1141    315    426  
  SfeI   CTRYAG   1873    4331    893    3713    1395    1135  
  AflII   CTTAAG   4403    25383    31985    6710    5108    8328  
  SmlI   CTYRAG   1236    3562    1248    3833    1176    1442  
  AvaI   CYCGRG   10024    40015    1205    55142    4013    2229  
  MboII   GAAGA   217    370    273    299    310    272  
  BbsIA   GAAGAC   2832    9060    1294    5052    2562    1967  
  BsmI   GAATGC   2600    6191    2379    7508    4368    1901  
  EcoRI   GAATTC   1897    3573    13307    5840    3094    5288  
  HgaI   GACGC   5735    19260    253    15003    2629    676  
  AatII ZraI   GACGTC   46204    111886    2959    72044    13709    7247  
  SacI   GAGCTC   7942    55216    2825    52767    10609    5943  
  MlyI PleI   GAGTC   1124    3586    668    6594    778    873  
  HinfI   GANTC   281    453    425    900    267    404  
  BstSEI   GASTC   1124    3586    668    6594    778    873  
  EcoRV   GATATC   4181    4274    9953    6255    4003    5345  
  BspKT6I MboI   GATC   361    494    426    808    433    489  
  TfiI   GAWTC   375    519    1171    1043    407    755  
  BsrDIB   GCAATG   2700    4191    2007    10914    4115    1586  
  BbvI R1.BceSIV   GCAGC   1536    2578    121    5064    1847    302  
  PenI   GCAGT   1208    2156    373    4445    920    404  
  BtsIA   GCAGTG   8178    12606    872    31617    4440    1252  
  BscAI SfaNI   GCATC   1036    1544    307    2356    1329    459  
  SphI   GCATGC   4672    62755    1895    26323    28270    3935  
 
             Cryptosporidium
parvum
   Dictyostelium
discoideum
   Leishmania
major
   Plasmodium
falciparum
   Theileria
parva
   Trypanosoma
brucei
 
  NaeI   GCCGGC   76490    523286    1503    861863    51721    6561  
  AsiSI   GCGATCGC   1300332    3092144    33114    11635152    1137873    120719  
  HhaI HinP1I   GCGC   1856    10288    91    10477    2225    291  
  McaTI NmeM395I   GCGCGC   29457    680271    892    528870    182059    5426  
  NotI   GCGGCCGC   3034108    11337863    9362    3878384    4551493    48467  
  BthCI Fnu4HI   GCNGC   1261    2189    65    4307    1309    179  
  AspCNI   GCSGC   7050    14523    142    28835    4493    443  
  NheI   GCTAGC   22927    146610    7387    26117    42537    10290  
  SapI   GCTCTTC   7585    42200    2884    28907    12469    5248  
  BlpI   GCTNAGC   15045    122792    2906    96557    16733    6022  
  TseI   GCWGC   1536    2578    121    5064    1847    302  
  Bsp1286I   GDGCHC   2491    5869    293    5681    1780    583  
  AlwI   GGATC   884    1396    1007    2429    882    909  
  BamHI   GGATCC   10733    23265    10997    28764    7675    7083  
  FokI StsI   GGATG   751    1285    412    1307    754    465  
  HaeIII   GGCC   1523    4514    229    7101    912    479  
        0    0    0    0    0    0  
  KasI NarI   GGCGCC   7720    185866    1483    261464    30753    5368  
  AscI   GGCGCGCC   700178    11337863    16760    23270305    1137873    99524  
  EciI   GGCGGA   12929    62068    955    58615    9012    2169  
  ApaI   GGGCCC   53859    263671    5695    177635    42537    9319  
  Eco47II   GGNCC   1749    3013    349    3231    902    526  
  KpnI   GGTACC   10308    13860    7892    23600    8702    6551  
  Eco31I   GGTCTC   8828    15747    2726    25942    6044    3958  
  HphI   GGTGA   1136    518    368    1665    642    410  
  BstEII   GGTNACC   28896    17587    6446    36190    12040    6643  
  AvaII   GGWCC   2786    3615    925    3850    1355    1022  
  HgiCI   GGYRCC   3602    6827    544    13818    3847    1155  
  BaeGI   GKGCMC   10426    14345    623    12260    5591    1272  
  BsaHI   GRCGYC   5405    41837    477    34628    4630    1473  
  BanII   GRGCYC   4585    27743    1030    25487    4183    1859  
  CviQI PabI RsaI   GTAC   598    699    333    571    368    332  
  BstZ17I   GTATAC   7793    9864    11312    4415    4137    5899  
  BciVI   GTATCC   4399    7804    4542    6042    3054    3430  
  SalI   GTCGAC   55842    81960    2587    75308    12401    7118  
  BsmAI   GTCTC   1200    3406    441    4146    1157    734  
  ApaLI   GTGCAC   34091    23249    1478    19424    18061    3413  
  AccI   GTMKAC   3589    5565    1325    3045    1858    1905  
  Tsp45I   GTSAC   2406    2918    492    3323    960    538  
  HpaI   GTTAAC   6958    9971    30988    8099    2682    5531  
  PmeI   GTTTAAAC   50012    49223    800409    92710    27254    73245  
  HindII   GTYRAC   2836    3238    1309    4218    1084    1307  
  BsiHKAI   GWGCWC   3829    7719    490    7617    3154    1041  
  ApoI   RAATTY   210    176    4799    271    263    823  
  NspI   RCATGY   1380    3265    686    1576    1978    898  
  Cfr10I NmeDI   RCCGGY   7867    20090    655    47201    6330    1598  
  XhoII   RGATCY   1113    2553    2544    3551    1569    2073  
  HaeII   RGCGCY   4539    35541    428    49093    5598    1179  
 
             Cryptosporidium
parvum
   Dictyostelium
discoideum
   Leishmania
major
   Plasmodium
falciparum
   Theileria
parva
   Trypanosoma
brucei
 
  CviJI   RGCY   145    472    61    518    143    99  
  EcoO109I   RGGNCCY   8506    29732    1683    7034    3927    2241  
  PpuMI   RGGWCCY   13326    38004    4345    7845    5503    4406  
  SnaBI   TACGTA   10874    22782    13022    6446    6823    6758  
  BspHI   TCATGA   3886    5417    5391    3909    4042    4570  
  AccIII   TCCGGA   16950    132865    11434    61237    11852    7877  
  EsaBC3I TaqI   TCGA   626    846    247    1043    483    401  
  NruI   TCGCGA   55842    197753    3620    165037    42143    7209  
  Hpy188I   TCNGA   290    664    464    844    272    402  
  XbaI   TCTAGA   3103    11251    24041    11075    4471    14994  
  BclI   TGATCA   2520    2528    6816    3166    3626    5746  
  HpyCH4V   TGCA   271    465    162    545    459    180  
  FspI   TGCGCA   17640    88346    1388    55804    30546    3273  
  BalI   TGGCCA   7247    12139    3722    45807    7145    5578  
  BsrGI   TGTACA   4938    5117    4251    2152    2640    3326  
  MseI   TTAA   76    57    2255    70    82    277  
  PacI   TTAATTAA   4338    2286    2983343    4655    6347    51943  
  PsiI   TTATAA   1008    559    58289    335    924    3779  
  BstBI   TTCGAA   3772    6354    7922    6102    4952    5266  
  DraI   TTTAAA   565    241    36625    376    568    2030  
  PspXI   VCTCGAGB   42336    172657    4318    280365    18653    12060  
  BsaWI   WCCGGW   5282    18208    1978    20095    3437    1696  
  BsaAI   YACGTR   3997    6104    931    3419    2712    1181  
  EaeI   YGGCCR   5615    9260    659    31193    3896    1516  


Posfai@neb.com
September 11, 2013