| Abbreviation | Virus | Genbank locus name |
| SIN | Sindbis | SINCG |
| OCK | Ockelbo | SINOCK82 |
| AR8 | AR86 | ACU38305 |
| GIR | Girdwood | ACU38304 |
| YN8 | YN87448 | AF103734 |
| AUR | Aura | S78478 |
| SFV | Semliki Forest | ALSFV42S |
| BFV | Barmah Forest | BFU73745 |
| ONN | O'Nyong nyong | ONNCG |
| IGB | Igbo Ora | AF079457 |
| RRV | Ross River | RRVNBCG |
| VEE | Venezuelan equine encephalitis | EEVCOMGEN |
| EEE | Eastern equine encephalitis | EEEVIRNA |
0 10 20 30 40 50 : | : | : | : | : | SIN ALVETPRGHVRIIPQANDRMIGQYIVVSPNSVLKNAKLAPAHPLADQVKI OCK -----------------------------T-------------------- AR8 -----------------------------I-------------------- GIR -----------------------------T-------------------- YN8 -----------------------------I-------------------- AUR --------KIK----EG-VR--S-T-I--AA--R-QQ-E-I-E--E---- SFV GV-----SALKVTA-P--VLL-N-V-L--QT---SS----V----E---- BFV GV-----NSIKVST-IG-AL--S-LIL--QA--RSE---CI-D--E---L ONN GI------AIKVTA-PS-LVV-E-L-LT-QA--RSQ--SLI-A--E---T IGB GI------AIKVTA-PS-LVV-E-L-LT-QA--RSQ--GLI-A--E---T RRV GV-----NALKVT--ER-QL--A-LIL--QT---SE--T-I----E--T- VEE GS------LIKVTSYDGEDK--S-A-L--QA---SE--SCI----E--IV EEE GS-----R-IKVTTYPGEE---S-A-L--QA--NSE---CI----E--LV 50 10 20 30 40 50 : | : | : | : | : | SIN ITHSGRSGRYAVEPYDAKVLMPAGGAVPWPEFLALSESATLVYNEREFVN OCK ------A-----------------S------------------------- AR8 ------------------------S------------------------- GIR ------------------------S------------------------- YN8 ------------------------S------------------------- AUR ---G--T---S---------L-T-CPMS-QH-A---------------L- SFV ---N--A-G-Q-DG--GR--L-C-S-I-V---Q-------M--------- BFV V-----------DK-XGR--V-T-V-IDIQS-Q----------------- ONN C-----A------A--GR--V-S-Y-I-QED-QS------M-F------- IGB C-----A------A--GR--V-S-Y-I-QED-QS------M-F------- RRV M---------P-DR--GR--V-T-A-I-VS--Q-------M-------I- VEE ------K--------HG--VV-E-H-I-VQD-Q-------I--------- EEE M--K--A---K----HDR-IV-S-T-I-I-D-Q-------I-F------- 100 10 20 30 40 50 : | : | : | : | : | SIN RKLYHIAMHGPAKNTEEEQYKVTKAELAETEYVFDVDKKRCVKKEEASGL OCK -------------------------------------------------- AR8 -------------------------------------------------- GIR -------------------------------------------------- YN8 -------------------------------------------------- AUR ---H---TK-A-----------C--KDTDH---Y---ARK---R-H-Q-- SFV -------V---SL--D--N-EKVR--RTDA---------C---R------ BFV ---W---VY-A-L--D--G-EKVPV-R--SD------Q-M-L---Q---W ONN ---H--------L--D--S-ELVRV-KT-H---Y---Q-K-C-R---T-- IGB ---H--------L--D--S-ELVRV-KT-H---Y---Q-K-C-R---T-- RRV ---H---LY---L--D--N-EKVR--R--A--------RT---R-D---- VEE -Y-H---T--G-L--D--Y--TV-PSEHDG--LY-I-R-Q-----LVT-- EEE -Y-H---VN-G-L--D--Y---V-STETDS-----I-A-K----GD-GPM 150 10 20 30 40 50 : | : | : | : | : | SIN VLSGELTNPPYHELALEGLKTRPAVPYKVETIGVIGTPGSGKSAIIKSTV (motif I) (VIY)X(GA)X(AP)GxGK(ST) OCK -------------------------------------------------- ts14 hEl>hKl AR8 -------------------------------------------------- GIR -----------------------V------------A------------- YN8 -------------------------------------------------- AUR --V------------Y---R----A--HI--L------------------ SFV --V-------F--F-Y----I--SA---TTVV--F-V-----------L- BFV --C---V---F--F-Y---R---SA----H-V--Y-V----------N-- ONN --V-D--S-----F-Y----I---C---TAV---F-V----------NL- IGB --V-D--S-----F-Y----I---C---TAV---F-V----------NL- RRV --V-D-I---F--F-Y----I---T-FQTTV---F-V-----------V- VEE G-T---VD--F--F-Y-S-R----A--Q-P----Y-V------G----A- EEE C-V---VD--F--F-Y-S------A-H--P----Y-V------G----A- |ca. domain 1A of PCR, rep 200 10 20 30 40 50 : | : | : | : | : | SIN TARDLVTSGKKENCREIEADVLRLRGMQITSKTVDSVMLNGCHKAVEVLY rdl=BglII OCK -------------------------------------------------- AR8 -------------------------------------------------- GIR -----------------Q------------------------R------- YN8 ------------------------------A------------------- AUR -LK-----------K---N--QKM---T-ATR-----L---WK---D--- SFV -KH-----------Q--VN--KKH--KGTSRENS--IL----RR--DI-- BFV -MS---L-------L--MN---KH-ALR--A------L---VKHTPNI-- ONN -RQ-----------Q--SN--M-Q-KLE-SAR----LL----N-P----- IGB -RQ-----------Q--SN--M-Q-KLE-SAR----LL----N-P----- RRV -T----A-------Q--VN--KKQ--LDV-AR----IL----RRG--N-- VEE -KK---V-A-----A--IR--KKMK-LDVNAR-----L----KHP--T-- EEE -K----V-A-----M--IK--K-M---D-AAR-----L---VKHS-DT-- |.............. | ca. domain 1B of PCR, rep 250 10 20 30 40 50 : | : | : | : | : | SIN VDEAFACHAGALLALIAIVRPRKKVVLCGDPMQCGFFNMMQLKVHFNHPE (motif II) bbbDEb OCK -------------------------------K------------------ (motif III) bbbbGDxxQ AR8 -----R-------------------------K------------------ ts16 kVv>kLv GIR ----------------------H--------K------------Y----- YN8 -------------------------------K------------------ AUR ----------T-M------K--R--------K-WP---L-----N--N-- SFV --------S-T------L-K--S--------K------------N---NI BFV I----S----T---T------KQ--------K------------NY--DI ONN --------S-T------M----Q--------K---------M--NY--NI IGB --------S-T------M----Q--------K---------M--NY--NI RRV --------S-T------M-K-TG--I-----K------L-----N---DI VEE I---------T-R-----I-- --A------K--------C-------EI EEE I---------T--------K- ---------K--------C-------EI 300 10 20 30 40 50 : | : | : | : | : | SIN KDICTKTFYKYISRRCTQPVTAIVSTLHYDGKMKTTNPCKKNIEIDITGA (motif IV) Y OCK R---------F--------------------------------------- ts21 iCt>iYt AR8 ----------F--------------------------------------- id=ClaI GIR ----------F--------------------------------------- YN8 ----------F--------------------------------------- AUR R-L--S-H-------------------------R------RA----VN-S SFV --EVCH-S------R-----------G---R-----N-P-I--T--Q BFV -SEV-H-S-------DI-----K---QDR-R----R-GD-I--T--T ONN --QVYH-S------L-------S---ES--R---EYNQP-VV-T--I IGB --QVYH-S------L-------S---ES--R---EYNQP-VV-T--T RRV --QVLH-S------L-I---------Q---R---L-SAP-Q--T--T VEE --QV-H-S------KS--SV----F--K--R----KETK-V--T--S EEE --EVYH-S------KT--S-----F--KR-R-V---NDK-I--T-ST |................ ca. domain 2B of PCR, rep 350 10 20 30 40 50 : | : | : | : | : | SIN TKPKPGDIILTCFRGWVKQLQIDYPGHEVMTAAASQGLTRKGVYAVRQKV (motif V) TbxxxQGxTbxxVxbb OCK -------------------------------------------------- EA6.12 (sup 4.1?) lTc>lAc AR8 -------------------------------------------------- Toto5CN lethal tAa>tVa GIR -------------------------------------------------- di=EcoRV YN8 -------------------------------------------------- AUR ----K---V----------G------PGGHDR--------R--------- SFV --------V-------A----L--R------------------------- BFV ---AKT-L-------------Q--R-N-------------AS-----T-- ONN ---E---LV---------------R-N----------------------- IGB ---E---LV---------------R-N----------------------- RRV ---AK---V-----X---------R------------------------- VEE ----QD-L----------------K-N-I------------------Y-- EEE ---LKD------------------KN--I--------F---------Y-- .......| ca. domain 2B of PCR, rep 400 10 20 30 40 50 : | : | : | : | : | SIN NENPLYAITSEHVNVLLTRTEDRLVWKTLQGDPWIKQLTNIPKGNFQATI (VI) V(AL)(LM)(ST)R OCK ---A------------------------------------V--------- ts118 lVw>lAw AR8 ----------------------------------------V--------- Toto5NT lethal qLt>qPt GIR ----------------------------------------V--------- ts19 vLl>vSl YN8 ----------------------------------------V--------- FSATL box AUR -------EK--------------I------------Y---V-----T--L SFV -------PA--------------------A------V-S---Q---T--L BFV -------Q-------------NK------ST-----T---P-R-HYT--- ONN -------P-------------GK-T----S------I-Q-P---D-K--- IGB -------S-------------GK-I----S------I-Q-P-----K--- RRV -------PS------------N-------S------V-------D-S--L VEE -------P---------------I-----A------T--AKYP---T--- EEE -------Q-------------K-I-----A------T--ASYP---T--L ca. domain 2A of PCR, rep | 450 10 20 30 40 50 : | : | : | : | : | SIN EDWEAEHKGIIAAINSPTPRANPFSCKTNVCWAKALEPILATAGIVLTGC fsc=PvuII, tag=EagI OCK -----------------A--T----------------------------- AR8 -----------------A--T----------------------------- GIR -----------------A--T-------------R--------------- YN8 -----------------A--T----------------------------- AUR -E-Q---ED-MK----TSTVSD--AS-V-T-----II---R----E--FE SFV -E-QE--DK-MKV-EG-AAPVDA-QN-A------S-V-V-D----R--AE BFV AE-----Q--MK--QGYA-PV-T-MN-V------T-T-V-E----S-SAE ONN KE-----AS-M-G-CNHQMAFDT-QN-A------C-V---D----K-SDR IGB KE-----AS-M-G-CNYQMAFDT-QN-A------C-V---D----K-SDR RRV -E-QE--DN-MN-LRERSTAVD--QN-AK-----C-VQV-E----RM-AE VEE -E-Q---DA-MRH-LERPDPTDV-QN-A--------V-V-K----DM-TE EEE -E-Q---DA-M-K-LETPASSDV-QN-V----------V----N-T--RS 500 10 20 30 40 50 : | : | : | : | : | SIN QWSELFPQFADDKPHSAIYALDVICIKFFGMDLTSGLFSKQSIPLTYHPA ts18 qFa>qLa OCK -------------------------------------------------- ts17 aAi>aTi AR8 -------------------------------------------------- ts7 lDv>lNv GIR -------------------------------------------------- YN8 --------------------------------S----------------- AUR --ED-----RN-Q-Y-VM-------T-M-----S--I--RPE----F--- SFV E--TIITA-KE-RAY-PVV--NE--T-YY-V--D-----APKVS-Y-ENN BFV D----L-P--Q-VAY-PEV--NI--T-MY-F--DT----RP-V-M--TKD ONN ---QIVQA-KE-RAY-PEV--NE--TRIY-V--D------PL-SVY-ADN IGB ---QIVQA-KE-RAY-PEV--NE--TRIY-V--D------PL-SVY-ADN RRV E-DTVL A-RE-RAY-PEV--NE--T-YY-V--D-----A--VS-Y-ENN VEE --NTVDY -ET--A---EIV-NQL-VR---L--D-----APTV--SIRNN EEE --ETI -A-K---AY-PEM--NFF-TR---V-ID-----APTV--S-TNE 550 10 20 30 40 50 : | : | : | : | : | SIN DSARPVAHWDNSPGTRKYGYDHAIAAELSRRFPVFQLAGK GTQLDLQ qla=NheI OCK -----------------------V---------------- ------- AR8 -----------------------V---------------- ------- GIR -----------------------V---------------- ------- YN8 -----------------------V---------------- ------- AUR -VG-VR--------GQ-F--NK-VIPT CKKY--YLR--- -D-ILPI SFV ----R--G-M--FNA-T--R-EA-HT -LK -QWHT-K-AVIA BFV ----RV-GKM--FSQQAYDQ-A--H- YLR -REKS-M-IVVT ONN ----R--GKMF-FNPEV-LM-EKKY- -TK --WNINK-ICIT IGB ----R--GKMF-FNPEV-LM-EKKY- -TK --WNINK-ICIT RRV ----R--G-M--FNREV-RKFEQ-Y- -LR --MDS-L-VNVP VEE ------SPNM--LNKEVVRQ----Y-QLPR- VAT-RVY-MN EEE -------PNM--LCMRN-K--A--Y-CILK- VDT-RVV-VR 600 10 20 30 40 50 : | : | : | : | : | SIN TGRTRVISAQHNLVPVNRNLPHALVPEYKEKQPGPVKKFLNQFKHHSVLV OCK ---------------------------H--------E------------- AR8 ---------------------------H--------E---S--------- GIR ---------------------------H------------S--------- YN8 ---------------------------H--------E---S--------- AUR Y--VS-P--RN----L------S-TASLQK-EAA-LH-----LPG--M-L SFV ERKIQPL-VLD-VI-I--R------A---TVKGSR-EWLV-KVRGYH--L BFV EM-IQRPRSDA-II-I--R---S--ATHEYRRAARAEE-FTTTRGYTM-L ONN -RKVDEFNPET-II-A--R---S--A-HHSVRGERMEWLV-KISG-HM-L IGB -RKVDEFNPET-II-A--R---S--A-HHSVRGERMEWLV-KING-HM-L RRV ERK QPFN-EC-ILLL--R------TS-QQCRGER-EWL-KKLPGYHL-L VEE --TL-NYDPRI-------R------LHHN-HPQSDFSS-VSKL-GRT--- EEE -DTIKDYNPLI-V--L--R---S--VTQRYTGN-DYSQLVTKMTGKT--- 650 10 20 30 40 50 : | : | : | : | : | SIN VSEEKIEAPRKRIEWIAPIGIAGADKNYNLAFGFPPQ ARYDLVFINIGT OCK ---------H--------------------------- ------------ AR8 I--K-----H--------------------------- ------------ GIR ---------H--------------------------- ------------ YN8 I--------H--------------------------- ------------ AUR --K-TCYCVS---T-V--L-VR---H-HD-H-----L S-----VV-M-Q SFV ---YNLAL--R-VT-LS-LNVT---RC-D-SL-L-ADAG-F----V--H- BFV ---YNMNL-N-K-T-L----TQ--HHTA--NL-I--LLGSF-A-VV-MP- ONN --GHNLIL-T--VT-V--L-TR---YT---EL-L-ATLG-----V---H- IGB --GYNLIL-T--VT-V--L-TR---YT---EL-L-ATLG-----V---H- RRV ---YNLAL-H--VF----PHVS---RI-D-DL-L-LNAG------V--H- VEE - G--LSV-G-MVD-LSDRPE -TFRAR-DL-I-GDVPK--II-V-VR- EEE - GTPMNI-G--V-TLGQSPQ CTYKAE-DL-I-AALGK--II---VR- 700 10 20 30 40 50 : | : | : | : | : | SIN KYRNHHFQQCEDHAATLKTLSRSALNCLNPGGTLVVKSYGYADRNSEDVV SIN-1 nPg>nSg OCK -------------------------------------------------- S1 nPg>nLg AR8 -------------------------------------------------- ts24 yGy>ySy GIR -------------------------------------------------- YN8 -------------------------------------------------- AUR P--F--Y----E--GLMR--A-------K-----AL-A--F--S------ SFV EF-I--Y---V---MK-QM-GGD--RL-K---I-M RA-----KI--A-- BFV PF----Y-------MK-QM-AGD--RHIK---S-W--A------H--H-- ONN PF-I--Y---V---MK-QM-GGDS-RL-K---S-LIRA------T--R-I IGB PF-I--Y---V---MK-QM-GGDS-RL-K---S-LIRA------T--R-I RRV E--T--Y---V--SMK-QM-GGDS-HL-X---S-LIRA------V--M-- VEE P-KY--Y-------IK-SM-TKK-CLH------C-SIG------A--SII EEE P--H--Y-------IHHSM-T-K-VDH--K---CIALG--T---AT-NII 750 10 20 30 40 50 : | : | : | : | : | SIN TALARKFVRVSAARPDCVSSNTEMYLIFRQLDNSRTRQFTPHHLNCVISS saa=PstI OCK ---------------E---------------------------------- S24 dNs>dKs AR8 ---------------E---------------------------------- GIR ---------------E---------------------------------- YN8 ---------------E---------------------------------- AUR LS-------A--V--S-TQF----FFV------D-E----Q----LAV-N SFV SS-S---SSARVL-----T----VF-L-SNF--GK -PS-L-QM-TKL-A BFV L------KSFRVTQ-S--T----VF-H-SIF--GK -AIAL-SA-RKAN- ONN SV-G---RSSR-LK-Q-IT-----FFL-SRF--G- -N--T-VM-NQLNA IGB SV-G---RSSR-LK-Q-IT-----FFL-SRF--G- -N--T-VM-NQLNA RRV -------SAFRVL--A--T----VF-L-TNF--G- -AV-L-QA-QRL-- VEE G-I--Q-KFSRVCK-KSSLEE--VLFV-IGY-RKA -THN-YK-SSTLTN EEE S-V--S-RFSRVCQ-K-AWE---VAFV-FGK--GN HLQDQDR-SV-LNN 800 10 20 30 40 50 : | : | : | : | : | SIN VYEG TRDGVGA OCK ---- ------- AR8 ---- ------- GIR ---- ------- YN8 ---- ------- AUR IFDN YK--S-- SFV --A-EAMHTA-C BFV IFQN -FLPA-S ONN --A- LATRA-C IGB --A- LATRA-C RRV MFACNGLHTA-C VEE I-T-SRLHEA-C EEE I-Q-S-QHEA-R |
|
Unrooted parsimony trees of nsP2 sequences (1855). (Phylip ProtPars 3.573c. Jumble 5x, seed = 9). The three trees are identical except for the clade containing OCK,YN8, AR8, GIR, and SIN.
|
+-----------------------------------VEE - ! | ! +--------------------------------EEE | -11 ! | ! ! +-----------BFV | ! ! ! | +-12 +-----------------7 +--IGB | Same in ! ! ! +-----9 | all 3 ! ! ! ! +--ONN | trees ! ! +--8 | ! ! ! +--RRV | +--6 +----10 | ! +--SFV | ! | ! +--------------AUR - ! ! +--------------5 +-----------OCK ! ! +--1 +--YN8 ! +-----4 ! ! +--AR8 +--2 ! +--GIR +-----3 +--SIN |
+-----------------------------------VEE ! ! +--------------------------------EEE -11 ! ! ! +-----------BFV ! ! ! +-12 +-----------------7 +--IGB ! ! ! +-----9 ! ! ! ! +--ONN ! ! +--8 ! ! ! +--RRV +--6 +----10 ! +--SFV ! ! +--------------AUR ! ! +--------------5 +-----------OCK ! ! +--1 +-----GIR ! +--3 ! ! ! +--YN8 +--2 +--4 ! +--AR8 ! +--------SIN |
+-----------------------------------VEE ! ! +--------------------------------EEE -11 ! ! ! +-----------BFV ! ! ! +-12 +-----------------7 +--IGB ! ! ! +-----9 ! ! ! ! +--ONN ! ! +--8 ! ! ! +--RRV +--6 +----10 ! +--SFV ! ! +--------------AUR ! ! ! ! +-----GIR +--------------5 +--3 ! ! ! +--YN8 ! +--2 +--4 ! ! ! +--AR8 +--1 ! ! +--------OCK ! +-----------SIN | |
|
Helicase domain (164L to 430Q, inclusively) 15 trees in all. All require 377. The 15 trees are identical, except for the clade containing OCK, AR8, YN8 and SIN. The major difference between the results for the helicase domain and the entire nsP2 sequence is that BFV is now in the SIN et al. clade, as versus the SFV et al. clade when the entire sequence is analyzed. The latter result also applies to the amino-terminal domain (residues 1- 163, inclusively), and to the protease domain (431G to carboxyl terminus, inclusively). +-----------------------------------VEE - ! | -11 +--------------------------------EEE | ! ! | ! ! +--------RRV | +-12 ! | ! +-------------------10 +--IGB | Same in ! ! ! +--9 | all 15 ! ! +--8 +--ONN | trees +--6 ! | ! +-----SFV | ! | ! +-----------------BFV | +-----------7 | ! +--------------AUR | +--5 | ! +-----------GIR - +--3 ! +--------OCK +--1 ! +-----AR8 +--2 ! +--YN8 +--4 +--SIN |
Protease domain (431G to carboxyl terminus, inclusively) 1 tree. It requires 1136.
+-----------------------------------VEE ! ! +--------------------------------EEE -11 ! ! ! +-----------BFV ! ! ! +-12 +-----------------7 +--IGB ! ! ! +-----9 ! ! ! ! +--ONN ! ! +--8 ! ! ! +--RRV +--6 +----10 ! +--SFV ! ! +--------------AUR ! ! ! ! +-----GIR +--------------5 +--3 ! ! ! +--YN8 ! +--2 +--4 ! ! ! +--AR8 +--1 ! ! +--------OCK ! +-----------SIN |
| Return to Overview of Sindbis virus | ||
| Send suggestions and comments to: huang@borcim.wustl.edu WWW Department of Molecular Microbiology, Box 8230 Washington University School of Medicine St. Louis, MO 63110-1093 USA | Tel 314-362-2755 FAX 314-362-1232 | |