| Abbreviation | Virus | Genbank locus name |
| SIN | Sindbis | SINCG |
| OCK | Ockelbo | SINOCK82 |
| AR8 | AR86 | ACU38305 |
| GIR | Girdwood | ACU38304 |
| YN8 | YN87448 | AF103734 |
| AUR | Aura | S78478 |
| SFV | Semliki Forest | ALSFV42S |
| BFV | Barmah Forest | BFU73745 |
| ONN | O'Nyong nyong | ONNCG |
| IGB | Igbo Ora | AF079457 |
| RRV | Ross River | RRVNBCG |
| VEE | Venezuelan equine encephalitis | EEVCOMGEN |
| EEE | Eastern equine encephalitis | EEEVIRNA |
|
The nsP3 protein consists of a relatively well-conserved amino-terminal domain and a hypervariable carboxyl-terminal domain The following is the alignment of the amino-terminal domain, using ClustalW.
0 10 20 30 40 50 : | : | : | : | : | 0 10 20 30 40 50 : | : | : | : | : | SIN APSYRTKRENIADCQEEAVVNAANPLGRPGEGVCRAIYKRWPTSFTDSAT OCK ------------------------------------------N------- AR8 ------------------------------------------N------- GIR ------------------------------------------N------- YN8 ----------------------------------------G-N------- AUR -----V--M-----T---------AR-K--D------F-K--K--ENAT- SFV -----V--AD--T-T-A-------AR-TV-D-----VA-K--SA-KGA-- BFV --A--V--GD-SNAP-D-------QQ-VK-A---G---RK--DA-G-V-- ONN -----V--MD--KNT--C-------R-V--D---K-V-RK--E--RN--- IGB -----V--MD--KNT--C-------R-V--D---K-V-RK--E--RN--- RRV -----VR-TD-SGHA---------AK-TV-V-----VARK--D--KGA-- VEE ----HVV-GD--TAT-GVII----SK-Q--G---G-L--KF-E--DLQPI EEE --A--VV-GD-TKSND-VI-----NK-Q--G---G-L-RK--GA-DKQPV **:*:. * :*: : ::**** * * *** *: :: * :* . 50 10 20 30 40 50 : | : | : | : | : | SIN ETGTARMTVCLGKKVIHAVGPDFRKHPEAEALKLLQNAYHAVADLVNEHN OCK -----KL---H--------------------------------------- AR8 -----KL---Q--------------------------------------- GIR -----KL---Q--------------------------------------- YN8 -----KL---Q------V-------------------------------- AUR -VE--V-KP-HN-V-----------YTLE--T--------D--KI---KG SFV PV--IKTVM-GSYP-----A-N-SATT---GDRE-AAV-R---AE--RLS BFV P----VSKSVQD-L-------N-S-CS-E-GDRD-AS--R-A-EI-MDKK ONN PV---KTIM-GQYP-------N-SNYS---GDRE-ASV-RE--KE-SRLG IGB PV---KTIM-GQYP-------N-SNYS---GDRE-AS--RE--KE-SRLG RRV PV---KLVQAN-MN-------N-STVT---GDRE-AA--R---GII-AS- VEE -V-K--LVKGAA-HI------N-N-VS-V-GD-Q-AE--ESI-KI--DN- EEE A--K-HLVK-HSPN-------N-SRLS-N-GDQK-SEV-MDI-RII-NER . . :**.*.*:* . *. : * .* * : 100 10 20 30 40 50 : | : | : | : | : | SIN IKSVAIPLLSTGIYAAGKDRLEVSLNCLTTALDRTDADVTIYCLDKKWKE OCK -------------------------------------------------- AR8 -------------------------------------------------- GIR -------------------------------------------------- YN8 -------------------------------------------------- AUR -S---------------A---DL--R--F-------------------EQ SFV LS----------VFSG-R---QQ---H-F--M-A---------R--S-EK BFV -TT--V---------G--N-V-Q---H-F--F-N---------M--T-EK ONN VS----------V-SG-----LQ---H-FA-M-S-----V---R--E-EK IGB VS----------V-SG-----LQ---H-FA-M-S-----V---R--E-EK RRV ------------VFSG----VMQ---H-F--M-T-----V---R--A-EK VEE Y------------FSGN----TQ---H-L----T-----A---R----EM EEE FTK-S----------G----VMQ---H-F--M-T----I-------Q-ES ..*::******:::.. :*: **. * :*:* ****:.*** ** *: 150 10 20 30 40 50 : | : | : | : | : | SIN RIDAALQLKESVTELKDEDME----IDDELVWIHPDSCLKGRKGFSTTKG OCK ----V--------------------------------------------- AR8 ----V--------------------------------------------- GIR ----V-------I------------------------------------- YN8 ----V--------V----------------------------Q------- AUR --AD-IRMR-Q------P-I-------EG-TRV-------DHI-Y--QY- SFV K-QE-IDMRTA-EL-N-DVEL-----TTD--RV----S-V----Y---D- BFV K-KE-IDHRT--EMVQ-DVQL-----EE---RV--L-S-A----Y--DS- ONN K-TE-IS-RSQ-EL-D-HISV------CDI-RV----S-A----Y--VE- IGB K-TE-IS-RSQ-EL-D-HISV------CDI-RV----S-A----Y--VE- RRV K-QE-IDRRTA-ELVSEDISL-----ESD-IRV------V----Y-I-D- VEE TLKE-VARR-A-E-ICIS-DSSVTEP-A---RV--K-S-A----Y--SD- EEE --KE-ITR----E--TED-RP----V-I---RV--L-S-A--P-Y---E- : .: : * : : :** *.* .: *:* * 200 10 20 30 40 50 : | : | : | : | : | SIN KLYSYFEGTKFHQAAKDMAEIKVLFPNDQESNEQLCAYILGETMEAIREK OCK -------------------------------------------------- AR8 -------------------------------------------------- GIR -------------------------------------------------- YN8 -------------------------------------------------- AUR -------------T---I---RA---DV-AA---I-L-T---P--S---- SFV S----------N---I-----LT-W-RL--A--RI-L-A-----DN-GS- BFV RVF--L-------T-V-I--MQ--W-ALK-----IV--T---S-DQ--G- ONN A----L---R---T-V-----YTMW-KQT-A---V-L-A---SI-SV-Q- IGB A----L---R---T-V-----YTMW-KQT-A---V-L-A---SI-SV-Q- RRV --H--L---R---T-V-----ST-W-KL-DA---I-L-A---S-DS--T- VEE -TF--L-----------I---NAMW-VAT-A---V-M-----S-SS--S- EEE -V---L---R---T---V---NAMW--K--A---I-L-V---S-NS--S- .**:***:*:*:* *:**: .::* :**:: * ***.:. : * 250 10 20 30 40 50 : | : | : | : | : | SIN CPVDHNPSSSPPKTLPCLCMYAMTPERVHRLRSNNVKEVTVCSSTPLPKH OCK -------------------------------------------------Y AR8 -------------------------------------------------Y GIR -------------------------------------------------Y YN8 -------------------------------------------------Y AUR ---EDS-A-A----I---------A--IC-V---S-TNI-----F----Y SFV ---NDSD--T--R-V----R----A--IA----HQ--SMV----F----Y BFV --TEDTDA-T--R-V----R--------Y--KCT-TTQF-----FE---Y ONN ----DADA-F----V----R--------A---M-HTTSII----F----Y IGB ----DADA-F----V----R--------A---M-HTTSII----F----Y RRV ---EDAD--T----V----R----A---A---M--T-AII----F----Y VEE ---EESEA----S------IH-------Q--KASRPEQI-----F----Y EEE ---EESEA----H-I----N----A---Y---MAKNEQFA----FQ---Y **.:. :* ** *:**** :***.**: *:: . **** ***: 300 10 20 30 40 50 : | : | : | : | : | SIN KIKNVQKVQCTKVVLFNPHTPA OCK ---------------------- AR8 ---------------------- GIR ---------------------- YN8 ---------------------- AUR R------I----------DV-P SFV HVDG----K-E--L--D-TV-S BFV H-QG--R-K-ERIIILD-TV-P ONN --EG----K-S-AL--DHNV-S IGB --EG----K-S-AL--DHNV-S RRV R-EG----K-DR-LI-DQTV-S VEE R-TG---I--SQPI--S-KV-- EEE R-TG---I--S-P-I-SGTV-P :: .**:::* : :::. .*. |
|
The following alignment of the hypervariable carboxyl-domain is at best a guess, derived from iterative ClustalW alignment (with very unusual gap parameters), plus extensive manual adjustments. 0 10 20 30 40 50 60 70 80 90 100 : | : | : | : | : | : | : | : | : | : | SIN FVPARKYIE VPEQPTAPPAQAEEAPEV VATPS PSTADNTSLDVT DI SLDMDDSSEGSL FSSFSGSDN OCK --------- -----A-----D-----A ----A -PA--------- -- ------------ --------- AR8 --------- A----A----------G- ----T -PA--------- -- ----E------- --------- GIR --------- A----A------------ A---T -PA--------- -- ----E------- --------- YN8 --------- A----A----------G- ----T -PA--------- -- ----E------- --------- AUR YI---V--N KDEPP-TPHTDS--DTCSS RLSLT -TLSNAE- --V --TFSEI DSE- --LNEPAR SFV V-SP--- AASTTDHSDRSL RGFDLDW-TDSS ST-SD -M-L- --QSC --D -I BFV TYKRPCI-R-PSTISCNSSEDSRSL STFSVSSDSSIGSLPVGD -RPI-AIGTVSTRQRHDSS-YAHS LA--G--M PRTI ONN R-SP-T-RPADEIIQTPQTPTEACQDAQLV-SINDE-VPVPSDLEACD--MDW--IGTVPTRQRHDSF-YANS LA--G--M -EY---RS IGB R-SP-T-RPADEIIQTPQISTEACQDAQLV-SINDE-VPVPSDLEACD--MDW-- -EY- -RS RRV L-SP----PAAASMHADTVSL DSTVSTGSAWSF-SE-T VEE YIHP---LV ETPPVDETPEPSAENQST-GTPEQ-PLIT-DE -RTRTPEPIIIEEEEEDSISSSWSIP EEE AIHP--F ASVTVEDTPVVQPERL VPRRP--- VPVP-RIPSPPC-STNG--TSIQ--GESQGSL WSIPYQSASA--GAEISVDQV-LWSI SIN SITSMDSWSSGPSSLE IVDRRQVVVADVHA VQEP APIPPPRLKKMARL AAAR OCK ---C--R-------- ------------ ---- -------------- A--SK AR8 Y----------- ---- --V----------- ---- GIR ---------------- -------------- ---- --V----------- ---- YN8 ---------------- -------------- ---- --V----------- ---- AUR HVM IS-FKLR YTAIQALPQKLSWMRE-RT PRQ- P-V----P-RA-K-SRL-NQL SFV YEPMAPI--T---- P-- AGIADLAADVHPEPADHVDLEN------P-RA-Y-ASR--E- BFV FRPVPAPRAPVLRTTPPPKPP-TFT-R-E-- -A- PT-V----P-RA-K- -- ONN N- -L-T-----PMLSL SSEPAQNGTMILLDSEDTDSISRVST--A--- R --GRT IGB N- -L-T-----PMLSL SSEPAQNGIMILPDSEDTDSISRVST--A--- R --GRT RRV YETME ---E-- HS-- -V---- RRR-QVTMHHQEL VEE SLLSDGPTHQVL-- E--I-GPPSVSHASDFDVDSLSILDTLEGASVTSGATSAETNSYFAKSMEFLAR-V-A--T EEE PSATGFDVRTSS-LSLEQPTFPTM--E-EI-- SITGFETRV-S- SIN KEPTPPASNSS ESLHLSFGGVSMSLGSIFDGETAR QAAVQPLA TG PTDVPMSFG OCK TQ E--I----T--AD-------------F--LL---M-- L--A--P- -- --------- AR8 MQ E-------T--AD-------D---I-F--L----M-- L--A--P-S-C --------- GIR MQ E-------T--AD-------------F--L----MG AL--A--P-S-C --------- YN8 MQ EG------T--AD-------D-----F--L----MV RL--A--P- -C --------- AUR NE -RRHATIS-VQAEVHYNSGFTPEAELNERGSILRK-PP--PLRP SFV PV PAPRKPT-APR-AFRNKL-LT-- BFV EM HPGFT-- ONN INVTCDEREGKILPMASDRF-TAKPYTVALSVSTADMTVYPIQA--GLIPP--LE-IT-- IGB INVTCDEREGKILPMASDRF-TAKPYTVALSVSTADITAYPIQA--GL-QP--LEQIT-- RRV LEVSDMHTPIAARVEIPVYDTAVVAERVAIPCTSEYATPIPTPRAVRVVPVPAPRIQRA-TYR--PTPTPRVLRASVCSVTTSAGVEFPWA-E-LEVLTE VEE VFRNP-HPAPRTRTP- LAPSRAC-RTSLVSTPPGVNRVITREELEALTPSRTP EEE -SQDSRPSTP-ASA-HTF-DLITFDSVAEILEDFSRSPFQFLSEIK-IPA-RTRV SIN SFSDGEIDELSRRVTESE PVLFGSFEPGEVNSIIISSRSAVSFPLRKQRRRRRSR RTEYX OCK -------E---------- ------------------------------------- ----- AR8 -------E---------- --------------------------P---------- ---- GIR -------E---------- ---------------------V----P---------- ----- YN8 -------E--I------- --------------------------P---------- ----- AUR KQTT N---LANQLSM-IT--D-AE--LDRLL-TPSPTPT-GDFS-EEMD-FFGNRQ-- SFV D-DEH-V-A- ASGIT--D-DDVL BFV D-GEH-VE-- TAS-LT--D-AE--IQGM G-E-EX ONN D-AE----N- LTGALT--D------EEL TD-EWSTCSDTDEEL IGB D-AE----N- LTGALT--D------EEL TD-EWSTCSDTDEELX RRV PVHCEMREPVELPWEPEDVDIQ--D--TPDKIQF GDIDFDQFX VEE --S-SRTS LV-NP-- --RV--TREEFEA-VAQQ-X EEE NNMSRSA-TIKPIPKPR KCQVKYTQP-- -ARA---AAEFDE-VR-HSNX |
| Return to Overview of Sindbis virus | ||
| Send suggestions and comments to: huang@borcim.wustl.edu WWW Department of Molecular Microbiology, Box 8230 Washington University School of Medicine St. Louis, MO 63110-1093 USA | Tel 314-362-2755 FAX 314-362-1232 | |