SIN genome map

nsP3 sequence of alphaviruses

AbbreviationVirusGenbank locus name
SINSindbisSINCG
OCKOckelboSINOCK82
AR8AR86ACU38305
GIRGirdwoodACU38304
YN8YN87448AF103734
AURAuraS78478
SFVSemliki ForestALSFV42S
BFVBarmah ForestBFU73745
ONNO'Nyong nyongONNCG
IGBIgbo OraAF079457
RRVRoss RiverRRVNBCG
VEEVenezuelan equine encephalitisEEVCOMGEN
EEEEastern equine encephalitisEEEVIRNA

The nsP3 protein consists of a relatively well-conserved amino-terminal domain and a hypervariable carboxyl-terminal domain

The following is the alignment of the amino-terminal domain, using ClustalW.

  0	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
  0	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	APSYRTKRENIADCQEEAVVNAANPLGRPGEGVCRAIYKRWPTSFTDSAT
OCK	------------------------------------------N-------
AR8	------------------------------------------N-------
GIR	------------------------------------------N-------
YN8	----------------------------------------G-N-------
AUR	-----V--M-----T---------AR-K--D------F-K--K--ENAT-
SFV	-----V--AD--T-T-A-------AR-TV-D-----VA-K--SA-KGA--
BFV	--A--V--GD-SNAP-D-------QQ-VK-A---G---RK--DA-G-V--
ONN	-----V--MD--KNT--C-------R-V--D---K-V-RK--E--RN---
IGB	-----V--MD--KNT--C-------R-V--D---K-V-RK--E--RN---
RRV	-----VR-TD-SGHA---------AK-TV-V-----VARK--D--KGA--
VEE	----HVV-GD--TAT-GVII----SK-Q--G---G-L--KF-E--DLQPI
EEE	--A--VV-GD-TKSND-VI-----NK-Q--G---G-L-RK--GA-DKQPV
	**:*:. * :*:   :  ::****  *  * *** *: :: * :*   . 

 50	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	ETGTARMTVCLGKKVIHAVGPDFRKHPEAEALKLLQNAYHAVADLVNEHN
OCK	-----KL---H---------------------------------------
AR8	-----KL---Q---------------------------------------
GIR	-----KL---Q---------------------------------------
YN8	-----KL---Q------V--------------------------------
AUR	-VE--V-KP-HN-V-----------YTLE--T--------D--KI---KG
SFV	PV--IKTVM-GSYP-----A-N-SATT---GDRE-AAV-R---AE--RLS
BFV	P----VSKSVQD-L-------N-S-CS-E-GDRD-AS--R-A-EI-MDKK
ONN	PV---KTIM-GQYP-------N-SNYS---GDRE-ASV-RE--KE-SRLG
IGB	PV---KTIM-GQYP-------N-SNYS---GDRE-AS--RE--KE-SRLG
RRV	PV---KLVQAN-MN-------N-STVT---GDRE-AA--R---GII-AS-
VEE	-V-K--LVKGAA-HI------N-N-VS-V-GD-Q-AE--ESI-KI--DN-
EEE	A--K-HLVK-HSPN-------N-SRLS-N-GDQK-SEV-MDI-RII-NER
	 . .          :**.*.*:*   .  *. : *  .*   *  :    

100	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	IKSVAIPLLSTGIYAAGKDRLEVSLNCLTTALDRTDADVTIYCLDKKWKE
OCK	--------------------------------------------------
AR8	--------------------------------------------------
GIR	--------------------------------------------------
YN8	--------------------------------------------------
AUR	-S---------------A---DL--R--F-------------------EQ
SFV	LS----------VFSG-R---QQ---H-F--M-A---------R--S-EK
BFV	-TT--V---------G--N-V-Q---H-F--F-N---------M--T-EK
ONN	VS----------V-SG-----LQ---H-FA-M-S-----V---R--E-EK
IGB	VS----------V-SG-----LQ---H-FA-M-S-----V---R--E-EK
RRV	------------VFSG----VMQ---H-F--M-T-----V---R--A-EK
VEE	Y------------FSGN----TQ---H-L----T-----A---R----EM
EEE	FTK-S----------G----VMQ---H-F--M-T----I-------Q-ES
	 ..*::******:::.. :*:  **. * :*:* ****:.*** ** *: 

150	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	RIDAALQLKESVTELKDEDME----IDDELVWIHPDSCLKGRKGFSTTKG
OCK	----V---------------------------------------------
AR8	----V---------------------------------------------
GIR	----V-------I-------------------------------------
YN8	----V--------V----------------------------Q-------
AUR	--AD-IRMR-Q------P-I-------EG-TRV-------DHI-Y--QY-
SFV	K-QE-IDMRTA-EL-N-DVEL-----TTD--RV----S-V----Y---D-
BFV	K-KE-IDHRT--EMVQ-DVQL-----EE---RV--L-S-A----Y--DS-
ONN	K-TE-IS-RSQ-EL-D-HISV------CDI-RV----S-A----Y--VE-
IGB	K-TE-IS-RSQ-EL-D-HISV------CDI-RV----S-A----Y--VE-
RRV	K-QE-IDRRTA-ELVSEDISL-----ESD-IRV------V----Y-I-D-
VEE	TLKE-VARR-A-E-ICIS-DSSVTEP-A---RV--K-S-A----Y--SD-
EEE	--KE-ITR----E--TED-RP----V-I---RV--L-S-A--P-Y---E-
	 :  .:  :  *  :              :  :** *.* .: *:*   *

200	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	KLYSYFEGTKFHQAAKDMAEIKVLFPNDQESNEQLCAYILGETMEAIREK
OCK	--------------------------------------------------
AR8	--------------------------------------------------
GIR	--------------------------------------------------
YN8	--------------------------------------------------
AUR	-------------T---I---RA---DV-AA---I-L-T---P--S----
SFV	S----------N---I-----LT-W-RL--A--RI-L-A-----DN-GS-
BFV	RVF--L-------T-V-I--MQ--W-ALK-----IV--T---S-DQ--G-
ONN	A----L---R---T-V-----YTMW-KQT-A---V-L-A---SI-SV-Q-
IGB	A----L---R---T-V-----YTMW-KQT-A---V-L-A---SI-SV-Q-
RRV	--H--L---R---T-V-----ST-W-KL-DA---I-L-A---S-DS--T-
VEE	-TF--L-----------I---NAMW-VAT-A---V-M-----S-SS--S-
EEE	-V---L---R---T---V---NAMW--K--A---I-L-V---S-NS--S-
	  .**:***:*:*:* *:**: .::*    :**::  * ***.:. :  *

250	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	CPVDHNPSSSPPKTLPCLCMYAMTPERVHRLRSNNVKEVTVCSSTPLPKH
OCK	-------------------------------------------------Y
AR8	-------------------------------------------------Y
GIR	-------------------------------------------------Y
YN8	-------------------------------------------------Y
AUR	---EDS-A-A----I---------A--IC-V---S-TNI-----F----Y
SFV	---NDSD--T--R-V----R----A--IA----HQ--SMV----F----Y
BFV	--TEDTDA-T--R-V----R--------Y--KCT-TTQF-----FE---Y
ONN	----DADA-F----V----R--------A---M-HTTSII----F----Y
IGB	----DADA-F----V----R--------A---M-HTTSII----F----Y
RRV	---EDAD--T----V----R----A---A---M--T-AII----F----Y
VEE	---EESEA----S------IH-------Q--KASRPEQI-----F----Y
EEE	---EESEA----H-I----N----A---Y---MAKNEQFA----FQ---Y
	**.:.  :* ** *:**** :***.**: *::      . ****  ***:

300	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	KIKNVQKVQCTKVVLFNPHTPA
OCK	----------------------
AR8	----------------------
GIR	----------------------
YN8	----------------------
AUR	R------I----------DV-P
SFV	HVDG----K-E--L--D-TV-S
BFV	H-QG--R-K-ERIIILD-TV-P
ONN	--EG----K-S-AL--DHNV-S
IGB	--EG----K-S-AL--DHNV-S
RRV	R-EG----K-DR-LI-DQTV-S
VEE	R-TG---I--SQPI--S-KV--
EEE	R-TG---I--S-P-I-SGTV-P
   	:: .**:::* : :::.  .*.

The following alignment of the hypervariable carboxyl-domain is at best a guess, derived from iterative ClustalW alignment (with very unusual gap parameters), plus extensive manual adjustments.

  0	        10        20        30        40        50        60        70        80        90       100
   	    :    |    :    |    :    |    :    |    :    |    :    |    :    |    :    |    :    |    :    |
SIN	   FVPARKYIE                  VPEQPTAPPAQAEEAPEV  VATPS PSTADNTSLDVT   DI     SLDMDDSSEGSL FSSFSGSDN
OCK	   ---------                  -----A-----D-----A  ----A -PA---------   --     ------------ ---------
AR8	   ---------                  A----A----------G-  ----T -PA---------   --     ----E------- ---------
GIR	   ---------                  A----A------------  A---T -PA---------   --     ----E------- ---------
YN8	   ---------                  A----A----------G-  ----T -PA---------   --     ----E------- ---------
AUR	   YI---V--N             KDEPP-TPHTDS--DTCSS      RLSLT -TLSNAE-       --V    --TFSEI DSE-  --LNEPAR
SFV	   V-SP---   AASTTDHSDRSL   RGFDLDW-TDSS  ST-SD     -M-L-      --QSC   --D    -I                    
BFV	TYKRPCI-R-PSTISCNSSEDSRSL     STFSVSSDSSIGSLPVGD    -RPI-AIGTVSTRQRHDSS-YAHS      LA--G--M      PRTI
ONN	   R-SP-T-RPADEIIQTPQTPTEACQDAQLV-SINDE-VPVPSDLEACD--MDW--IGTVPTRQRHDSF-YANS      LA--G--M  -EY---RS
IGB	   R-SP-T-RPADEIIQTPQISTEACQDAQLV-SINDE-VPVPSDLEACD--MDW--                                  -EY- -RS
RRV	   L-SP----PAAASMHADTVSL  DSTVSTGSAWSF-SE-T                                                         
VEE	   YIHP---LV  ETPPVDETPEPSAENQST-GTPEQ-PLIT-DE      -RTRTPEPIIIEEEEEDSISSSWSIP                      
EEE	   AIHP--F    ASVTVEDTPVVQPERL VPRRP--- VPVP-RIPSPPC-STNG--TSIQ--GESQGSL  WSIPYQSASA--GAEISVDQV-LWSI

SIN	SITSMDSWSSGPSSLE  IVDRRQVVVADVHA VQEP                                          APIPPPRLKKMARL   AAAR
OCK	---C--R--------     ------------ ----                                          --------------  A--SK
AR8	                    Y----------- ----                                          --V-----------   ----
GIR	----------------  -------------- ----                                          --V-----------   ----
YN8	----------------  -------------- ----                                          --V-----------   ----
AUR	HVM IS-FKLR YTAIQALPQKLSWMRE-RT  PRQ-                                          P-V----P-RA-K-SRL-NQL
SFV	                 YEPMAPI--T----   P--                     AGIADLAADVHPEPADHVDLEN------P-RA-Y-ASR--E-
BFV	FRPVPAPRAPVLRTTPPPKPP-TFT-R-E--   -A-                                         PT-V----P-RA-K-     --
ONN	N-                     -L-T-----PMLSL                 SSEPAQNGTMILLDSEDTDSISRVST--A--- R   --GRT    
IGB	N-                     -L-T-----PMLSL                 SSEPAQNGIMILPDSEDTDSISRVST--A--- R   --GRT    
RRV	                 YETME   ---E--  HS--                                           -V---- RRR-QVTMHHQEL
VEE	           SLLSDGPTHQVL-- E--I-GPPSVSHASDFDVDSLSILDTLEGASVTSGATSAETNSYFAKSMEFLAR-V-A--T             
EEE	PSATGFDVRTSS-LSLEQPTFPTM--E-EI--                                         SITGFETRV-S-               

SIN	                                         KEPTPPASNSS  ESLHLSFGGVSMSLGSIFDGETAR QAAVQPLA TG PTDVPMSFG
OCK	TQ                                       E--I----T--AD-------------F--LL---M-- L--A--P- -- ---------
AR8	MQ                                       E-------T--AD-------D---I-F--L----M-- L--A--P-S-C ---------
GIR	MQ                                       E-------T--AD-------------F--L----MG AL--A--P-S-C ---------
YN8	MQ                                       EG------T--AD-------D-----F--L----MV RL--A--P- -C ---------
AUR	NE                                                      -RRHATIS-VQAEVHYNSGFTPEAELNERGSILRK-PP--PLRP
SFV	PV                                                                           PAPRKPT-APR-AFRNKL-LT--
BFV	EM                                                                                           HPGFT--
ONN	                                        INVTCDEREGKILPMASDRF-TAKPYTVALSVSTADMTVYPIQA--GLIPP--LE-IT--
IGB	                                        INVTCDEREGKILPMASDRF-TAKPYTVALSVSTADITAYPIQA--GL-QP--LEQIT--
RRV	LEVSDMHTPIAARVEIPVYDTAVVAERVAIPCTSEYATPIPTPRAVRVVPVPAPRIQRA-TYR--PTPTPRVLRASVCSVTTSAGVEFPWA-E-LEVLTE
VEE	                                        VFRNP-HPAPRTRTP-      LAPSRAC-RTSLVSTPPGVNRVITREELEALTPSRTP 
EEE	                                             -SQDSRPSTP-ASA-HTF-DLITFDSVAEILEDFSRSPFQFLSEIK-IPA-RTRV

SIN	SFSDGEIDELSRRVTESE PVLFGSFEPGEVNSIIISSRSAVSFPLRKQRRRRRSR RTEYX
OCK	-------E---------- ------------------------------------- -----
AR8	-------E---------- --------------------------P---------- ---- 
GIR	-------E---------- ---------------------V----P---------- -----
YN8	-------E--I------- --------------------------P---------- -----
AUR	KQTT    N---LANQLSM-IT--D-AE--LDRLL-TPSPTPT-GDFS-EEMD-FFGNRQ--
SFV	D-DEH-V-A-       ASGIT--D-DDVL                                
BFV	D-GEH-VE--      TAS-LT--D-AE--IQGM      G-E-EX                
ONN	D-AE----N-      LTGALT--D------EEL TD-EWSTCSDTDEEL            
IGB	D-AE----N-      LTGALT--D------EEL TD-EWSTCSDTDEELX           
RRV	PVHCEMREPVELPWEPEDVDIQ--D--TPDKIQF GDIDFDQFX                  
VEE	          --S-SRTS    LV-NP-- --RV--TREEFEA-VAQQ-X            
EEE	NNMSRSA-TIKPIPKPR KCQVKYTQP-- -ARA---AAEFDE-VR-HSNX           


Return to Overview of Sindbis virus