SIN genome map

nsP2 sequence of alphaviruses

AbbreviationVirusGenbank locus name
SINSindbisSINCG
OCKOckelboSINOCK82
AR8AR86ACU38305
GIRGirdwoodACU38304
YN8YN87448AF103734
AURAuraS78478
SFVSemliki ForestALSFV42S
BFVBarmah ForestBFU73745
ONNO'Nyong nyongONNCG
IGBIgbo OraAF079457
RRVRoss RiverRRVNBCG
VEEVenezuelan equine encephalitisEEVCOMGEN
EEEEastern equine encephalitisEEEVIRNA

  0	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	ALVETPRGHVRIIPQANDRMIGQYIVVSPNSVLKNAKLAPAHPLADQVKI
OCK	-----------------------------T--------------------
AR8	-----------------------------I--------------------
GIR	-----------------------------T--------------------
YN8	-----------------------------I--------------------
AUR	--------KIK----EG-VR--S-T-I--AA--R-QQ-E-I-E--E----
SFV	GV-----SALKVTA-P--VLL-N-V-L--QT---SS----V----E----
BFV	GV-----NSIKVST-IG-AL--S-LIL--QA--RSE---CI-D--E---L
ONN	GI------AIKVTA-PS-LVV-E-L-LT-QA--RSQ--SLI-A--E---T
IGB	GI------AIKVTA-PS-LVV-E-L-LT-QA--RSQ--GLI-A--E---T
RRV	GV-----NALKVT--ER-QL--A-LIL--QT---SE--T-I----E--T-
VEE	GS------LIKVTSYDGEDK--S-A-L--QA---SE--SCI----E--IV
EEE	GS-----R-IKVTTYPGEE---S-A-L--QA--NSE---CI----E--LV

 50	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	ITHSGRSGRYAVEPYDAKVLMPAGGAVPWPEFLALSESATLVYNEREFVN
OCK	------A-----------------S-------------------------
AR8	------------------------S-------------------------
GIR	------------------------S-------------------------
YN8	------------------------S-------------------------
AUR	---G--T---S---------L-T-CPMS-QH-A---------------L-
SFV	---N--A-G-Q-DG--GR--L-C-S-I-V---Q-------M---------
BFV	V-----------DK-XGR--V-T-V-IDIQS-Q-----------------
ONN	C-----A------A--GR--V-S-Y-I-QED-QS------M-F-------
IGB	C-----A------A--GR--V-S-Y-I-QED-QS------M-F-------
RRV	M---------P-DR--GR--V-T-A-I-VS--Q-------M-------I-
VEE	------K--------HG--VV-E-H-I-VQD-Q-------I---------
EEE	M--K--A---K----HDR-IV-S-T-I-I-D-Q-------I-F-------

100	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	RKLYHIAMHGPAKNTEEEQYKVTKAELAETEYVFDVDKKRCVKKEEASGL
OCK	--------------------------------------------------
AR8	--------------------------------------------------
GIR	--------------------------------------------------
YN8	--------------------------------------------------
AUR	---H---TK-A-----------C--KDTDH---Y---ARK---R-H-Q--
SFV	-------V---SL--D--N-EKVR--RTDA---------C---R------
BFV	---W---VY-A-L--D--G-EKVPV-R--SD------Q-M-L---Q---W
ONN	---H--------L--D--S-ELVRV-KT-H---Y---Q-K-C-R---T--
IGB	---H--------L--D--S-ELVRV-KT-H---Y---Q-K-C-R---T--
RRV	---H---LY---L--D--N-EKVR--R--A--------RT---R-D----
VEE	-Y-H---T--G-L--D--Y--TV-PSEHDG--LY-I-R-Q-----LVT--
EEE	-Y-H---VN-G-L--D--Y---V-STETDS-----I-A-K----GD-GPM

150	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	VLSGELTNPPYHELALEGLKTRPAVPYKVETIGVIGTPGSGKSAIIKSTV	(motif I) (VIY)X(GA)X(AP)GxGK(ST)
OCK	--------------------------------------------------	ts14 hEl>hKl
AR8	--------------------------------------------------
GIR	-----------------------V------------A-------------
YN8	--------------------------------------------------
AUR	--V------------Y---R----A--HI--L------------------
SFV	--V-------F--F-Y----I--SA---TTVV--F-V-----------L-
BFV	--C---V---F--F-Y---R---SA----H-V--Y-V----------N--
ONN	--V-D--S-----F-Y----I---C---TAV---F-V----------NL-
IGB	--V-D--S-----F-Y----I---C---TAV---F-V----------NL-
RRV	--V-D-I---F--F-Y----I---T-FQTTV---F-V-----------V-
VEE	G-T---VD--F--F-Y-S-R----A--Q-P----Y-V------G----A-
EEE	C-V---VD--F--F-Y-S------A-H--P----Y-V------G----A-
   	             |ca. domain 1A of PCR, rep

200	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	TARDLVTSGKKENCREIEADVLRLRGMQITSKTVDSVMLNGCHKAVEVLY	rdl=BglII
OCK	--------------------------------------------------
AR8	--------------------------------------------------
GIR	-----------------Q------------------------R-------
YN8	------------------------------A-------------------
AUR	-LK-----------K---N--QKM---T-ATR-----L---WK---D---
SFV	-KH-----------Q--VN--KKH--KGTSRENS--IL----RR--DI--
BFV	-MS---L-------L--MN---KH-ALR--A------L---VKHTPNI--
ONN	-RQ-----------Q--SN--M-Q-KLE-SAR----LL----N-P-----
IGB	-RQ-----------Q--SN--M-Q-KLE-SAR----LL----N-P-----
RRV	-T----A-------Q--VN--KKQ--LDV-AR----IL----RRG--N--
VEE	-KK---V-A-----A--IR--KKMK-LDVNAR-----L----KHP--T--
EEE	-K----V-A-----M--IK--K-M---D-AAR-----L---VKHS-DT--
   	               |.............. |
   	               ca. domain 1B of PCR, rep

250	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	VDEAFACHAGALLALIAIVRPRKKVVLCGDPMQCGFFNMMQLKVHFNHPE	(motif II) bbbDEb
OCK	-------------------------------K------------------	(motif III) bbbbGDxxQ
AR8	-----R-------------------------K------------------	ts16 kVv>kLv
GIR	----------------------H--------K------------Y-----
YN8	-------------------------------K------------------
AUR	----------T-M------K--R--------K-WP---L-----N--N--
SFV	--------S-T------L-K--S--------K------------N---NI
BFV	I----S----T---T------KQ--------K------------NY--DI
ONN	--------S-T------M----Q--------K---------M--NY--NI
IGB	--------S-T------M----Q--------K---------M--NY--NI
RRV	--------S-T------M-K-TG--I-----K------L-----N---DI
VEE	I---------T-R-----I-- --A------K--------C-------EI
EEE	I---------T--------K- ---------K--------C-------EI

300	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	KDICTKTFYKYISRRCTQPVTAIVSTLHYDGKMKTTNPCKKNIEIDITGA	(motif IV) Y
OCK	R---------F---------------------------------------	ts21 iCt>iYt
AR8	----------F---------------------------------------	id=ClaI
GIR	----------F---------------------------------------
YN8	----------F---------------------------------------
AUR	R-L--S-H-------------------------R------RA----VN-S
SFV	   --EVCH-S------R-----------G---R-----N-P-I--T--Q
BFV	   -SEV-H-S-------DI-----K---QDR-R----R-GD-I--T--T
ONN	   --QVYH-S------L-------S---ES--R---EYNQP-VV-T--I
IGB	   --QVYH-S------L-------S---ES--R---EYNQP-VV-T--T
RRV	   --QVLH-S------L-I---------Q---R---L-SAP-Q--T--T
VEE	   --QV-H-S------KS--SV----F--K--R----KETK-V--T--S
EEE	   --EVYH-S------KT--S-----F--KR-R-V---NDK-I--T-ST
   	                                |................
   	                                ca. domain 2B of PCR, rep

350	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	TKPKPGDIILTCFRGWVKQLQIDYPGHEVMTAAASQGLTRKGVYAVRQKV	(motif V) TbxxxQGxTbxxVxbb
OCK	--------------------------------------------------	EA6.12 (sup 4.1?) lTc>lAc
AR8	--------------------------------------------------	Toto5CN lethal tAa>tVa
GIR	--------------------------------------------------	di=EcoRV
YN8	--------------------------------------------------
AUR	----K---V----------G------PGGHDR--------R---------
SFV	--------V-------A----L--R-------------------------
BFV	---AKT-L-------------Q--R-N-------------AS-----T--
ONN	---E---LV---------------R-N-----------------------
IGB	---E---LV---------------R-N-----------------------
RRV	---AK---V-----X---------R-------------------------
VEE	----QD-L----------------K-N-I------------------Y--
EEE	---LKD------------------KN--I--------F---------Y--
   	.......|
   	ca. domain 2B of PCR, rep

400	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	NENPLYAITSEHVNVLLTRTEDRLVWKTLQGDPWIKQLTNIPKGNFQATI	(VI)  V(AL)(LM)(ST)R
OCK	---A------------------------------------V---------	ts118 lVw>lAw
AR8	----------------------------------------V---------	Toto5NT lethal qLt>qPt
GIR	----------------------------------------V---------	ts19 vLl>vSl
YN8	----------------------------------------V---------	FSATL box
AUR	-------EK--------------I------------Y---V-----T--L
SFV	-------PA--------------------A------V-S---Q---T--L
BFV	-------Q-------------NK------ST-----T---P-R-HYT---
ONN	-------P-------------GK-T----S------I-Q-P---D-K---
IGB	-------S-------------GK-I----S------I-Q-P-----K---
RRV	-------PS------------N-------S------V-------D-S--L
VEE	-------P---------------I-----A------T--AKYP---T---
EEE	-------Q-------------K-I-----A------T--ASYP---T--L
   	          ca. domain 2A of PCR, rep |

450	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	EDWEAEHKGIIAAINSPTPRANPFSCKTNVCWAKALEPILATAGIVLTGC	fsc=PvuII, tag=EagI
OCK	-----------------A--T-----------------------------
AR8	-----------------A--T-----------------------------
GIR	-----------------A--T-------------R---------------
YN8	-----------------A--T-----------------------------
AUR	-E-Q---ED-MK----TSTVSD--AS-V-T-----II---R----E--FE
SFV	-E-QE--DK-MKV-EG-AAPVDA-QN-A------S-V-V-D----R--AE
BFV	AE-----Q--MK--QGYA-PV-T-MN-V------T-T-V-E----S-SAE
ONN	KE-----AS-M-G-CNHQMAFDT-QN-A------C-V---D----K-SDR
IGB	KE-----AS-M-G-CNYQMAFDT-QN-A------C-V---D----K-SDR
RRV	-E-QE--DN-MN-LRERSTAVD--QN-AK-----C-VQV-E----RM-AE
VEE	-E-Q---DA-MRH-LERPDPTDV-QN-A--------V-V-K----DM-TE
EEE	-E-Q---DA-M-K-LETPASSDV-QN-V----------V----N-T--RS

500	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	QWSELFPQFADDKPHSAIYALDVICIKFFGMDLTSGLFSKQSIPLTYHPA	ts18 qFa>qLa
OCK	--------------------------------------------------	ts17 aAi>aTi
AR8	--------------------------------------------------	ts7 lDv>lNv
GIR	--------------------------------------------------
YN8	--------------------------------S-----------------
AUR	--ED-----RN-Q-Y-VM-------T-M-----S--I--RPE----F---
SFV	E--TIITA-KE-RAY-PVV--NE--T-YY-V--D-----APKVS-Y-ENN
BFV	D----L-P--Q-VAY-PEV--NI--T-MY-F--DT----RP-V-M--TKD
ONN	---QIVQA-KE-RAY-PEV--NE--TRIY-V--D------PL-SVY-ADN
IGB	---QIVQA-KE-RAY-PEV--NE--TRIY-V--D------PL-SVY-ADN
RRV	E-DTVL A-RE-RAY-PEV--NE--T-YY-V--D-----A--VS-Y-ENN
VEE	--NTVDY -ET--A---EIV-NQL-VR---L--D-----APTV--SIRNN
EEE	--ETI -A-K---AY-PEM--NFF-TR---V-ID-----APTV--S-TNE

550	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	DSARPVAHWDNSPGTRKYGYDHAIAAELSRRFPVFQLAGK   GTQLDLQ	qla=NheI
OCK	-----------------------V----------------   -------
AR8	-----------------------V----------------   -------
GIR	-----------------------V----------------   -------
YN8	-----------------------V----------------   -------
AUR	-VG-VR--------GQ-F--NK-VIPT CKKY--YLR---   -D-ILPI
SFV	       ----R--G-M--FNA-T--R-EA-HT -LK -QWHT-K-AVIA
BFV	       ----RV-GKM--FSQQAYDQ-A--H- YLR -REKS-M-IVVT
ONN	       ----R--GKMF-FNPEV-LM-EKKY- -TK --WNINK-ICIT
IGB	       ----R--GKMF-FNPEV-LM-EKKY- -TK --WNINK-ICIT
RRV	       ----R--G-M--FNREV-RKFEQ-Y- -LR --MDS-L-VNVP
VEE	       ------SPNM--LNKEVVRQ----Y-QLPR-  VAT-RVY-MN
EEE	       -------PNM--LCMRN-K--A--Y-CILK-  VDT-RVV-VR

600	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	TGRTRVISAQHNLVPVNRNLPHALVPEYKEKQPGPVKKFLNQFKHHSVLV
OCK	---------------------------H--------E-------------
AR8	---------------------------H--------E---S---------
GIR	---------------------------H------------S---------
YN8	---------------------------H--------E---S---------
AUR	Y--VS-P--RN----L------S-TASLQK-EAA-LH-----LPG--M-L
SFV	ERKIQPL-VLD-VI-I--R------A---TVKGSR-EWLV-KVRGYH--L
BFV	EM-IQRPRSDA-II-I--R---S--ATHEYRRAARAEE-FTTTRGYTM-L
ONN	-RKVDEFNPET-II-A--R---S--A-HHSVRGERMEWLV-KISG-HM-L
IGB	-RKVDEFNPET-II-A--R---S--A-HHSVRGERMEWLV-KING-HM-L
RRV	ERK QPFN-EC-ILLL--R------TS-QQCRGER-EWL-KKLPGYHL-L
VEE	--TL-NYDPRI-------R------LHHN-HPQSDFSS-VSKL-GRT---
EEE	-DTIKDYNPLI-V--L--R---S--VTQRYTGN-DYSQLVTKMTGKT---

650	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	VSEEKIEAPRKRIEWIAPIGIAGADKNYNLAFGFPPQ ARYDLVFINIGT
OCK	---------H--------------------------- ------------
AR8	I--K-----H--------------------------- ------------
GIR	---------H--------------------------- ------------
YN8	I--------H--------------------------- ------------
AUR	--K-TCYCVS---T-V--L-VR---H-HD-H-----L S-----VV-M-Q
SFV	---YNLAL--R-VT-LS-LNVT---RC-D-SL-L-ADAG-F----V--H-
BFV	---YNMNL-N-K-T-L----TQ--HHTA--NL-I--LLGSF-A-VV-MP-
ONN	--GHNLIL-T--VT-V--L-TR---YT---EL-L-ATLG-----V---H-
IGB	--GYNLIL-T--VT-V--L-TR---YT---EL-L-ATLG-----V---H-
RRV	---YNLAL-H--VF----PHVS---RI-D-DL-L-LNAG------V--H-
VEE	- G--LSV-G-MVD-LSDRPE  -TFRAR-DL-I-GDVPK--II-V-VR-
EEE	- GTPMNI-G--V-TLGQSPQ  CTYKAE-DL-I-AALGK--II---VR-

700	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	KYRNHHFQQCEDHAATLKTLSRSALNCLNPGGTLVVKSYGYADRNSEDVV	SIN-1 nPg>nSg
OCK	--------------------------------------------------	S1 nPg>nLg
AR8	--------------------------------------------------	ts24 yGy>ySy
GIR	--------------------------------------------------
YN8	--------------------------------------------------
AUR	P--F--Y----E--GLMR--A-------K-----AL-A--F--S------
SFV	EF-I--Y---V---MK-QM-GGD--RL-K---I-M RA-----KI--A--
BFV	PF----Y-------MK-QM-AGD--RHIK---S-W--A------H--H--
ONN	PF-I--Y---V---MK-QM-GGDS-RL-K---S-LIRA------T--R-I
IGB	PF-I--Y---V---MK-QM-GGDS-RL-K---S-LIRA------T--R-I
RRV	E--T--Y---V--SMK-QM-GGDS-HL-X---S-LIRA------V--M--
VEE	P-KY--Y-------IK-SM-TKK-CLH------C-SIG------A--SII
EEE	P--H--Y-------IHHSM-T-K-VDH--K---CIALG--T---AT-NII

750	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	TALARKFVRVSAARPDCVSSNTEMYLIFRQLDNSRTRQFTPHHLNCVISS	saa=PstI
OCK	---------------E----------------------------------	S24 dNs>dKs
AR8	---------------E----------------------------------
GIR	---------------E----------------------------------
YN8	---------------E----------------------------------
AUR	LS-------A--V--S-TQF----FFV------D-E----Q----LAV-N
SFV	SS-S---SSARVL-----T----VF-L-SNF--GK -PS-L-QM-TKL-A
BFV	L------KSFRVTQ-S--T----VF-H-SIF--GK -AIAL-SA-RKAN-
ONN	SV-G---RSSR-LK-Q-IT-----FFL-SRF--G- -N--T-VM-NQLNA
IGB	SV-G---RSSR-LK-Q-IT-----FFL-SRF--G- -N--T-VM-NQLNA
RRV	-------SAFRVL--A--T----VF-L-TNF--G- -AV-L-QA-QRL--
VEE	G-I--Q-KFSRVCK-KSSLEE--VLFV-IGY-RKA -THN-YK-SSTLTN
EEE	S-V--S-RFSRVCQ-K-AWE---VAFV-FGK--GN HLQDQDR-SV-LNN

800	        10        20        30        40        50
   	    :    |    :    |    :    |    :    |    :    |
SIN	VYEG TRDGVGA
OCK	---- -------
AR8	---- -------
GIR	---- -------
YN8	---- -------
AUR	IFDN YK--S--
SFV	--A-EAMHTA-C
BFV	IFQN -FLPA-S
ONN	--A- LATRA-C
IGB	--A- LATRA-C
RRV	MFACNGLHTA-C
VEE	I-T-SRLHEA-C
EEE	I-Q-S-QHEA-R
Unrooted parsimony trees of nsP2 sequences (1855). (Phylip ProtPars 3.573c. Jumble 5x, seed = 9). The three trees are identical except for the clade containing OCK,YN8, AR8, GIR, and SIN.

  +-----------------------------------VEE       -
  !                                             |
  !  +--------------------------------EEE       |
-11  !                                          |
  !  !                    +-----------BFV       |
  !  !                    !                     |
  +-12  +-----------------7        +--IGB       | Same in
     !  !                 !  +-----9            |  all 3
     !  !                 !  !     +--ONN       |  trees
     !  !                 +--8                  |
     !  !                    !     +--RRV       |
     +--6                    +----10            |
        !                          +--SFV       |
        !                                       |
        !              +--------------AUR       -
        !              !  
        +--------------5  +-----------OCK       
                       !  !  
                       +--1        +--YN8       
                          !  +-----4  
                          !  !     +--AR8       
                          +--2  
                             !     +--GIR       
                             +-----3  
                                   +--SIN       
  +-----------------------------------VEE       
  !  
  !  +--------------------------------EEE       
-11  !  
  !  !                    +-----------BFV       
  !  !                    !  
  +-12  +-----------------7        +--IGB       
     !  !                 !  +-----9  
     !  !                 !  !     +--ONN       
     !  !                 +--8  
     !  !                    !     +--RRV       
     +--6                    +----10  
        !                          +--SFV       
        !  
        !              +--------------AUR       
        !              !  
        +--------------5  +-----------OCK       
                       !  !  
                       +--1     +-----GIR       
                          !  +--3  
                          !  !  !  +--YN8       
                          +--2  +--4  
                             !     +--AR8       
                             !  
                             +--------SIN       
  +-----------------------------------VEE       
  !  
  !  +--------------------------------EEE       
-11  !  
  !  !                    +-----------BFV       
  !  !                    !  
  +-12  +-----------------7        +--IGB       
     !  !                 !  +-----9  
     !  !                 !  !     +--ONN       
     !  !                 +--8  
     !  !                    !     +--RRV       
     +--6                    +----10  
        !                          +--SFV       
        !  
        !              +--------------AUR       
        !              !  
        !              !        +-----GIR       
        +--------------5     +--3  
                       !     !  !  +--YN8       
                       !  +--2  +--4  
                       !  !  !     +--AR8       
                       +--1  !  
                          !  +--------OCK       
                          !  
                          +-----------SIN       
Helicase domain (164L to 430Q, inclusively) 15 trees in all. All require 377.

The 15 trees are identical, except for the clade containing OCK, AR8, YN8 and SIN.

The major difference between the results for the helicase domain and the entire nsP2 sequence is that BFV is now in the SIN et al. clade, as versus the SFV et al. clade when the entire sequence is analyzed. The latter result also applies to the amino-terminal domain (residues 1- 163, inclusively), and to the protease domain (431G to carboxyl terminus, inclusively).

  +-----------------------------------VEE   -
  !                                         |
-11  +--------------------------------EEE   |
  !  !                                      |
  !  !                       +--------RRV   |
  +-12                       !              |
     !  +-------------------10     +--IGB   | Same in
     !  !                    !  +--9        |  all 15
     !  !                    +--8  +--ONN   |  trees
     +--6                       !           |
        !                       +-----SFV   |
        !                                   |
        !           +-----------------BFV   |
        +-----------7                       |
                    !  +--------------AUR   |
                    +--5                    |
                       !  +-----------GIR   -
                       +--3  
                          !  +--------OCK       
                          +--1  
                             !  +-----AR8       
                             +--2  
                                !  +--YN8       
                                +--4  
                                   +--SIN       
Protease domain (431G to carboxyl terminus, inclusively) 1 tree. It requires 1136.

  +-----------------------------------VEE       
  !  
  !  +--------------------------------EEE       
-11  !  
  !  !                    +-----------BFV       
  !  !                    !  
  +-12  +-----------------7        +--IGB       
     !  !                 !  +-----9  
     !  !                 !  !     +--ONN       
     !  !                 +--8  
     !  !                    !     +--RRV       
     +--6                    +----10  
        !                          +--SFV       
        !  
        !              +--------------AUR       
        !              !  
        !              !        +-----GIR       
        +--------------5     +--3  
                       !     !  !  +--YN8       
                       !  +--2  +--4  
                       !  !  !     +--AR8       
                       +--1  !  
                          !  +--------OCK       
                          !  
                          +-----------SIN       


Return to Overview of Sindbis virus