Return to Overview of Sindbis virus

Sequence of the genomic RNA of Sindbis virus

(family: Togaviridae, genus: Alphavirus)

 nonstructural proteins  structural proteins 
49S
5' UT
nsP1 nsP2 nsP3 nsP4 Pro-
moter
26S
5'UT
C E3 E2 6K E1 3'UT poly-A

ss (+)RNA genome is shown as the top strand of the ds cDNA
Encoded proteins are shown below the DNA sequence


                    10        20        30        40        50
                :    |    :    |    :    |    :    |    :    |
1           ATTGACGGCGTAGTACACACTATTGAATCAAACAGCCGACCAATTGCACT    50
            TAACTGCCGCATCATGTGTGATAACTTAGTTTGTCGGCTGGTTAACGTGA
49S 5'UT

                :    |    :    |    :    |    :    |    :    |
51          ACCATCACAATGGAGAAGCCAGTAGTAAACGTAGACGTAGACCCCCAGAG    100
            TGGTAGTGTTACCTCTTCGGTCATCATTTGCATCTGCATCTGGGGGTCTC
nsP1                 MetGluLysProValValAsnValAspValAspProGlnSer  14

                :    |    :    |    :    |    :    |    :    |
101         TCCGTTTGTCGTGCAACTGCAAAAAAGCTTCCCGCAATTTGAGGTAGTAG    150
            AGGCAAACAGCACGTTGACGTTTTTTCGAAGGGCGTTAAACTCCATCATC
nsP1         ProPheValValGlnLeuGlnLysSerPheProGlnPheGluValVal    30

                :    |    :    |    :    |    :    |    :    |
151         CACAGCAGGTCACTCCAAATGACCATGCTAATGCCAGAGCATTTTCGCAT    200
            GTGTCGTCCAGTGAGGTTTACTGGTACGATTACGGTCTCGTAAAAGCGTA
nsP1       AlaGlnGlnValThrProAsnAspHisAlaAsnAlaArgAlaPheSerHis   47

                :    |    :    |    :    |    :    |    :    |
201         CTGGCCAGTAAACTAATCGAGCTGGAGGTTCCTACCACAGCGACGATCTT    250
            GACCGGTCATTTGATTAGCTCGACCTCCAAGGATGGTGTCGCTGCTAGAA
nsP1        LeuAlaSerLysLeuIleGluLeuGluValProThrThrAlaThrIleLeu  64

                :    |    :    |    :    |    :    |    :    |
251         GGACATAGGCAGCGCACCGGCTCGTAGAATGTTTTCCGAGCACCAGTATC    300
            CCTGTATCCGTCGCGTGGCCGAGCATCTTACAAAAGGCTCGTGGTCATAG
nsP1         AspIleGlySerAlaProAlaArgArgMetPheSerGluHisGlnTyr    80

                :    |    :    |    :    |    :    |    :    |
301         ATTGTGTCTGCCCCATGCGTAGTCCAGAAGACCCGGACCGCATGATGAAA    350
            TAACACAGACGGGGTACGCATCAGGTCTTCTGGGCCTGGCGTACTACTTT
nsP1       HisCysValCysProMetArgSerProGluAspProAspArgMetMetLys   97

                :    |    :    |    :    |    :    |    :    |
351         TACGCCAGTAAACTGGCGGAAAAAGCGTGCAAGATTACAAACAAGAACTT    400
            ATGCGGTCATTTGACCGCCTTTTTCGCACGTTCTAATGTTTGTTCTTGAA
nsP1        TyrAlaSerLysLeuAlaGluLysAlaCysLysIleThrAsnLysAsnLeu 114

                :    |    :    |    :    |    :    |    :    |
401         GCATGAGAAGATTAAGGATCTCCGGACCGTACTTGATACGCCGGATGCTG    450
            CGTACTCTTCTAATTCCTAGAGGCCTGGCATGAACTATGCGGCCTACGAC
nsP1         HisGluLysIleLysAspLeuArgThrValLeuAspThrProAspAla   130

                :    |    :    |    :    |    :    |    :    |
451         AAACACCATCGCTCTGCTTTCACAACGATGTTACCTGCAACATGCGTGCC    500
            TTTGTGGTAGCGAGACGAAAGTGTTGCTACAATGGACGTTGTACGCACGG
nsP1       GluThrProSerLeuCysPheHisAsnAspValThrCysAsnMetArgAla  147

                :    |    :    |    :    |    :    |    :    |
501         GAATATTCCGTCATGCAGGACGTGTATATCAACGCTCCCGGAACTATCTA    550
            CTTATAAGGCAGTACGTCCTGCACATATAGTTGCGAGGGCCTTGATAGAT
nsP1        GluTyrSerValMetGlnAspValTyrIleAsnAlaProGlyThrIleTyr 164

                :    |    :    |    :    |    :    |    :    |
551         TCATCAGGCTATGAAAGGCGTGCGGACCCTGTACTGGATTGGCTTCGACA    600
            AGTAGTCCGATACTTTCCGCACGCCTGGGACATGACCTAACCGAAGCTGT
nsP1         HisGlnAlaMetLysGlyValArgThrLeuTyrTrpIleGlyPheAsp   180

                :    |    :    |    :    |    :    |    :    |
601         CCACCCAGTTCATGTTCTCGGCTATGGCAGGTTCGTACCCTGCGTACAAC    650
            GGTGGGTCAAGTACAAGAGCCGATACCGTCCAAGCATGGGACGCATGTTG
nsP1       ThrThrGlnPheMetPheSerAlaMetAlaGlySerTyrProAlaTyrAsn  197

                :    |    :    |    :    |    :    |    :    |
651         ACCAACTGGGCCGACGAGAAAGTCCTTGAAGCGCGTAACATCGGACTTTG    700
            TGGTTGACCCGGCTGCTCTTTCAGGAACTTCGCGCATTGTAGCCTGAAAC
nsP1        ThrAsnTrpAlaAspGluLysValLeuGluAlaArgAsnIleGlyLeuCys 214

                :    |    :    |    :    |    :    |    :    |
701         CAGCACAAAGCTGAGTGAAGGTAGGACAGGAAAATTGTCGATAATGAGGA    750
            GTCGTGTTTCGACTCACTTCCATCCTGTCCTTTTAACAGCTATTACTCCT
nsP1         SerThrLysLeuSerGluGlyArgThrGlyLysLeuSerIleMetArg   230

                :    |    :    |    :    |    :    |    :    |
751         AGAAGGAGTTGAAGCCCGGGTCGCGGGTTTATTTCTCCGTAGGATCGACA    800
            TCTTCCTCAACTTCGGGCCCAGCGCCCAAATAAAGAGGCATCCTAGCTGT
nsP1       LysLysGluLeuLysProGlySerArgValTyrPheSerValGlySerThr  247

                :    |    :    |    :    |    :    |    :    |
801         CTTTATCCAGAACACAGAGCCAGCTTGCAGAGCTGGCATCTTCCATCGGT    850
            GAAATAGGTCTTGTGTCTCGGTCGAACGTCTCGACCGTAGAAGGTAGCCA
nsP1        LeuTyrProGluHisArgAlaSerLeuGlnSerTrpHisLeuProSerVal 264

                :    |    :    |    :    |    :    |    :    |
851         GTTCCACTTGAATGGAAAGCAGTCGTACACTTGCCGCTGTGATACAGTGG    900
            CAAGGTGAACTTACCTTTCGTCAGCATGTGAACGGCGACACTATGTCACC
nsP1         PheHisLeuAsnGlyLysGlnSerTyrThrCysArgCysAspThrVal   280

                :    |    :    |    :    |    :    |    :    |
901         TGAGTTGCGAAGGCTACGTAGTGAAGAAAATCACCATCAGTCCCGGGATC    950
            ACTCAACGCTTCCGATGCATCACTTCTTTTAGTGGTAGTCAGGGCCCTAG
nsP1       ValSerCysGluGlyTyrValValLysLysIleThrIleSerProGlyIle  297

                :    |    :    |    :    |    :    |    :    |
951         ACGGGAGAAACCGTGGGATACGCGGTTACACACAATAGCGAGGGCTTCTT   1000
            TGCCCTCTTTGGCACCCTATGCGCCAATGTGTGTTATCGCTCCCGAAGAA
nsP1        ThrGlyGluThrValGlyTyrAlaValThrHisAsnSerGluGlyPheLeu 314

                :    |    :    |    :    |    :    |    :    |
1001        GCTATGCAAAGTTACTGACACAGTAAAAGGAGAACGGGTATCGTTCCCTG   1050
            CGATACGTTTCAATGACTGTGTCATTTTCCTCTTGCCCATAGCAAGGGAC
nsP1         LeuCysLysValThrAspThrValLysGlyGluArgValSerPhePro   330

                :    |    :    |    :    |    :    |    :    |
1051        TGTGCACGTACATCCCGGCCACCATATGCGATCAGATGACTGGTATAATG   1100
            ACACGTGCATGTAGGGCCGGTGGTATACGCTAGTCTACTGACCATATTAC
nsP1       ValCysThrTyrIleProAlaThrIleCysAspGlnMetThrGlyIleMet  347

                :    |    :    |    :    |    :    |    :    |
1101        GCCACGGATATATCACCTGACGATGCACAAAAACTTCTGGTTGGGCTCAA   1150
            CGGTGCCTATATAGTGGACTGCTACGTGTTTTTGAAGACCAACCCGAGTT
nsP1        AlaThrAspIleSerProAspAspAlaGlnLysLeuLeuValGlyLeuAsn 314

                :    |    :    |    :    |    :    |    :    |
1151        CCAGCGAATTGTCATTAACGGTAGGACTAACAGGAACACCAACACCATGC   1200
            GGTCGCTTAACAGTAATTGCCATCCTGATTGTCCTTGTGGTTGTGGTACG
nsP1         GlnArgIleValIleAsnGlyArgThrAsnArgAsnThrAsnThrMet   380

                :    |    :    |    :    |    :    |    :    |
1201        AAAATTACCTTCTGCCGATCATAGCACAAGGGTTCAGCAAATGGGCTAAG   1250
            TTTTAATGGAAGACGGCTAGTATCGTGTTCCCAAGTCGTTTACCCGATTC
nsP1       GlnAsnTyrLeuLeuProIleIleAlaGlnGlyPheSerLysTrpAlaLys  397

                :    |    :    |    :    |    :    |    :    |
1251        GAGCGCAAGGATGATCTTGATAACGAGAAAATGCTGGGTACTAGAGAACG   1300
            CTCGCGTTCCTACTAGAACTATTGCTCTTTTACGACCCATGATCTCTTGC
nsP1        GluArgLysAspAspLeuAspAsnGluLysMetLeuGlyThrArgGluArg 414

                :    |    :    |    :    |    :    |    :    |
1301        CAAGCTTACGTATGGCTGCTTGTGGGCGTTTCGCACTAAGAAAGTACATT   1350
            GTTCGAATGCATACCGACGAACACCCGCAAAGCGTGATTCTTTCATGTAA
nsP1         LysLeuThrTyrGlyCysLeuTrpAlaPheArgThrLysLysValHis   430

                :    |    :    |    :    |    :    |    :    |
1351        CGTTTTATCGCCCACCTGGAACGCAGACCTGCGTAAAAGTCCCAGCCTCT   1400
            GCAAAATAGCGGGTGGACCTTGCGTCTGGACGCATTTTCAGGGTCGGAGA
nsP1       SerPheTyrArgProProGlyThrGlnThrCysValLysValProAlaSer  447

                :    |    :    |    :    |    :    |    :    |
1401        TTTAGCGCTTTTCCCATGTCGTCCGTATGGACGACCTCTTTGCCCATGTC   1450
            AAATCGCGAAAAGGGTACAGCAGGCATACCTGCTGGAGAAACGGGTACAG
nsP1        PheSerAlaPheProMetSerSerValTrpThrThrSerLeuProMetSer 464

                :    |    :    |    :    |    :    |    :    |
1451        GCTGAGGCAGAAATTGAAACTGGCATTGCAACCAAAGAAGGAGGAAAAAC   1500
            CGACTCCGTCTTTAACTTTGACCGTAACGTTGGTTTCTTCCTCCTTTTTG
nsP1         LeuArgGlnLysLeuLysLeuAlaLeuGlnProLysLysGluGluLys   480

                :    |    :    |    :    |    :    |    :    |
1501        TGCTGCAGGTCTCGGAGGAATTAGTCATGGAGGCCAAGGCTGCTTTTGAG   1550
            ACGACGTCCAGAGCCTCCTTAATCAGTACCTCCGGTTCCGACGAAAACTC
nsP1       LeuLeuGlnValSerGluGluLeuValMetGluAlaLysAlaAlaPheGlu  497

                :    |    :    |    :    |    :    |    :    |
1551        GATGCTCAGGAGGAAGCCAGAGCGGAGAAGCTCCGAGAAGCACTTCCACC   1600
            CTACGAGTCCTCCTTCGGTCTCGCCTCTTCGAGGCTCTTCGTGAAGGTGG
nsP1        AspAlaGlnGluGluAlaArgAlaGluLysLeuArgGluAlaLeuProPro 514

                :    |    :    |    :    |    :    |    :    |
1601        ATTAGTGGCAGACAAAGGCATCGAGGCAGCCGCAGAAGTTGTCTGCGAAG   1650
            TAATCACCGTCTGTTTCCGTAGCTCCGTCGGCGTCTTCAACAGACGCTTC
nsP1         LeuValAlaAspLysGlyIleGluAlaAlaAlaGluValValCysGlu   530

                :    |    :    |    :    |    :    |    :    |
1651        TGGAGGGGCTCCAGGCGGACATCGGAGCAGCATTAGTTGAAACCCCGCGC   1700
            ACCTCCCCGAGGTCCGCCTGTAGCCTCGTCGTAATCAACTTTGGGGCGCG
nsP1/2     ValGluGlyLeuGlnAlaAspIleGlyAlaAlaLeuValGluThrProArg  540/7

                :    |    :    |    :    |    :    |    :    |
1701        GGTCACGTAAGGATAATACCTCAAGCAAATGACCGTATGATCGGACAGTA   1750
            CCAGTGCATTCCTATTATGGAGTTCGTTTACTGGCATACTAGCCTGTCAT
nsP2        GlyHisValArgIleIleProGlnAlaAsnAspArgMetIleGlyGlnTyr  24

                :    |    :    |    :    |    :    |    :    |
1751        TATCGTTGTCTCGCCAAACTCTGTGCTGAAGAATGCCAAACTCGCACCAG   1800
            ATAGCAACAGAGCGGTTTGAGACACGACTTCTTACGGTTTGAGCGTGGTC
nsP2         IleValValSerProAsnSerValLeuLysAsnAlaLysLeuAlaPro    40

                :    |    :    |    :    |    :    |    :    |
1801        CGCACCCGCTAGCAGATCAGGTTAAGATCATAACACACTCCGGAAGATCA   1850
            GCGTGGGCGATCGTCTAGTCCAATTCTAGTATTGTGTGAGGCCTTCTAGT
nsP2       AlaHisProLeuAlaAspGlnValLysIleIleThrHisSerGlyArgSer   57

                :    |    :    |    :    |    :    |    :    |
1851        GGAAGGTACGCGGTCGAACCATACGACGCTAAAGTACTGATGCCAGCAGG   1900
            CCTTCCATGCGCCAGCTTGGTATGCTGCGATTTCATGACTACGGTCGTCC
nsP2        GlyArgTyrAlaValGluProTyrAspAlaLysValLeuMetProAlaGly  74

                :    |    :    |    :    |    :    |    :    |
1901        AGGTGCCGTACCATGGCCAGAATTCCTAGCACTGAGTGAGAGCGCCACGT   1950
            TCCACGGCATGGTACCGGTCTTAAGGATCGTGACTCACTCTCGCGGTGCA
nsP2         GlyAlaValProTrpProGluPheLeuAlaLeuSerGluSerAlaThr    90

                :    |    :    |    :    |    :    |    :    |
1951        TAGTGTACAACGAAAGAGAGTTTGTGAACCGCAAACTATACCACATTGCC   2000
            ATCACATGTTGCTTTCTCTCAAACACTTGGCGTTTGATATGGTGTAACGG
nsP2       LeuValTyrAsnGluArgGluPheValAsnArgLysLeuTyrHisIleAla  107

                :    |    :    |    :    |    :    |    :    |
2001        ATGCATGGCCCCGCCAAGAATACAGAAGAGGAGCAGTACAAGGTTACAAA   2050
            TACGTACCGGGGCGGTTCTTATGTCTTCTCCTCGTCATGTTCCAATGTTT
nsP2        MetHisGlyProAlaLysAsnThrGluGluGluGlnTyrLysValThrLys 124

                :    |    :    |    :    |    :    |    :    |
2051        GGCAGAGCTTGCAGAAACAGAGTACGTGTTTGACGTGGACAAGAAGCGTT   2100
            CCGTCTCGAACGTCTTTGTCTCATGCACAAACTGCACCTGTTCTTCGCAA
nsP2         AlaGluLeuAlaGluThrGluTyrValPheAspValAspLysLysArg   140

                :    |    :    |    :    |    :    |    :    |
2101        GCGTTAAGAAGGAAGAAGCCTCAGGTCTGGTCCTCTCGGGAGAACTGACC   2150
            CGCAATTCTTCCTTCTTCGGAGTCCAGACCAGGAGAGCCCTCTTGACTGG
nsP2       CysValLysLysGluGluAlaSerGlyLeuValLeuSerGlyGluLeuThr  157

                :    |    :    |    :    |    :    |    :    |
2151        AACCCTCCCTATCATGAGCTAGCTCTGGAGGGACTGAAGACCCGACCTGC   2200
            TTGGGAGGGATAGTACTCGATCGAGACCTCCCTGACTTCTGGGCTGGACG
nsP2        AsnProProTyrHisGluLeuAlaLeuGluGlyLeuLysThrArgProAla 174

                :    |    :    |    :    |    :    |    :    |
2201        GGTCCCGTACAAGGTCGAAACAATAGGAGTGATAGGCACACCGGGGTCGG   2250
            CCAGGGCATGTTCCAGCTTTGTTATCCTCACTATCCGTGTGGCCCCAGCC
nsP2         ValProTyrLysValGluThrIleGlyValIleGlyThrProGlySer   190

                :    |    :    |    :    |    :    |    :    |
2251        GCAAGTCAGCTATTATCAAGTCAACTGTCACGGCACGAGATCTTGTTACC   2300
            CGTTCAGTCGATAATAGTTCAGTTGACAGTGCCGTGCTCTAGAACAATGG
nsP2       GlyLysSerAlaIleIleLysSerThrValThrAlaArgAspLeuValThr  207

                :    |    :    |    :    |    :    |    :    |
2301        AGCGGAAAGAAAGAAAATTGTCGCGAAATTGAGGCCGACGTGCTAAGACT   2350
            TCGCCTTTCTTTCTTTTAACAGCGCTTTAACTCCGGCTGCACGATTCTGA
nsP2        SerGlyLysLysGluAsnCysArgGluIleGluAlaAspValLeuArgLeu 224

                :    |    :    |    :    |    :    |    :    |
2351        GAGGGGTATGCAGATTACGTCGAAGACAGTAGATTCGGTTATGCTCAACG   2400
            CTCCCCATACGTCTAATGCAGCTTCTGTCATCTAAGCCAATACGAGTTGC
nsP2         ArgGlyMetGlnIleThrSerLysThrValAspSerValMetLeuAsn   240

                :    |    :    |    :    |    :    |    :    |
2401        GATGCCACAAAGCCGTAGAAGTGCTGTACGTTGACGAAGCGTTCGCGTGC   2450
            CTACGGTGTTTCGGCATCTTCACGACATGCAACTGCTTCGCAAGCGCACG
nsP2       GlyCysHisLysAlaValGluValLeuTyrValAspGluAlaPheAlaCys  257

                :    |    :    |    :    |    :    |    :    |
2451        CACGCAGGAGCACTACTTGCCTTGATTGCTATCGTCAGGCCCCGCAAGAA   2500
            GTGCGTCCTCGTGATGAACGGAACTAACGATAGCAGTCCGGGGCGTTCTT
nsP2        HisAlaGlyAlaLeuLeuAlaLeuIleAlaIleValArgProArgLysLys 274

                :    |    :    |    :    |    :    |    :    |
2501        GGTAGTACTATGCGGAGACCCCATGCAATGCGGATTCTTCAACATGATGC   2550
            CCATCATGATACGCCTCTGGGGTACGTTACGCCTAAGAAGTTGTACTACG
nsP2         ValValLeuCysGlyAspProMetGlnCysGlyPhePheAsnMetMet   290

                :    |    :    |    :    |    :    |    :    |
2551        AACTAAAGGTACATTTCAATCACCCTGAAAAAGACATATGCACCAAGACA   2600
            TTGATTTCCATGTAAAGTTAGTGGGACTTTTTCTGTATACGTGGTTCTGT
nsP2       GlnLeuLysValHisPheAsnHisProGluLysAspIleCysThrLysThr  307

                :    |    :    |    :    |    :    |    :    |
2601        TTCTACAAGTATATCTCCCGGCGTTGCACACAGCCAGTTACAGCTATTGT   2650
            AAGATGTTCATATAGAGGGCCGCAACGTGTGTCGGTCAATGTCGATAACA
nsP2        PheTyrLysTyrIleSerArgArgCysThrGlnProValThrAlaIleVal 324

                :    |    :    |    :    |    :    |    :    |
2651        ATCGACACTGCATTACGATGGAAAGATGAAAACCACGAACCCGTGCAAGA   2700
            TAGCTGTGACGTAATGCTACCTTTCTACTTTTGGTGCTTGGGCACGTTCT
nsP2         SerThrLeuHisTyrAspGlyLysMetLysThrThrAsnProCysLys   340

                :    |    :    |    :    |    :    |    :    |
2701        AGAACATTGAAATCGATATTACAGGGGCCACAAAGCCGAAGCCAGGGGAT   2750
            TCTTGTAACTTTAGCTATAATGTCCCCGGTGTTTCGGCTTCGGTCCCCTA
nsP2       LysAsnIleGluIleAspIleThrGlyAlaThrLysProLysProGlyAsp  357

                :    |    :    |    :    |    :    |    :    |
2751        ATCATCCTGACATGTTTCCGCGGGTGGGTTAAGCAATTGCAAATCGACTA   2800
            TAGTAGGACTGTACAAAGGCGCCCACCCAATTCGTTAACGTTTAGCTGAT
nsP2        IleIleLeuThrCysPheArgGlyTrpValLysGlnLeuGlnIleAspTyr 374

                :    |    :    |    :    |    :    |    :    |
2801        TCCCGGACATGAAGTAATGACAGCCGCGGCCTCACAAGGGCTAACCAGAA   2850
            AGGGCCTGTACTTCATTACTGTCGGCGCCGGAGTGTTCCCGATTGGTCTT
nsP2         ProGlyHisGluValMetThrAlaAlaAlaSerGlnGlyLeuThrArg   390

                :    |    :    |    :    |    :    |    :    |
2851        AAGGAGTGTATGCCGTCCGGCAAAAAGTCAATGAAAACCCACTGTACGCG   2900
            TTCCTCACATACGGCAGGCCGTTTTTCAGTTACTTTTGGGTGACATGCGC
nsP2       LysGlyValTyrAlaValArgGlnLysValAsnGluAsnProLeuTyrAla  407

                :    |    :    |    :    |    :    |    :    |
2901        ATCACATCAGAGCATGTGAACGTGTTGCTCACCCGCACTGAGGACAGGCT   2950
            TAGTGTAGTCTCGTACACTTGCACAACGAGTGGGCGTGACTCCTGTCCGA
nsP2        IleThrSerGluHisValAsnValLeuLeuThrArgThrGluAspArgLeu 424

                :    |    :    |    :    |    :    |    :    |
2951        AGTGTGGAAAACCTTGCAGGGCGACCCATGGATTAAGCAGCTCACTAACA   3000
            TCACACCTTTTGGAACGTCCCGCTGGGTACCTAATTCGTCGAGTGATTGT
nsP2         ValTrpLysThrLeuGlnGlyAspProTrpIleLysGlnLeuThrAsn   440

                :    |    :    |    :    |    :    |    :    |
3001        TACCTAAAGGAAACTTTCAGGCTACTATAGAGGACTGGGAAGCTGAACAC   3050
            ATGGATTTCCTTTGAAAGTCCGATGATATCTCCTGACCCTTCGACTTGTG
nsP2       IleProLysGlyAsnPheGlnAlaThrIleGluAspTrpGluAlaGluHis  457

                :    |    :    |    :    |    :    |    :    |
3051        AAGGGAATAATTGCTGCAATAAACAGCCCCACTCCCCGTGCCAATCCGTT   3100
            TTCCCTTATTAACGACGTTATTTGTCGGGGTGAGGGGCACGGTTAGGCAA
nsP2        LysGlyIleIleAlaAlaIleAsnSerProThrProArgAlaAsnProPhe 474

                :    |    :    |    :    |    :    |    :    |
3101        CAGCTGCAAGACCAACGTTTGCTGGGCGAAAGCATTGGAACCGATACTAG   3150
            GTCGACGTTCTGGTTGCAAACGACCCGCTTTCGTAACCTTGGCTATGATC
nsP2         SerCysLysThrAsnValCysTrpAlaLysAlaLeuGluProIleLeu   490

                :    |    :    |    :    |    :    |    :    |
3151        CCACGGCCGGTATCGTACTTACCGGTTGCCAGTGGAGCGAACTGTTCCCA   3200
            GGTGCCGGCCATAGCATGAATGGCCAACGGTCACCTCGCTTGACAAGGGT
nsP2       AlaThrAlaGlyIleValLeuThrGlyCysGlnTrpSerGluLeuPhePro  507

                :    |    :    |    :    |    :    |    :    |
3201        CAGTTTGCGGATGACAAACCACATTCGGCCATTTACGCCTTAGACGTAAT   3250
            GTCAAACGCCTACTGTTTGGTGTAAGCCGGTAAATGCGGAATCTGCATTA
nsP2        GlnPheAlaAspAspLysProHisSerAlaIleTyrAlaLeuAspValIle 524

                :    |    :    |    :    |    :    |    :    |
3251        TTGCATTAAGTTTTTCGGCATGGACTTGACAAGCGGACTGTTTTCTAAAC   3300
            AACGTAATTCAAAAAGCCGTACCTGAACTGTTCGCCTGACAAAAGATTTG
nsP2         CysIleLysPhePheGlyMetAspLeuThrSerGlyLeuPheSerLys   540

                :    |    :    |    :    |    :    |    :    |
3301        AGAGCATCCCACTAACGTACCATCCCGCCGATTCAGCGAGGCCGGTAGCT   3350
            TCTCGTAGGGTGATTGCATGGTAGGGCGGCTAAGTCGCTCCGGCCATCGA
nsP2       GlnSerIleProLeuThrTyrHisProAlaAspSerAlaArgProValAla  567

                :    |    :    |    :    |    :    |    :    |
3351        CATTGGGACAACAGCCCAGGAACCCGCAAGTATGGGTACGATCACGCCAT   3400
            GTAACCCTGTTGTCGGGTCCTTGGGCGTTCATACCCATGCTAGTGCGGTA
nsP2        HisTrpAspAsnSerProGlyThrArgLysTyrGlyTyrAspHisAlaIle 574

                :    |    :    |    :    |    :    |    :    |
3401        TGCCGCCGAACTCTCCCGTAGATTTCCGGTGTTCCAGCTAGCTGGGAAGG   3450
            ACGGCGGCTTGAGAGGGCATCTAAAGGCCACAAGGTCGATCGACCCTTCC
nsP2         AlaAlaGluLeuSerArgArgPheProValPheGlnLeuAlaGlyLys   590

                :    |    :    |    :    |    :    |    :    |
3451        GCACACAACTTGATTTGCAGACGGGGAGAACCAGAGTTATCTCTGCACAG   3500
            CGTGTGTTGAACTAAACGTCTGCCCCTCTTGGTCTCAATAGAGACGTGTC
nsP2       GlyThrGlnLeuAspLeuGlnThrGlyArgThrArgValIleSerAlaGln  607

                :    |    :    |    :    |    :    |    :    |
3501        CATAACCTGGTCCCGGTGAACCGCAATCTTCCTCACGCCTTAGTCCCCGA   3550
            GTATTGGACCAGGGCCACTTGGCGTTAGAAGGAGTGCGGAATCAGGGGCT
nsP2        HisAsnLeuValProValAsnArgAsnLeuProHisAlaLeuValProGlu 624

                :    |    :    |    :    |    :    |    :    |
3551        GTACAAGGAGAAGCAACCCGGCCCGGTCAAAAAATTCTTGAACCAGTTCA   3600
            CATGTTCCTCTTCGTTGGGCCGGGCCAGTTTTTTAAGAACTTGGTCAAGT
nsP2         TyrLysGluLysGlnProGlyProValLysLysPheLeuAsnGlnPhe   640

                :    |    :    |    :    |    :    |    :    |
3601        AACACCACTCAGTACTTGTGGTATCAGAGGAAAAAATTGAAGCTCCCCGT   3650
            TTGTGGTGAGTCATGAACACCATAGTCTCCTTTTTTAACTTCGAGGGGCA
nsP2       LysHisHisSerValLeuValValSerGluGluLysIleGluAlaProArg  657

                :    |    :    |    :    |    :    |    :    |
3651        AAGAGAATCGAATGGATCGCCCCGATTGGCATAGCCGGTGCAGATAAGAA   3700
            TTCTCTTAGCTTACCTAGCGGGGCTAACCGTATCGGCCACGTCTATTCTT
nsP2        LysArgIleGluTrpIleAlaProIleGlyIleAlaGlyAlaAspLysAsn 674

                :    |    :    |    :    |    :    |    :    |
3701        CTACAACCTGGCTTTCGGGTTTCCGCCGCAGGCACGGTACGACCTGGTGT   3750
            GATGTTGGACCGAAAGCCCAAAGGCGGCGTCCGTGCCATGCTGGACCACA
nsP2         TyrAsnLeuAlaPheGlyPheProProGlnAlaArgTyrAspLeuVal   690

                :    |    :    |    :    |    :    |    :    |
3751        TCATCAACATTGGAACTAAATACAGAAACCACCACTTTCAGCAGTGCGAA   3800
            AGTAGTTGTAACCTTGATTTATGTCTTTGGTGGTGAAAGTCGTCACGCTT
nsP2       PheIleAsnIleGlyThrLysTyrArgAsnHisHisPheGlnGlnCysGlu  707

                :    |    :    |    :    |    :    |    :    |
3801        GACCATGCGGCGACCTTAAAAACCCTTTCGCGTTCGGCCCTGAATTGCCT   3850
            CTGGTACGCCGCTGGAATTTTTGGGAAAGCGCAAGCCGGGACTTAACGGA
nsP2        AspHisAlaAlaThrLeuLysThrLeuSerArgSerAlaLeuAsnCysLeu 724

                :    |    :    |    :    |    :    |    :    |
3851        TAACCCAGGAGGCACCCTCGTGGTGAAGTCCTATGGCTACGCCGACCGCA   3900
            ATTGGGTCCTCCGTGGGAGCACCACTTCAGGATACCGATGCGGCTGGCGT
nsP2         AsnProGlyGlyThrLeuValValLysSerTyrGlyTyrAlaAspArg   740

                :    |    :    |    :    |    :    |    :    |
3901        ACAGTGAGGACGTAGTCACCGCTCTTGCCAGAAAGTTTGTCAGGGTGTCT   3950
            TGTCACTCCTGCATCAGTGGCGAGAACGGTCTTTCAAACAGTCCCACAGA
nsP2       AsnSerGluAspValValThrAlaLeuAlaArgLysPheValArgValSer  757

                :    |    :    |    :    |    :    |    :    |
3951        GCAGCGAGACCAGATTGTGTCTCAAGCAATACAGAAATGTACCTGATTTT   4000
            CGTCGCTCTGGTCTAACACAGAGTTCGTTATGTCTTTACATGGACTAAAA
nsP2        AlaAlaArgProAspCysValSerSerAsnThrGluMetTyrLeuIlePhe 774

                :    |    :    |    :    |    :    |    :    |
4001        CCGACAACTAGACAACAGCCGTACACGGCAATTCACCCCGCACCATCTGA   4050
            GGCTGTTGATCTGTTGTCGGCATGTGCCGTTAAGTGGGGCGTGGTAGACT
nsP2         ArgGlnLeuAspAsnSerArgThrArgGlnPheThrProHisHisLeu   790

                :    |    :    |    :    |    :    |    :    |
4051        ATTGCGTGATTTCGTCCGTGTATGAGGGTACAAGAGATGGAGTTGGAGCC   4100
            TAACGCACTAAAGCAGGCACATACTCCCATGTTCTCTACCTCAACCTCGG
nsP2       AsnCysValIleSerSerValTyrGluGlyThrArgAspGlyValGlyAla  807

                :    |    :    |    :    |    :    |    :    |
4101        GCGCCGTCATACCGCACCAAAAGGGAGAATATTGCTGACTGTCAAGAGGA   4150
            CGCGGCAGTATGGCGTGGTTTTCCCTCTTATAACGACTGACAGTTCTCCT
nsP3        AlaProSerTyrArgThrLysArgGluAsnIleAlaAspCysGlnGluGlu  17

                :    |    :    |    :    |    :    |    :    |
4151        AGCAGTTGTCAACGCAGCCAATCCGCTGGGTAGACCAGGCGAAGGAGTCT   4200
            TCGTCAACAGTTGCGTCGGTTAGGCGACCCATCTGGTCCGCTTCCTCAGA
nsP3         AlaValValAsnAlaAlaAsnProLeuGlyArgProGlyGluGlyVal    33

                :    |    :    |    :    |    :    |    :    |
4201        GCCGTGCCATCTATAAACGTTGGCCGACCAGTTTTACCGATTCAGCCACG   4250
            CGGCACGGTAGATATTTGCAACCGGCTGGTCAAAATGGCTAAGTCGGTGC
nsP3       CysArgAlaIleTyrLysArgTrpProThrSerPheThrAspSerAlaThr   50

                :    |    :    |    :    |    :    |    :    |
4251        GAGACAGGCACCGCAAGAATGACTGTGTGCCTAGGAAAGAAAGTGATCCA   4300
            CTCTGTCCGTGGCGTTCTTACTGACACACGGATCCTTTCTTTCACTAGGT
nsP3        GluThrGlyThrAlaArgMetThrValCysLeuGlyLysLysValIleHis  67

                :    |    :    |    :    |    :    |    :    |
4301        CGCGGTCGGCCCTGATTTCCGGAAGCACCCAGAAGCAGAAGCCTTGAAAT   4350
            GCGCCAGCCGGGACTAAAGGCCTTCGTGGGTCTTCGTCTTCGGAACTTTA
nsP3         AlaValGlyProAspPheArgLysHisProGluAlaGluAlaLeuLys    83

                :    |    :    |    :    |    :    |    :    |
4351        TGCTACAAAACGCCTACCATGCAGTGGCAGACTTAGTAAATGAACATAAC   4400
            ACGATGTTTTGCGGATGGTACGTCACCGTCTGAATCATTTACTTGTATTG
nsP3       LeuLeuGlnAsnAlaTyrHisAlaValAlaAspLeuValAsnGluHisAsn  100

                :    |    :    |    :    |    :    |    :    |
4401        ATCAAGTCTGTCGCCATTCCACTGCTATCTACAGGCATTTACGCAGCCGG   4450
            TAGTTCAGACAGCGGTAAGGTGACGATAGATGTCCGTAAATGCGTCGGCC
nsP3        IleLysSerValAlaIleProLeuLeuSerThrGlyIleTyrAlaAlaGly 117

                :    |    :    |    :    |    :    |    :    |
4451        AAAAGACCGCCTTGAAGTATCACTTAACTGCTTGACAACCGCGCTAGACA   4500
            TTTTCTGGCGGAACTTCATAGTGAATTGACGAACTGTTGGCGCGATCTGT
nsP3         LysAspArgLeuGluValSerLeuAsnCysLeuThrThrAlaLeuAsp   133

                :    |    :    |    :    |    :    |    :    |
4501        GAACTGACGCGGACGTAACCATCTATTGCCTGGATAAGAAGTGGAAGGAA   4550
            CTTGACTGCGCCTGCATTGGTAGATAACGGACCTATTCTTCACCTTCCTT
nsP3       ArgThrAspAlaAspValThrIleTyrCysLeuAspLysLysTrpLysGlu  150

                :    |    :    |    :    |    :    |    :    |
4551        AGAATCGACGCGGCACTCCAACTTAAGGAGTCTGTAACAGAGCTGAAGGA   4600
            TCTTAGCTGCGCCGTGAGGTTGAATTCCTCAGACATTGTCTCGACTTCCT
nsP3        ArgIleAspAlaAlaLeuGlnLeuLysGluSerValThrGluLeuLysAsp 167

                :    |    :    |    :    |    :    |    :    |
4601        TGAAGATATGGAGATCGACGATGAGTTAGTATGGATCCATCCAGACAGTT   4650
            ACTTCTATACCTCTAGCTGCTACTCAATCATACCTAGGTAGGTCTGTCAA
nsP3         GluAspMetGluIleAspAspGluLeuValTrpIleHisProAspSer   183

                :    |    :    |    :    |    :    |    :    |
4651        GCTTGAAGGGAAGAAAGGGATTCAGTACTACAAAAGGAAAATTGTATTCG   4700
            CGAACTTCCCTTCTTTCCCTAAGTCATGATGTTTTCCTTTTAACATAAGC
nsP3       CysLeuLysGlyArgLysGlyPheSerThrThrLysGlyLysLeuTyrSer  200

                :    |    :    |    :    |    :    |    :    |
4701        TACTTCGAAGGCACCAAATTCCATCAAGCAGCAAAAGACATGGCGGAGAT   4750
            ATGAAGCTTCCGTGGTTTAAGGTAGTTCGTCGTTTTCTGTACCGCCTCTA
nsP3        TyrPheGluGlyThrLysPheHisGlnAlaAlaLysAspMetAlaGluIle 217

                :    |    :    |    :    |    :    |    :    |
4751        AAAGGTCCTGTTCCCTAATGACCAGGAAAGTAATGAACAACTGTGTGCCT   4800
            TTTCCAGGACAAGGGATTACTGGTCCTTTCATTACTTGTTGACACACGGA
nsP3         LysValLeuPheProAsnAspGlnGluSerAsnGluGlnLeuCysAla   233

                :    |    :    |    :    |    :    |    :    |
4801        ACATATTGGGTGAGACCATGGAAGCAATCCGCGAAAAGTGCCCGGTCGAC   4850
            TGTATAACCCACTCTGGTACCTTCGTTAGGCGCTTTTCACGGGCCAGCTG
nsP3       TyrIleLeuGlyGluThrMetGluAlaIleArgGluLysCysProValAsp  250

                :    |    :    |    :    |    :    |    :    |
4851        CATAACCCGTCGTCTAGCCCGCCCAAAACGTTGCCGTGCCTTTGCATGTA   4900
            GTATTGGGCAGCAGATCGGGCGGGTTTTGCAACGGCACGGAAACGTACAT
nsP3        HisAsnProSerSerSerProProLysThrLeuProCysLeuCysMetTyr 267

                :    |    :    |    :    |    :    |    :    |
4901        TGCCATGACGCCAGAAAGGGTCCACAGACTTAGAAGCAATAACGTCAAAG   4950
            ACGGTACTGCGGTCTTTCCCAGGTGTCTGAATCTTCGTTATTGCAGTTTC
nsP3         AlaMetThrProGluArgValHisArgLeuArgSerAsnAsnValLys   283

                :    |    :    |    :    |    :    |    :    |
4951        AAGTTACAGTATGCTCCTCCACCCCCCTTCCTAAGCACAAAATTAAGAAT   5000
            TTCAATGTCATACGAGGAGGTGGGGGGAAGGATTCGTGTTTTAATTCTTA
nsP3       GluValThrValCysSerSerThrProLeuProLysHisLysIleLysAsn  300

                :    |    :    |    :    |    :    |    :    |
5001        GTTCAGAAGGTTCAGTGCACGAAAGTAGTCCTGTTTAATCCGCACACTCC   5050
            CAAGTCTTCCAAGTCACGTGCTTTCATCAGGACAAATTAGGCGTGTGAGG
nsP3        ValGlnLysValGlnCysThrLysValValLeuPheAsnProHisThrPro 317

                :    |    :    |    :    |    :    |    :    |
5051        CGCATTCGTTCCCGCCCGTAAGTACATAGAAGTGCCAGAACAGCCTACCG   5100
            GCGTAAGCAAGGGCGGGCATTCATGTATCTTCACGGTCTTGTCGGATGGC
nsP3         AlaPheValProAlaArgLysTyrIleGluValProGluGlnProThr   333

                :    |    :    |    :    |    :    |    :    |
5101        CTCCTCCTGCACAGGCCGAGGAGGCCCCCGAAGTTGTAGCGACACCGTCA   5150
            GAGGAGGACGTGTCCGGCTCCTCCGGGGGCTTCAACATCGCTGTGGCAGT
nsP3       AlaProProAlaGlnAlaGluGluAlaProGluValValAlaThrProSer  350

                :    |    :    |    :    |    :    |    :    |
5151        CCATCTACAGCTGATAACACCTCGCTTGATGTCACAGACATCTCACTGGA   5200
            GGTAGATGTCGACTATTGTGGAGCGAACTACAGTGTCTGTAGAGTGACCT
nsP3        ProSerThrAlaAspAsnThrSerLeuAspValThrAspIleSerLeuAsp 367

                :    |    :    |    :    |    :    |    :    |
5201        TATGGATGACAGTAGCGAAGGCTCACTTTTTTCGAGCTTTAGCGGATCGG   5250
            ATACCTACTGTCATCGCTTCCGAGTGAAAAAAGCTCGAAATCGCCTAGCC
nsP3         MetAspAspSerSerGluGlySerLeuPheSerSerPheSerGlySer   383

                :    |    :    |    :    |    :    |    :    |
5251        ACAACTCTATTACTAGTATGGACAGTTGGTCGTCAGGACCTAGTTCACTA   5300
            TGTTGAGATAATGATCATACCTGTCAACCAGCAGTCCTGGATCAAGTGAT
nsP3       AspAsnSerIleThrSerMetAspSerTrpSerSerGlyProSerSerLeu  400

                :    |    :    |    :    |    :    |    :    |
5301        GAGATAGTAGACCGAAGGCAGGTGGTGGTGGCTGACGTTCATGCCGTCCA   5350
            CTCTATCATCTGGCTTCCGTCCACCACCACCGACTGCAAGTACGGCAGGT
nsP3        GluIleValAspArgArgGlnValValValAlaAspValHisAlaValGln 417

                :    |    :    |    :    |    :    |    :    |
5351        AGAGCCTGCCCCTATTCCACCGCCAAGGCTAAAGAAGATGGCCCGCCTGG   5400
            TCTCGGACGGGGATAAGGTGGCGGTTCCGATTTCTTCTACCGGGCGGACC
nsP3         GluProAlaProIleProProProArgLeuLysLysMetAlaArgLeu   433

                :    |    :    |    :    |    :    |    :    |
5401        CAGCGGCAAGAAAAGAGCCCACTCCACCGGCAAGCAATAGCTCTGAGTCC   5450
            GTCGCCGTTCTTTTCTCGGGTGAGGTGGCCGTTCGTTATCGAGACTCAGG
nsP3       AlaAlaAlaArgLysGluProThrProProAlaSerAsnSerSerGluSer  450

                :    |    :    |    :    |    :    |    :    |
5451        CTCCACCTCTCTTTTGGTGGGGTATCCATGTCCCTCGGATCAATTTTCGA   5500
            GAGGTGGAGAGAAAACCACCCCATAGGTACAGGGAGCCTAGTTAAAAGCT
nsP3        LeuHisLeuSerPheGlyGlyValSerMetSerLeuGlySerIlePheAsp 467

                :    |    :    |    :    |    :    |    :    |
5501        CGGAGAGACGGCCCGCCAGGCAGCGGTACAACCCCTGGCAACAGGCCCCA   5550
            GCCTCTCTGCCGGGCGGTCCGTCGCCATGTTGGGGACCGTTGTCCGGGGT
nsP3         GlyGluThrAlaArgGlnAlaAlaValGlnProLeuAlaThrGlyPro   483

                :    |    :    |    :    |    :    |    :    |
5551        CGGATGTGCCTATGTCTTTCGGATCGTTTTCCGACGGAGAGATTGATGAG   5600
            GCCTACACGGATACAGAAAGCCTAGCAAAAGGCTGCCTCTCTAACTACTC
nsP3       ThrAspValProMetSerPheGlySerPheSerAspGlyGluIleAspGlu  500

                :    |    :    |    :    |    :    |    :    |
5601        CTGAGCCGCAGAGTAACTGAGTCCGAACCCGTCCTGTTTGGATCATTTGA   5650
            GACTCGGCGTCTCATTGACTCAGGCTTGGGCAGGACAAACCTAGTAAACT
nsP3        LeuSerArgArgValThrGluSerGluProValLeuPheGlySerPheGlu 517

                :    |    :    |    :    |    :    |    :    |
5651        ACCGGGCGAAGTGAACTCAATTATATCGTCCCGATCAGCCGTATCTTTTC   5700
            TGGCCCGCTTCACTTGAGTTAATATAGCAGGGCTAGTCGGCATAGAAAAG
nsP3         ProGlyGluValAsnSerIleIleSerSerArgSerAlaValSerPhe   533

                :    |    :    |    :    |    :    |    :    |
5701        CACTACGCAAGCAGAGACGTAGACGCAGGAGCAGGAGGACTGAATACTGA   5750
            GTGATGCGTTCGTCTCTGCATCTGCGTCCTCGTCCTCCTGACTTATGACT
nsP3       ProLeuArgLysGlnArgArgArgArgArgSerArgArgThrGluTyrtrm  549

                :    |    :    |    :    |    :    |    :    |
5751        CTAACCGGGGTAGGTGGGTACATATTTTCGACGGACACAGGCCCTGGGCA   5800
            GATTGGCCCCATCCACCCATGTATAAAAGCTGCCTGTGTCCGGGACCCGT
nsP4        LeuThrGlyValGlyGlyTyrIlePheSerThrAspThrGlyProGlyHis  17

                :    |    :    |    :    |    :    |    :    |
5801        CTTGCAAAAGAAGTCCGTTCTGCAGAACCAGCTTACAGAACCGACCTTGG   5850
            GAACGTTTTCTTCAGGCAAGACGTCTTGGTCGAATGTCTTGGCTGGAACC
nsP4         LeuGlnLysLysSerValLeuGlnAsnGlnLeuThrGluProThrLeu    33

                :    |    :    |    :    |    :    |    :    |
5851        AGCGCAATGTCCTGGAAAGAATTCATGCCCCGGTGCTCGACACGTCGAAA   5900
            TCGCGTTACAGGACCTTTCTTAAGTACGGGGCCACGAGCTGTGCAGCTTT
nsP4       GluArgAsnValLeuGluArgIleHisAlaProValLeuAspThrSerLys   50

                :    |    :    |    :    |    :    |    :    |
5901        GAGGAACAACTCAAACTCAGGTACCAGATGATGCCCACCGAAGCCAACAA   5950
            CTCCTTGTTGAGTTTGAGTCCATGGTCTACTACGGGTGGCTTCGGTTGTT
nsP4        GluGluGlnLeuLysLeuArgTyrGlnMetMetProThrGluAlaAsnLys  67

                :    |    :    |    :    |    :    |    :    |
5951        AAGTAGGTACCAGTCTCGTAAAGTAGAAAATCAGAAAGCCATAACCACTG   6000
            TTCATCCATGGTCAGAGCATTTCATCTTTTAGTCTTTCGGTATTGGTGAC
nsP4         SerArgTyrGlnSerArgLysValGluAsnGlnLysAlaIleThrThr    83

                :    |    :    |    :    |    :    |    :    |
6001        AGCGACTACTGTCAGGACTACGACTGTATAACTCTGCCACAGATCAGCCA   6050
            TCGCTGATGACAGTCCTGATGCTGACATATTGAGACGGTGTCTAGTCGGT
nsP4       GluArgLeuLeuSerGlyLeuArgLeuTyrAsnSerAlaThrAspGlnPro  100

                :    |    :    |    :    |    :    |    :    |
6051        GAATGCTATAAGATCACCTATCCGAAACCATTGTACTCCAGTAGCGTACC   6100
            CTTACGATATTCTAGTGGATAGGCTTTGGTAACATGAGGTCATCGCATGG
nsP4        GluCysTyrLysIleThrTyrProLysProLeuTyrSerSerSerValPro 117

                :    |    :    |    :    |    :    |    :    |
6101        GGCGAACTACTCCGATCCACAGTTCGCTGTAGCTGTCTGTAACAACTATC   6150
            CCGCTTGATGAGGCTAGGTGTCAAGCGACATCGACAGACATTGTTGATAG
nsP4         AlaAsnTyrSerAspProGlnPheAlaValAlaValCysAsnAsnTyr   133

                :    |    :    |    :    |    :    |    :    |
6151        TGCATGAGAACTATCCGACAGTAGCATCTTATCAGATTACTGACGAGTAC   6200
            ACGTACTCTTGATAGGCTGTCATCGTAGAATAGTCTAATGACTGCTCATG
nsP4       LeuHisGluAsnTyrProThrValAlaSerTyrGlnIleThrAspGluTyr  150

                :    |    :    |    :    |    :    |    :    |
6201        GATGCTTACTTGGATATGGTAGACGGGACAGTCGCCTGCCTGGATACTGC   6250
            CTACGAATGAACCTATACCATCTGCCCTGTCAGCGGACGGACCTATGACG
nsP4        AspAlaTyrLeuAspMetValAspGlyThrValAlaCysLeuAspThrAla 167

                :    |    :    |    :    |    :    |    :    |
6251        AACCTTCTGCCCCGCTAAGCTTAGAAGTTACCCGAAAAAACATGAGTATA   6300
            TTGGAAGACGGGGCGATTCGAATCTTCAATGGGCTTTTTTGTACTCATAT
nsP4         ThrPheCysProAlaLysLeuArgSerTyrProLysLysHisGluTyr   183

                :    |    :    |    :    |    :    |    :    |
6301        GAGCCCCGAATATCCGCAGTGCGGTTCCATCAGCGATGCAGAACACGCTA   6350
            CTCGGGGCTTATAGGCGTCACGCCAAGGTAGTCGCTACGTCTTGTGCGAT
nsP4       ArgAlaProAsnIleArgSerAlaValProSerAlaMetGlnAsnThrLeu  200

                :    |    :    |    :    |    :    |    :    |
6351        CAAAATGTGCTCATTGCCGCAACTAAAAGAAATTGCAACGTCACGCAGAT   6400
            GTTTTACACGAGTAACGGCGTTGATTTTCTTTAACGTTGCAGTGCGTCTA
nsP4        GlnAsnValLeuIleAlaAlaThrLysArgAsnCysAsnValThrGlnMet 217

                :    |    :    |    :    |    :    |    :    |
6401        GCGTGAACTGCCAACACTGGACTCAGCGACATTCAATGTCGAATGCTTTC   6450
            CGCACTTGACGGTTGTGACCTGAGTCGCTGTAAGTTACAGCTTACGAAAG
nsP4         ArgGluLeuProThrLeuAspSerAlaThrPheAsnValGluCysPhe   233

                :    |    :    |    :    |    :    |    :    |
6451        GAAAATATGCATGTAATGACGAGTATTGGGAGGAGTTCGCTCGGAAGCCA   6500
            CTTTTATACGTACATTACTGCTCATAACCCTCCTCAAGCGAGCCTTCGGT
nsP4       ArgLysTyrAlaCysAsnAspGluTyrTrpGluGluPheAlaArgLysPro  250

                :    |    :    |    :    |    :    |    :    |
6501        ATTAGGATTACCACTGAGTTTGTCACCGCATATGTAGCTAGACTGAAAGG   6550
            TAATCCTAATGGTGACTCAAACAGTGGCGTATACATCGATCTGACTTTCC
nsP4        IleArgIleThrThrGluPheValThrAlaTyrValAlaArgLeuLysGly 267

                :    |    :    |    :    |    :    |    :    |
6551        CCCTAAGGCCGCCGCACTATTTGCAAAGACGTATAATTTGGTCCCATTGC   6600
            GGGATTCCGGCGGCGTGATAAACGTTTCTGCATATTAAACCAGGGTAACG
nsP4         ProLysAlaAlaAlaLeuPheAlaLysThrTyrAsnLeuValProLeu   283

                :    |    :    |    :    |    :    |    :    |
6601        AAGAAGTGCCTATGGATAGATTCGTCATGGACATGAAAAGAGACGTGAAA   6650
            TTCTTCACGGATACCTATCTAAGCAGTACCTGTACTTTTCTCTGCACTTT
nsP4       GlnGluValProMetAspArgPheValMetAspMetLysArgAspValLys  300

                :    |    :    |    :    |    :    |    :    |
6651        GTTACACCAGGCACGAAACACACAGAAGAAAGACCGAAAGTACAAGTGAT   6700
            CAATGTGGTCCGTGCTTTGTGTGTCTTCTTTCTGGCTTTCATGTTCACTA
nsP4        ValThrProGlyThrLysHisThrGluGluArgProLysValGlnValIle 317

                :    |    :    |    :    |    :    |    :    |
6701        ACAAGCCGCAGAACCCCTGGCGACTGCTTACTTATGCGGGATTCACCGGG   6750
            TGTTCGGCGTCTTGGGGACCGCTGACGAATGAATACGCCCTAAGTGGCCC
nsP4         GlnAlaAlaGluProLeuAlaThrAlaTyrLeuCysGlyIleHisArg   333

                :    |    :    |    :    |    :    |    :    |
6751        AATTAGTGCGTAGGCTTACGGCCGTCTTGCTTCCAAACATTCACACGCTT   6800
            TTAATCACGCATCCGAATGCCGGCAGAACGAAGGTTTGTAAGTGTGCGAA
nsP4       GluLeuValArgArgLeuThrAlaValLeuLeuProAsnIleHisThrLeu  350

                :    |    :    |    :    |    :    |    :    |
6801        TTTGACATGTCGGCGGAGGATTTTGATGCAATCATAGCAGAACACTTCAA   6850
            AAACTGTACAGCCGCCTCCTAAAACTACGTTAGTATCGTCTTGTGAAGTT
nsP4        PheAspMetSerAlaGluAspPheAspAlaIleIleAlaGluHisPheLys 367

                :    |    :    |    :    |    :    |    :    |
6851        GCAAGGCGACCCGGTACTGGAGACGGATATCGCATCATTCGACAAAAGCC   6900
            CGTTCCGCTGGGCCATGACCTCTGCCTATAGCGTAGTAAGCTGTTTTCGG
nsP4         GlnGlyAspProValLeuGluThrAspIleAlaSerPheAspLysSer   383

                :    |    :    |    :    |    :    |    :    |
6901        AAGACGACGCTATGGCGTTAACCGGTCTGATGATCTTGGAGGACCTGGGT   6950
            TTCTGCTGCGATACCGCAATTGGCCAGACTACTAGAACCTCCTGGACCCA
nsP4       GlnAspAspAlaMetAlaLeuThrGlyLeuMetIleLeuGluAspLeuGly  400

                :    |    :    |    :    |    :    |    :    |
6951        GTGGATCAACCACTACTCGACTTGATCGAGTGCGCCTTTGGAGAAATATC   7000
            CACCTAGTTGGTGATGAGCTGAACTAGCTCACGCGGAAACCTCTTTATAG
nsP4        ValAspGlnProLeuLeuAspLeuIleGluCysAlaPheGlyGluIleSer 417

                :    |    :    |    :    |    :    |    :    |
7001        ATCCACCCATCTACCTACGGGTACTCGTTTTAAATTCGGGGCGATGATGA   7050
            TAGGTGGGTAGATGGATGCCCATGAGCAAAATTTAAGCCCCGCTACTACT
nsP4         SerThrHisLeuProThrGlyThrArgPheLysPheGlyAlaMetMet   433

                :    |    :    |    :    |    :    |    :    |
7051        AATCCGGAATGTTCCTCACACTTTTTGTCAACACAGTTTTGAATGTCGTT   7100
            TTAGGCCTTACAAGGAGTGTGAAAAACAGTTGTGTCAAAACTTACAGCAA
nsP4       LysSerGlyMetPheLeuThrLeuPheValAsnThrValLeuAsnValVal  450

                :    |    :    |    :    |    :    |    :    |
7101        ATCGCCAGCAGAGTACTAGAAGAGCGGCTTAAAACGTCCAGATGTGCAGC   7150
            TAGCGGTCGTCTCATGATCTTCTCGCCGAATTTTGCAGGTCTACACGTCG
nsP4        IleAlaSerArgValLeuGluGluArgLeuLysThrSerArgCysAlaAla 467

                :    |    :    |    :    |    :    |    :    |
7151        GTTCATTGGCGACGACAACATCATACATGGAGTAGTATCTGACAAAGAAA   7200
            CAAGTAACCGCTGCTGTTGTAGTATGTACCTCATCATAGACTGTTTCTTT
nsP4         PheIleGlyAspAspAsnIleIleHisGlyValValSerAspLysGlu   483

                :    |    :    |    :    |    :    |    :    |
7201        TGGCTGAGAGGTGCGCCACCTGGCTCAACATGGAGGTTAAGATCATCGAC   7250
            ACCGACTCTCCACGCGGTGGACCGAGTTGTACCTCCAATTCTAGTAGCTG
nsP4       MetAlaGluArgCysAlaThrTrpLeuAsnMetGluValLysIleIleAsp  500

                :    |    :    |    :    |    :    |    :    |
7251        GCAGTCATCGGTGAGAGACCACCTTACTTCTGCGGCGGATTTATCTTGCA   7300
            CGTCAGTAGCCACTCTCTGGTGGAATGAAGACGCCGCCTAAATAGAACGT
nsP4        AlaValIleGlyGluArgProProTyrPheCysGlyGlyPheIleLeuGln 517

                :    |    :    |    :    |    :    |    :    |
7301        AGATTCGGTTACTTCCACAGCGTGCCGCGTGGCGGATCCCCTGAAAAGGC   7350
            TCTAAGCCAATGAAGGTGTCGCACGGCGCACCGCCTAGGGGACTTTTCCG
nsP4         AspSerValThrSerThrAlaCysArgValAlaAspProLeuLysArg   533

                :    |    :    |    :    |    :    |    :    |
7351        TGTTTAAGTTGGGTAAACCGCTCCCAGCCGACGACGAGCAAGACGAAGAC   7400
            ACAAATTCAACCCATTTGGCGAGGGTCGGCTGCTGCTCGTTCTGCTTCTG
nsP4       LeuPheLysLeuGlyLysProLeuProAlaAspAspGluGlnAspGluAsp  550

                :    |    :    |    :    |    :    |    :    |
7401        AGAAGACGCGCTCTGCTAGATGAAACAAAGGCGTGGTTTAGAGTAGGTAT   7450
            TCTTCTGCGCGAGACGATCTACTTTGTTTCCGCACCAAATCTCATCCATA
nsP4        ArgArgArgAlaLeuLeuAspGluThrLysAlaTrpPheArgValGlyIle 567

                :    |    :    |    :    |    :    |    :    |
7451        AACAGGCACTTTAGCAGTGGCCGTGACGACCCGGTATGAGGTAGACAATA   7500
            TTGTCCGTGAAATCGTCACCGGCACTGCTGGGCCATACTCCATCTGTTAT
nsP4         ThrGlyThrLeuAlaValAlaValThrThrArgTyrGluValAspAsn   583

                :    |    :    |    :    |    :    |    :    |
7501        TTACACCTGTCCTACTGGCATTGAGAACTTTTGCCCAGAGCAAAAGAGCA   7550
            AATGTGGACAGGATGACCGTAACTCTTGAAAACGGGTCTCGTTTTCTCGT
nsP4       IleThrProValLeuLeuAlaLeuArgThrPheAlaGlnSerLysArgAla  600

                :    |    :    |    :    |    :    |    :    |
7551        TTCCAAGCCATCAGAGGGGAAATAAAGCATCTCTACGGTGGTCCTAAATA   7600 Promoter
            AAGGTTCGGTAGTCTCCCCTTTATTTCGTAGAGATGCCACCAGGATTTAT
nsP4        PheGlnAlaIleArgGlyGluIleLysHisLeuTyrGlyGlyProLystrm 616

                :    |    :    |    :    |    :    |    :    |
7601        GTCAGCATAGTACATTTCATCTGACTAATACTACAACACCACCACCATGA   7650
            CAGTCGTATCATGTAAAGTAGACTGATTATGATGTTGTGGTGGTGGTACT
26S 5'UT/C                                                Met     1

                :    |    :    |    :    |    :    |    :    |
7651        ATAGAGGATTCTTTAACATGCTCGGCCGCCGCCCCTTCCCGGCCCCCACT   7700
            TATCTCCTAAGAAATTGTACGAGCCGGCGGCGGGGAAGGGCCGGGGGTGA
C          AsnArgGlyPhePheAsnMetLeuGlyArgArgProPheProAlaProThr   18

                :    |    :    |    :    |    :    |    :    |
7701        GCCATGTGGAGGCCGCGGAGAAGGAGGCAGGCGGCCCCGATGCCTGCCCG   7750
            CGGTACACCTCCGGCGCCTCTTCCTCCGTCCGCCGGGGCTACGGACGGGC
C           AlaMetTrpArgProArgArgArgArgGlnAlaAlaProMetProAlaArg  35

                :    |    :    |    :    |    :    |    :    |
7751        CAACGGGCTGGCTTCTCAAATCCAGCAACTGACCACAGCCGTCAGTGCCC   7800
            GTTGCCCGACCGAAGAGTTTAGGTCGTTGACTGGTGTCGGCAGTCACGGG
C            AsnGlyLeuAlaSerGlnIleGlnGlnLeuThrThrAlaValSerAla    51

                :    |    :    |    :    |    :    |    :    |
7801        TAGTCATTGGACAGGCAACTAGACCTCAACCCCCACGTCCACGCCCGCCA   7850
            ATCAGTAACCTGTCCGTTGATCTGGAGTTGGGGGTGCAGGTGCGGGCGGT
C          LeuValIleGlyGlnAlaThrArgProGlnProProArgProArgProPro   68

                :    |    :    |    :    |    :    |    :    |
7851        CCGCGCCAGAAGAAGCAGGCGCCCAAGCAACCACCGAAGCCGAAGAAACC   7900
            GGCGCGGTCTTCTTCGTCCGCGGGTTCGTTGGTGGCTTCGGCTTCTTTGG
C           ProArgGlnLysLysGlnAlaProLysGlnProProLysProLysLysPro  85

                :    |    :    |    :    |    :    |    :    |
7901        AAAAACGCAGGAGAAGAAGAAGAAGCAACCTGCAAAACCCAAACCCGGAA   7950
            TTTTTGCGTCCTCTTCTTCTTCTTCGTTGGACGTTTTGGGTTTGGGCCTT
C            LysThrGlnGluLysLysLysLysGlnProAlaLysProLysProGly   101

                :    |    :    |    :    |    :    |    :    |
7951        AGAGACAGCGCATGGCACTTAAGTTGGAGGCCGACAGATTGTTCGACGTC   8000
            TCTCTGTCGCGTACCGTGAATTCAACCTCCGGCTGTCTAACAAGCTGCAG
C          LysArgGlnArgMetAlaLeuLysLeuGluAlaAspArgLeuPheAspVal  118

                :    |    :    |    :    |    :    |    :    |
8001        AAGAACGAGGACGGAGATGTCATCGGGCACGCACTGGCCATGGAAGGAAA   8050
            TTCTTGCTCCTGCCTCTACAGTAGCCCGTGCGTGACCGGTACCTTCCTTT
C           LysAsnGluAspGlyAspValIleGlyHisAlaLeuAlaMetGluGlyLys 135

                :    |    :    |    :    |    :    |    :    |
8051        GGTAATGAAACCTCTGCACGTGAAAGGAACCATCGACCACCCTGTGCTAT   8100
            CCATTACTTTGGAGACGTGCACTTTCCTTGGTAGCTGGTGGGACACGATA
C            ValMetLysProLeuHisValLysGlyThrIleAspHisProValLeu   151

                :    |    :    |    :    |    :    |    :    |
8101        CAAAGCTCAAATTTACCAAGTCGTCAGCATACGACATGGAGTTCGCACAG   8150
            GTTTCGAGTTTAAATGGTTCAGCAGTCGTATGCTGTACCTCAAGCGTGTC
C          SerLysLeuLysPheThrLysSerSerAlaTyrAspMetGluPheAlaGln  168

                :    |    :    |    :    |    :    |    :    |
8151        TTGCCAGTCAACATGAGAAGTGAGGCATTCACCTACACCAGTGAACACCC   8200
            AACGGTCAGTTGTACTCTTCACTCCGTAAGTGGATGTGGTCACTTGTGGG
C           LeuProValAsnMetArgSerGluAlaPheThrTyrThrSerGluHisPro 185

                :    |    :    |    :    |    :    |    :    |
8201        CGAAGGATTCTATAACTGGCACCACGGAGCGGTGCAGTATAGTGGAGGTA   8250
            GCTTCCTAAGATATTGACCGTGGTGCCTCGCCACGTCATATCACCTCCAT
C            GluGlyPheTyrAsnTrpHisHisGlyAlaValGlnTyrSerGlyGly   201

                :    |    :    |    :    |    :    |    :    |
8251        GATTTACCATCCCTCGCGGAGTAGGAGGCAGAGGAGACAGCGGTCGTCCG   8300
            CTAAATGGTAGGGAGCGCCTCATCCTCCGTCTCCTCTGTCGCCAGCAGGC
C          ArgPheThrIleProArgGlyValGlyGlyArgGlyAspSerGlyArgPro  218

                :    |    :    |    :    |    :    |    :    |
8301        ATCATGGATAACTCCGGTCGGGTTGTCGCGATAGTCCTCGGTGGCGCTGA   8350
            TAGTACCTATTGAGGCCAGCCCAACAGCGCTATCAGGAGCCACCGCGACT
C           IleMetAspAsnSerGlyArgValValAlaIleValLeuGlyGlyAlaAsp 235

                :    |    :    |    :    |    :    |    :    |
8351        TGAAGGAACACGAACTGCCCTTTCGGTCGTCACCTGGAATAGTAAAGGGA   8400
            ACTTCCTTGTGCTTGACGGGAAAGCCAGCAGTGGACCTTATCATTTCCCT
C            GluGlyThrArgThrAlaLeuSerValValThrTrpAsnSerLysGly   251

                :    |    :    |    :    |    :    |    :    |
8401        AGACAATTAAGACGACCCCGGAAGGGACAGAAGAGTGGTCCGCAGCACCA   8450
            TCTGTTAATTCTGCTGGGGCCTTCCCTGTCTTCTCACCAGGCGTCGTGGT
C/E3       LysThrIleLysThrThrProGluGlyThrGluGluTrpSerAlaAlaPro  264/4

                :    |    :    |    :    |    :    |    :    |
8451        CTGGTCACGGCAATGTGTTTGCTCGGAAATGTGAGCTTCCCATGCGACCG   8500
            GACCAGTGCCGTTACACAAACGAGCCTTTACACTCGAAGGGTACGCTGGC
E3          LeuValThrAlaMetCysLeuLeuGlyAsnValSerPheProCysAspArg  20

                :    |    :    |    :    |    :    |    :    |
8501        CCCGCCCACATGCTATACCCGCGAACCTTCCAGAGCCCTCGACATCCTTG   8550
            GGGCGGGTGTACGATATGGGCGCTTGGAAGGTCTCGGGAGCTGTAGGAAC
E3           ProProThrCysTyrThrArgGluProSerArgAlaLeuAspIleLeu    37

                :    |    :    |    :    |    :    |    :    |
8551        AAGAGAACGTGAACCATGAGGCCTACGATACCCTGCTCAATGCCATATTG   8600
            TTCTCTTGCACTTGGTACTCCGGATGCTATGGGACGAGTTACGGTATAAC
E3         GluGluAsnValAsnHisGluAlaTyrAspThrLeuLeuAsnAlaIleLeu   54

                :    |    :    |    :    |    :    |    :    |
8601        CGGTGCGGATCGTCTGGCAGAAGCAAAAGAAGCGTCATTGACGACTTTAC   8650
            GCCACGCCTAGCAGACCGTCTTCGTTTTCTTCGCAGTAACTGCTGAAATG
E3/E2       ArgCysGlySerSerGlyArgSerLysArgSerValIleAspAspPheThr  64/7

                :    |    :    |    :    |    :    |    :    |
8651        CCTGACCAGCCCCTACTTGGGCACATGCTCGTACTGCCACCATACTGTAC   8700
            GGACTGGTCGGGGATGAACCCGTGTACGAGCATGACGGTGGTATGACATG
E2           LeuThrSerProTyrLeuGlyThrCysSerTyrCysHisHisThrVal    23

                :    |    :    |    :    |    :    |    :    |
8701        CGTGCTTCAGCCCTGTTAAGATCGAGCAGGTCTGGGACGAAGCGGACGAT   8750
            GCACGAAGTCGGGACAATTCTAGCTCGTCCAGACCCTGCTTCGCCTGCTA
E2         ProCysPheSerProValLysIleGluGlnValTrpAspGluAlaAspAsp   40

                :    |    :    |    :    |    :    |    :    |
8751        AACACCATACGCATACAGACTTCCGCCCAGTTTGGATACGACCAAAGCGG   8800
            TTGTGGTATGCGTATGTCTGAAGGCGGGTCAAACCTATGCTGGTTTCGCC
E2          AsnThrIleArgIleGlnThrSerAlaGlnPheGlyTyrAspGlnSerGly  57

                :    |    :    |    :    |    :    |    :    |
8801        AGCAGCAAGCGCAAACAAGTACCGCTACATGTCGCTTAAGCAGGATCACA   8850
            TCGTCGTTCGCGTTTGTTCATGGCGATGTACAGCGAATTCGTCCTAGTGT
E2           AlaAlaSerAlaAsnLysTyrArgTyrMetSerLeuLysGlnAspHis    83

                :    |    :    |    :    |    :    |    :    |
8851        CCGTTAAAGAAGGCACCATGGATGACATCAAGATTAGCACCTCAGGACCG   8900
            GGCAATTTCTTCCGTGGTACCTACTGTAGTTCTAATCGTGGAGTCCTGGC
E2         ThrValLysGluGlyThrMetAspAspIleLysIleSerThrSerGlyPro   90

                :    |    :    |    :    |    :    |    :    |
8901        TGTAGAAGGCTTAGCTACAAAGGATACTTTCTCCTCGCAAAATGCCCTCC   8950
            ACATCTTCCGAATCGATGTTTCCTATGAAAGAGGAGCGTTTTACGGGAGG
E2          CysArgArgLeuSerTyrLysGlyTyrPheLeuLeuAlaLysCysProPro 107

                :    |    :    |    :    |    :    |    :    |
8951        AGGGGACAGCGTAACGGTTAGCATAGTGAGTAGCAACTCAGCAACGTCAT   9000
            TCCCCTGTCGCATTGCCAATCGTATCACTCATCGTTGAGTCGTTGCAGTA
E2           GlyAspSerValThrValSerIleValSerSerAsnSerAlaThrSer   123

                :    |    :    |    :    |    :    |    :    |
9001        GTACACTGGCCCGCAAGATAAAACCAAAATTCGTGGGACGGGAAAAATAT   9050
            CATGTGACCGGGCGTTCTATTTTGGTTTTAAGCACCCTGCCCTTTTTATA
E2         CysThrLeuAlaArgLysIleLysProLysPheValGlyArgGluLysTyr    140

                :    |    :    |    :    |    :    |    :    |
9051        GATCTACCTCCCGTTCACGGTAAAAAAATTCCTTGCACAGTGTACGACCG   9100
            CTAGATGGAGGGCAAGTGCCATTTTTTTAAGGAACGTGTCACATGCTGGC
E2          AspLeuProProValHisGlyLysLysIleProCysThrValTyrAspArg 157

                :    |    :    |    :    |    :    |    :    |
9101        TCTGAAAGAAACAACTGCAGGCTACATCACTATGCACAGGCCGAGACCGC   9150
            AGACTTTCTTTGTTGACGTCCGATGTAGTGATACGTGTCCGGCTCTGGCG
E2           LeuLysGluThrThrAlaGlyTyrIleThrMetHisArgProArgPro   183

                :    |    :    |    :    |    :    |    :    |
9151        ACGCTTATACATCCTACCTGGAAGAATCATCAGGGAAAGTTTACGCAAAG   9200
            TGCGAATATGTAGGATGGACCTTCTTAGTAGTCCCTTTCAAATGCGTTTC
E2         HisAlaTyrThrSerTyrLeuGluGluSerSerGlyLysValTyrAlaLys  190

                :    |    :    |    :    |    :    |    :    |
9201        CCGCCATCTGGGAAGAACATTACGTATGAGTGCAAGTGCGGCGACTACAA   9250
            GGCGGTAGACCCTTCTTGTAATGCATACTCACGTTCACGCCGCTGATGTT
E2          ProProSerGlyLysAsnIleThrTyrGluCysLysCysGlyAspTyrLys 207

                :    |    :    |    :    |    :    |    :    |
9251        GACCGGAACCGTTTCGACCCGCACCGAAATCACTGGTTGCACCGCCATCA   9300
            CTGGCCTTGGCAAAGCTGGGCGTGGCTTTAGTGACCAACGTGGCGGTAGT
E2           ThrGlyThrValSerThrArgThrGluIleThrGlyCysThrAlaIle   223

                :    |    :    |    :    |    :    |    :    |
9301        AGCAGTGCGTCGCCTATAAGAGCGACCAAACGAAGTGGGTCTTCAACTCA   9350
            TCGTCACGCAGCGGATATTCTCGCTGGTTTGCTTCACCCAGAAGTTGAGT
E2         LysGlnCysValAlaTyrLysSerAspGlnThrLysTrpValPheAsnSer  240

                :    |    :    |    :    |    :    |    :    |
9351        CCGGACTTGATCAGACATGACGACCACACGGCCCAAGGGAAATTGCATTT   9400
            GGCCTGAACTAGTCTGTACTGCTGGTGTGCCGGGTTCCCTTTAACGTAAA
E2          ProAspLeuIleArgHisAspAspHisThrAlaGlnGlyLysLeuHisLeu 257

                :    |    :    |    :    |    :    |    :    |
9401        GCCTTTCAAGTTGATCCCGAGTACCTGCATGGTCCCTGTTGCCCACGCGC   9450
            CGGAAAGTTCAACTAGGGCTCATGGACGTACCAGGGACAACGGGTGCGCG
E2           ProPheLysLeuIleProSerThrCysMetValProValAlaHisAla   283

                :    |    :    |    :    |    :    |    :    |
9451        CGAATGTAATACATGGCTTTAAACACATCAGCCTCCAATTAGATACAGAC   9500
            GCTTACATTATGTACCGAAATTTGTGTAGTCGGAGGTTAATCTATGTCTG
E2         ProAsnValIleHisGlyPheLysHisIleSerLeuGlnLeuAspThrAsp  290

                :    |    :    |    :    |    :    |    :    |
9501        CACTTGACATTGCTCACCACCAGGAGACTAGGGGCAAACCCGGAACCAAC   9550
            GTGAACTGTAACGAGTGGTGGTCCTCTGATCCCCGTTTGGGCCTTGGTTG
E2          HisLeuThrLeuLeuThrThrArgArgLeuGlyAlaAsnProGluProThr 307

                :    |    :    |    :    |    :    |    :    |
9551        CACTGAATGGATCGTCGGAAAGACGGTCAGAAACTTCACCGTCGACCGAG   9600
            GTGACTTACCTAGCAGCCTTTCTGCCAGTCTTTGAAGTGGCAGCTGGCTC
E2           ThrGluTrpIleValGlyLysThrValArgAsnPheThrValAspArg   323

                :    |    :    |    :    |    :    |    :    |
9601        ATGGCCTGGAATACATATGGGGAAATCATGAGCCAGTGAGGGTCTATGCC   9650
            TACCGGACCTTATGTATACCCCTTTAGTACTCGGTCACTCCCAGATACGG
E2         AspGlyLeuGluTyrIleTrpGlyAsnHisGluProValArgValTyrAla  340

                :    |    :    |    :    |    :    |    :    |
9651        CAAGAGTCAGCACCAGGAGACCCTCACGGATGGCCACACGAAATAGTACA   9700
            GTTCTCAGTCGTGGTCCTCTGGGAGTGCCTACCGGTGTGCTTTATCATGT
E2          GlnGluSerAlaProGlyAspProHisGlyTrpProHisGluIleValGln 357

                :    |    :    |    :    |    :    |    :    |
9701        GCATTACTACCATCGCCATCCTGTGTACACCATCTTAGCCGTCGCATCAG   9750
            CGTAATGATGGTAGCGGTAGGACACATGTGGTAGAATCGGCAGCGTAGTC
E2           HisTyrTyrHisArgHisProValTyrThrIleLeuAlaValAlaSer   383

                :    |    :    |    :    |    :    |    :    |
9751        CTACCGTGGCGATGATGATTGGCGTAACTGTTGCAGTGTTATGTGCCTGT   9800
            GATGGCACCGCTACTACTAACCGCATTGACAACGTCACAATACACGGACA
E2         AlaThrValAlaMetMetIleGlyValThrValAlaValLeuCysAlaCys  390

                :    |    :    |    :    |    :    |    :    |
9801        AAAGCGCGCCGTGAGTGCCTGACGCCATACGCCCTGGCCCCAAACGCCGT   9850
            TTTCGCGCGGCACTCACGGACTGCGGTATGCGGGACCGGGGTTTGCGGCA
E2          LysAlaArgArgGluCysLeuThrProTyrAlaLeuAlaProAsnAlaVal 407

                :    |    :    |    :    |    :    |    :    |
9851        AATCCCAACTTCGCTGGCACTCTTGTGCTGCGTTAGGTCGGCCAATGCTG   9900
            TTAGGGTTGAAGCGACCGTGAGAACACGACGCAATCCAGCCGGTTACGAC
E2           IleProThrSerLeuAlaLeuLeuCysCysValArgSerAlaAsnAla   423

                :    |    :    |    :    |    :    |    :    |
9901        AAACGTTCACCGAGACCATGAGTTACTTGTGGTCGAACAGTCAGCCGTTC   9950
            TTTGCAAGTGGCTCTGGTACTCAATGAACACCAGCTTGTCAGTCGGCAAG
6K         GluThrPheThrGluThrMetSerTyrLeuTrpSerAsnSerGlnProPhe   17

                :    |    :    |    :    |    :    |    :    |
9951        TTCTGGGTCCAGTTGTGCATACCTTTGGCCGCTTTCATCGTTCTAATGCG  10000
            AAGACCCAGGTCAACACGTATGGAAACCGGCGAAAGTAGCAAGATTACGC
6K          PheTrpValGlnLeuCysIleProLeuAlaAlaPheIleValLeuMetArg  34

                :    |    :    |    :    |    :    |    :    |
10001       CTGCTGCTCCTGCTGCCTGCCTTTTTTAGTGGTTGCCGGCGCCTACCTGG  10050
            GACGACGAGGACGACGGACGGAAAAAATCACCAACGGCCGCGGATGGACC
6K           CysCysSerCysCysLeuProPheLeuValValAlaGlyAlaTyrLeu    50

                :    |    :    |    :    |    :    |    :    |
10051       CGAAGGTAGACGCCTACGAACATGCGACCACTGTTCCAAATGTGCCACAG  10100
            GCTTCCATCTGCGGATGCTTGTACGCTGGTGACAAGGTTTACACGGTGTC
6K/E1      AlaLysValAspAlaTyrGluHisAlaThrThrValProAsnValProGln   55/12

                :    |    :    |    :    |    :    |    :    |
10101       ATACCGTATAAGGCACTTGTTGAAAGGGCAGGGTATGCCCCGCTCAATTT  10150
            TATGGCATATTCCGTGAACAACTTTCCCGTCCCATACGGGGCGAGTTAAA
E1          IleProTyrLysAlaLeuValGluArgAlaGlyTyrAlaProLeuAsnLeu  29

                :    |    :    |    :    |    :    |    :    |
10151       GGAGATCACTGTCATGTCCTCGGAGGTTTTGCCTTCCACCAACCAAGAGT  10200
            CCTCTAGTGACAGTACAGGAGCCTCCAAAACGGAAGGTGGTTGGTTCTCA
E1           GluIleThrValMetSerSerGluValLeuProSerThrAsnGlnGlu    45

                :    |    :    |    :    |    :    |    :    |
10201       ACATTACCTGCAAATTCACCACTGTGGTCCCCTCCCCAAAAATCAAATGC  10250
            TGTAATGGACGTTTAAGTGGTGACACCAGGGGAGGGGTTTTTAGTTTACG
E1         TyrIleThrCysLysPheThrThrValValProSerProLysIleLysCys   67

                :    |    :    |    :    |    :    |    :    |
10251       TGCGGCTCCTTGGAATGTCAGCCGGCCGCTCATGCAGACTATACCTGCAA  10300
            ACGCCGAGGAACCTTACAGTCGGCCGGCGAGTACGTCTGATATGGACGTT
E1          CysGlySerLeuGluCysGlnProAlaAlaHisAlaAspTyrThrCysLys  79

                :    |    :    |    :    |    :    |    :    |
10301       GGTCTTCGGAGGGGTCTACCCCTTTATGTGGGGAGGAGCGCAATGTTTTT  10350
            CCAGAAGCCTCCCCAGATGGGGAAATACACCCCTCCTCGCGTTACAAAAA
E1           ValPheGlyGlyValTyrProPheMetTrpGlyGlyAlaGlnCysPhe    95

                :    |    :    |    :    |    :    |    :    |
10351       GCGACAGTGAGAACAGCCAGATGAGTGAGGCGTACGTCGAATTGTCAGCA  10400
            CGCTGTCACTCTTGTCGGTCTACTCACTCCGCATGCAGCTTAACAGTCGT
E1         CysAspSerGluAsnSerGlnMetSerGluAlaTyrValGluLeuSerAla  112

                :    |    :    |    :    |    :    |    :    |
10401       GATTGCGCGTCTGACCACGCGCAGGCGATTAAGGTGCACACTGCCGCGAT  10450
            CTAACGCGCAGACTGGTGCGCGTCCGCTAATTCCACGTGTGACGGCGCTA
E1          AspCysAlaSerAspHisAlaGlnAlaIleLysValHisThrAlaAlaMet 129

                :    |    :    |    :    |    :    |    :    |
10451       GAAAGTAGGACTGCGTATTGTGTACGGGAACACTACCAGTTTCCTAGATG  10500
            CTTTCATCCTGACGCATAACACATGCCCTTGTGATGGTCAAAGGATCTAC
E1           LysValGlyLeuArgIleValTyrGlyAsnThrThrSerPheLeuAsp   145

                :    |    :    |    :    |    :    |    :    |
10501       TGTACGTGAACGGAGTCACACCAGGAACGTCTAAAGACTTGAAAGTCATA  10550
            ACATGCACTTGCCTCAGTGTGGTCCTTGCAGATTTCTGAACTTTCAGTAT
E1         ValTyrValAsnGlyValThrProGlyThrSerLysAspLeuLysValIle  167

                :    |    :    |    :    |    :    |    :    |
10551       GCTGGACCAATTTCAGCATCGTTTACGCCATTCGATCATAAGGTCGTTAT  10600
            CGACCTGGTTAAAGTCGTAGCAAATGCGGTAAGCTAGTATTCCAGCAATA
E1          AlaGlyProIleSerAlaSerPheThrProPheAspHisLysValValIle 179

                :    |    :    |    :    |    :    |    :    |
10601       CCATCGCGGCCTGGTGTACAACTATGACTTCCCGGAATATGGAGCGATGA  10650
            GGTAGCGCCGGACCACATGTTGATACTGAAGGGCCTTATACCTCGCTACT
E1           HisArgGlyLeuValTyrAsnTyrAspPheProGluTyrGlyAlaMet   195

                :    |    :    |    :    |    :    |    :    |
10651       AACCAGGAGCGTTTGGAGACATTCAAGCTACCTCCTTGACTAGCAAGGAT  10700
            TTGGTCCTCGCAAACCTCTGTAAGTTCGATGGAGGAACTGATCGTTCCTA
E1         LysProGlyAlaPheGlyAspIleGlnAlaThrSerLeuThrSerLysAsp  212

                :    |    :    |    :    |    :    |    :    |
10701       CTCATCGCCAGCACAGACATTAGGCTACTCAAGCCTTCCGCCAAGAACGT  10750
            GAGTAGCGGTCGTGTCTGTAATCCGATGAGTTCGGAAGGCGGTTCTTGCA
E1          LeuIleAlaSerThrAspIleArgLeuLeuLysProSerAlaLysAsnVal 229

                :    |    :    |    :    |    :    |    :    |
10751       GCATGTCCCGTACACGCAGGCCTCATCAGGATTTGAGATGTGGAAAAACA  10800
            CGTACAGGGCATGTGCGTCCGGAGTAGTCCTAAACTCTACACCTTTTTGT
E1           HisValProTyrThrGlnAlaSerSerGlyPheGluMetTrpLysAsn   245

                :    |    :    |    :    |    :    |    :    |
10801       ACTCAGGCCGCCCACTGCAGGAAACCGCACCTTTCGGGTGTAAGATTGCA  10850
            TGAGTCCGGCGGGTGACGTCCTTTGGCGTGGAAAGCCCACATTCTAACGT
E1         AsnSerGlyArgProLeuGlnGluThrAlaProPheGlyCysLysIleAla  267

                :    |    :    |    :    |    :    |    :    |
10851       GTAAATCCGCTCCGAGCGGTGGACTGTTCATACGGGAACATTCCCATTTC  10900
            CATTTAGGCGAGGCTCGCCACCTGACAAGTATGCCCTTGTAAGGGTAAAG
E1          ValAsnProLeuArgAlaValAspCysSerTyrGlyAsnIleProIleSer 279

                :    |    :    |    :    |    :    |    :    |
10901       TATTGACATCCCGAACGCTGCCTTTATCAGGACATCAGATGCACCACTGG  10950
            ATAACTGTAGGGCTTGCGACGGAAATAGTCCTGTAGTCTACGTGGTGACC
E1           IleAspIleProAsnAlaAlaPheIleArgThrSerAspAlaProLeu   295

                :    |    :    |    :    |    :    |    :    |
10951       TCTCAACAGTCAAATGTGAAGTCAGTGAGTGCACTTATTCAGCAGACTTC  11000
            AGAGTTGTCAGTTTACACTTCAGTCACTCACGTGAATAAGTCGTCTGAAG
E1         ValSerThrValLysCysGluValSerGluCysThrTyrSerAlaAspPhe  312

                :    |    :    |    :    |    :    |    :    |
11001       GGCGGGATGGCCACCCTGCAGTATGTATCCGACCGCGAAGGTCAATGCCC  11050
            CCGCCCTACCGGTGGGACGTCATACATAGGCTGGCGCTTCCAGTTACGGG
E1          GlyGlyMetAlaThrLeuGlnTyrValSerAspArgGluGlyGlnCysPro 329

                :    |    :    |    :    |    :    |    :    |
11051       CGTACATTCGCATTCGAGCACAGCAACTCTCCAAGAGTCGACAGTACATG  11100
            GCATGTAAGCGTAAGCTCGTGTCGTTGAGAGGTTCTCAGCTGTCATGTAC
E1           ValHisSerHisSerSerThrAlaThrLeuGlnGluSerThrValHis   345

                :    |    :    |    :    |    :    |    :    |
11101       TCCTGGAGAAAGGAGCGGTGACAGTACACTTTAGCACCGCGAGTCCACAG  11150
            AGGACCTCTTTCCTCGCCACTGTCATGTGAAATCGTGGCGCTCAGGTGTC
E1         ValLeuGluLysGlyAlaValThrValHisPheSerThrAlaSerProGln  367

                :    |    :    |    :    |    :    |    :    |
11151       GCGAACTTTATCGTATCGCTGTGTGGGAAGAAGACAACATGCAATGCAGA  11200
            CGCTTGAAATAGCATAGCGACACACCCTTCTTCTGTTGTACGTTACGTCT
E1          AlaAsnPheIleValSerLeuCysGlyLysLysThrThrCysAsnAlaGlu 379

                :    |    :    |    :    |    :    |    :    |
11201       ATGTAAACCACCAGCTGACCATATCGTGAGCACCCCGCACAAAAATGACC  11250
            TACATTTGGTGGTCGACTGGTATAGCACTCGTGGGGCGTGTTTTTACTGG
E1           CysLysProProAlaAspHisIleValSerThrProHisLysAsnAsp   395

                :    |    :    |    :    |    :    |    :    |
11251       AAGAATTTCAAGCCGCCATCTCAAAAACATCATGGAGTTGGCTGTTTGCC  11300
            TTCTTAAAGTTCGGCGGTAGAGTTTTTGTAGTACCTCAACCGACAAACGG
E1         GlnGluPheGlnAlaAlaIleSerLysThrSerTrpSerTrpLeuPheAla  412

                :    |    :    |    :    |    :    |    :    |
11301       CTTTTCGGCGGCGCCTCGTCGCTATTAATTATAGGACTTATGATTTTTGC  11350
            GAAAAGCCGCCGCGGAGCAGCGATAATTAATATCCTGAATACTAAAAACG
E1          LeuPheGlyGlyAlaSerSerLeuLeuIleIleGlyLeuMetIlePheAla 429

                :    |    :    |    :    |    :    |    :    |
11351       TTGCAGCATGATGCTGACTAGCACACGAAGATGACCGCTACGCCCCAATG  11400
            AACGTCGTACTACGACTGATCGTGTGCTTCTACTGGCGATGCGGGGTTAC
E1           CysSerMetMetLeuThrSerThrArgArgtrm                  439

                :    |    :    |    :    |    :    |    :    |
11401       ATCCGACCAGCAAAACTCGATGTACTTCCGAGGAACTGATGTGCATAATG  11450
            TAGGCTGGTCGTTTTGAGCTACATGAAGGCTCCTTGACTACACGTATTAC
3'UT

                :    |    :    |    :    |    :    |    :    |
11451       CATCAGGCTGGTACATTAGATCCCCGCTTACCGCGGGCAATATAGCAACA  11500
            GTAGTCCGACCATGTAATCTAGGGGCGAATGGCGCCCGTTATATCGTTGT
3'UT

                :    |    :    |    :    |    :    |    :    |
11501       CTAAAAACTCGATGTACTTCCGAGGAAGCGCAGTGCATAATGCTGCGCAG  11550
            GATTTTTGAGCTACATGAAGGCTCCTTCGCGTCACGTATTACGACGCGTC
3'UT

                :    |    :    |    :    |    :    |    :    |
11551       TGTTGCCACATAACCACTATATTAACCATTTATCTAGCGGACGCCAAAAA  11600
            ACAACGGTGTATTGGTGATATAATTGGTAAATAGATCGCCTGCGGTTTTT
3'UT

                :    |    :    |    :    |    :    |    :    |
11601       CTCAATGTATTTCTGAGGAAGCGTGGTGCATAATGCCACGCAGCGTCTGC  11650
            GAGTTACATAAAGACTCCTTCGCACCACGTATTACGGTGCGTCGCAGACG
3'UT

                :    |    :    |    :    |    :    |    :    |
11651       ATAACTTTTATTATTTCTTTTATTAATCAACAAAATTTTGTTTTTAACAT  11700
            TATTGAAAATAATAAAGAAAATAATTAGTTGTTTTAAAACAAAAATTGTA
3'UT

            :    |    :    |    :    |    :    |    :    |
11701       TTC poly-A                                          11750
            AAG
3'UT

Return to Overview of Sindbis virus