CAPSD_LDCPR

ID   CAPSD_LDCPR             Reviewed;        1333 AA.
AC   Q91IE1;
DT   11-JAN-2011, integrated into UniProtKB/Swiss-Prot.
DT   01-DEC-2001, sequence version 1.
DT   23-FEB-2022, entry version 47.
DE   RecName: Full=Major capsid protein VP1;
GN   Name=S1;
OS   Lymantria dispar cypovirus 1 (isolate Rao) (LdCPV-1).
OC   Viruses; Riboviria; Orthornavirae; Duplornaviricota; Resentoviricetes;
OC   Reovirales; Reoviridae; Spinareovirinae; Cypovirus.
OX   NCBI_TaxID=648169;
OH   NCBI_TaxID=13123; Lymantria dispar (Gypsy moth) (Porthetria dispar).
RN   [1]
RP   NUCLEOTIDE SEQUENCE [GENOMIC RNA].
RA   Rao S., Shapiro M., Lynn D., Hagiwara K., Blackmon B., Fang G.,
RA   Carner G.R.;
RT   "Identification of dsRNA electrophoretypes of two cypoviruses from a dual
RT   infection in gypsy moth, Lymantria dispar.";
RL   Submitted (JUN-2001) to the EMBL/GenBank/DDBJ databases.
CC   -!- FUNCTION: Capsid protein self-assembles to form an icosahedral capsid
CC       with a pseudo T=2 symmetry, about 50 nm in diameter, and consisting of
CC       120 capsid proteins. The capsid encapsulates the genomic RNA (By
CC       similarity). {ECO:0000250}.
CC   -!- SUBCELLULAR LOCATION: Virion {ECO:0000305}.
CC   ---------------------------------------------------------------------------
CC   Copyrighted by the UniProt Consortium, see https://www.uniprot.org/terms
CC   Distributed under the Creative Commons Attribution (CC BY 4.0) License
CC   ---------------------------------------------------------------------------
DR   EMBL; AF389462; AAK73520.1; -; Genomic_RNA.
DR   RefSeq; NP_149146.1; NC_003016.1.
DR   SMR; Q91IE1; -.
DR   GeneID; 2598188; -.
DR   KEGG; vg:2598188; -.
DR   Proteomes; UP000006712; Genome.
DR   GO; GO:0039616; C:T=2 icosahedral viral capsid; IEA:UniProtKB-KW.
DR   GO; GO:0039625; C:viral inner capsid; IEA:UniProtKB-KW.
PE   3: Inferred from homology;
KW   Capsid protein; Inner capsid protein; Reference proteome;
KW   T=2 icosahedral capsid protein; Virion.
FT   CHAIN           1..1333
FT                   /note="Major capsid protein VP1"
FT                   /id="PRO_0000403205"
FT   REGION          1..93
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        9..23
FT                   /note="Basic and acidic residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        26..50
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        64..79
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
SQ   SEQUENCE   1333 AA;  148194 MW;  4008E1DB3D7419A8 CRC64;
     MHSTTNNSNK RNNEEKHKQP EANGSADNGE GASGTRNQTA GDTTPEAGTR NETEAGAGAR
     GQTDGASRSG TNAKVATASS ARQMDMEKAA ETTSTIENVN DVGIMQQKKP PTVIQSRTDV
     FNEQFANEAL HPTTKVIFNG LDVNTEVQPL SDDFEQISDP KGYLTYSVKY EDQFAKKDKL
     RASEADDRIV GPTVNLFKYG SAVVNIDLNQ DFFDTTTGIN LTKGILLVQD LLVPIGVTAG
     AEQSSEYVSG LLMVLFKVMT DNRLVIVGET TTPISNTLST VVNNILRTTY HNNVGINPAL
     LRDFTHVNWL NQDITNMLQQ AGTRFGLGLT ATRLDYVRLV KTIVGYALDI DHFAASVLNI
     NLRALMEANV TADDRIKALQ AHSMISTQFH GPNQGALRPE LAFDHDHVIR CLMLAAANYP
     RLEGIIVQIN TGYVASTNVI RPVSEKRYFP ENLEQNQSAA RLVSAVKARA SEADISSIHL
     AIAREVSPMF NVHELKKIAE SFEDPSSIVV VLEFILFSLF FPTEFNRIKG DIQNVLLLFF
     SRWYPVEYGI FIQRGATYTI NAAGEFEFSG RNEKWDQSSY LSEHFPALFS DVPLAGANTI
     IAIMRLFTPQ GFLRTDDLAI AANFPRASRN PQTYIPYTNQ RGTVTNEFAS RFRTIVATLA
     NVVNERAVQD DMQKATRSCT KQWLRHLETQ FDNIAVAHTD HLSVVYATMS NFMLNFTNNF
     SGNHATFKPE QYVITSPEGS YKPIMERQGE TVDGLTIIDT SIVWPILCQC TYPLVRQSGK
     GVDAVSIMEE IVYPDPGTTL SQSLSVAQIL SKLTLPDAFI NMILSGGDSV AMRTYQTEAN
     DELDEGIRMT TYDQYLSHIR ERLHITNVPD PIYITGASTP DQIAASVQAT HVAVVLYQNG
     VINGPASTYL RENEVLVVMP DYSNVAARFV YANAQMNNNR YHESVLEIAD IFDQADFIQT
     DNAVRRLRAL MPTLSTSQIR HAIERIAQIT NVDSTDYGKL TLRFLGTLTR PLKMQNAQIR
     RIRPDGTVLR YDDQIDIEAF RWSRYFLDEL QLRRLAVGLR LIANPRIARR FNGVRIMYLT
     DDDPDPDFVP AIPEGYVAVQ YAHRLFSSSL ANKRNRVTYT HPPTGMAYPS PTGRPHVHLT
     INERAGMSKL VADNIIASVI KSNWVVDILD IEYTAEVMTP SEGYTQHVDA ESIMTAPKGK
     LFHLQFMDGL LRPEPSAFDP PASGEDIRLI YPLQPISVAR SMRAIVNHNE VDRPRGAVAP
     SSYEMDTGTL SRNGDLLYSP VENGQAGIPK LEVDHISFSN VVSMMTSNIR TGDDMAVERV
     NPSDIRAINI RNA