MSP1_PLAFC

ID   MSP1_PLAFC              Reviewed;        1726 AA.
AC   P04934;
DT   13-AUG-1987, integrated into UniProtKB/Swiss-Prot.
DT   01-JUL-1989, sequence version 2.
DT   25-MAY-2022, entry version 89.
DE   RecName: Full=Merozoite surface protein 1;
DE   AltName: Full=Merozoite surface antigens;
DE   AltName: Full=PMMSA;
DE   AltName: Full=p195;
DE   Flags: Precursor;
GN   Name=MSP-1;
OS   Plasmodium falciparum (isolate Camp / Malaysia).
OC   Eukaryota; Sar; Alveolata; Apicomplexa; Aconoidasida; Haemosporida;
OC   Plasmodiidae; Plasmodium; Plasmodium (Laverania).
OX   NCBI_TaxID=5835;
RN   [1]
RP   NUCLEOTIDE SEQUENCE [GENOMIC DNA] OF 1-1103.
RX   PubMed=3517809; DOI=10.1093/nar/14.8.3311;
RA   Weber J.L., Leininger W.M., Lyon J.A.;
RT   "Variation in the gene encoding a major merozoite surface antigen of the
RT   human malaria parasite Plasmodium falciparum.";
RL   Nucleic Acids Res. 14:3311-3323(1986).
RN   [2]
RP   NUCLEOTIDE SEQUENCE [GENOMIC DNA] OF 1104-1726.
RX   PubMed=3278296; DOI=10.1093/nar/16.3.1206;
RA   Weber J.L., Sim B.K.L., Lyon J.A., Wolff R.;
RT   "Merozoite surface protein sequence from the Camp strain of the human
RT   malaria parasite Plasmodium falciparum.";
RL   Nucleic Acids Res. 16:1206-1206(1988).
CC   -!- SUBCELLULAR LOCATION: Cell membrane; Lipid-anchor, GPI-anchor.
CC   -!- PTM: Merozoite surface antigen contain the sequence of 83 kDa, 42 kDa
CC       and 19 kDa antigens which are the major surface antigens of merozoites.
CC       The maturation take place during schizont.
CC   ---------------------------------------------------------------------------
CC   Copyrighted by the UniProt Consortium, see https://www.uniprot.org/terms
CC   Distributed under the Creative Commons Attribution (CC BY 4.0) License
CC   ---------------------------------------------------------------------------
DR   EMBL; X03831; CAA27446.1; -; Genomic_DNA.
DR   PIR; A23386; SAZQGM.
DR   AlphaFoldDB; P04934; -.
DR   BMRB; P04934; -.
DR   SMR; P04934; -.
DR   GO; GO:0031225; C:anchored component of membrane; IEA:UniProtKB-KW.
DR   GO; GO:0005886; C:plasma membrane; IEA:UniProtKB-SubCell.
DR   InterPro; IPR010901; MSP1_C.
DR   InterPro; IPR024730; MSP1_EGF_1.
DR   Pfam; PF12946; EGF_MSP1_1; 1.
DR   Pfam; PF07462; MSP1_C; 1.
PE   3: Inferred from homology;
KW   Cell membrane; Disulfide bond; Glycoprotein; GPI-anchor; Lipoprotein;
KW   Malaria; Membrane; Merozoite; Repeat; Signal.
FT   SIGNAL          1..19
FT                   /evidence="ECO:0000255"
FT   CHAIN           20..1705
FT                   /note="Merozoite surface protein 1"
FT                   /id="PRO_0000024547"
FT   PROPEP          1706..1726
FT                   /note="Removed in mature form"
FT                   /evidence="ECO:0000250"
FT                   /id="PRO_0000024548"
FT   REGION          61..149
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          735..771
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          914..961
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          1254..1284
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          1476..1497
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        61..142
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        735..754
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        914..957
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        1264..1284
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   LIPID           1705
FT                   /note="GPI-anchor amidated serine"
FT                   /evidence="ECO:0000250"
FT   CARBOHYD        133
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        272
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        501
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        567
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        638
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        827
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        924
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        944
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        990
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1016
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1114
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1221
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1613
FT                   /note="N-linked (GlcNAc...) asparagine"
FT                   /evidence="ECO:0000255"
FT   DISULFID        1619..1630
FT                   /evidence="ECO:0000250"
FT   DISULFID        1624..1640
FT                   /evidence="ECO:0000250"
FT   DISULFID        1642..1653
FT                   /evidence="ECO:0000250"
FT   DISULFID        1661..1674
FT                   /evidence="ECO:0000250"
FT   DISULFID        1668..1688
FT                   /evidence="ECO:0000250"
FT   DISULFID        1690..1704
FT                   /evidence="ECO:0000250"
SQ   SEQUENCE   1726 AA;  196198 MW;  DD8AD45FA352BCF3 CRC64;
     MKIIFFLCSF LFFIINTQCV THESYQELVK KLEALEDAVL TGYGLFHKEK MILNEEEITT
     KGASAQSGTS GTSGTSGTSG TSGTSGTSAQ SGTSGTSAQS GTSGTSAQSG TSGTSGTSGT
     SPSSRSNTLP RSNTSSGASP PADASDSDAK SYADLKHRVR NYLFTIKELK YPELFDLTNH
     MLTLCDNIHG FKYLIDGYEE INELLYKLNF YFDLLRAKLN DVCANDYCQI PFNLKIRANE
     LDVLKKLVFG YRKPLDNIKD NVGKMEDYIK KNKTTIANIN ELIEGSKKTI DQNKNADNEE
     GKKKLYQAQY DLSIYNKQLE EAHNLISVLE KRIDTLKKNE NIKELLDKIN EIKNPPPANS
     GNTPNTLLDK NKKIEEHEEK IKEIAKTIKF NIDSLFTDPL ELEYYLREKN KKVDVTPKSQ
     DPTKSVQIPK VPYPNGIVYP LPLTDIHNSL AADNDKNSYG DLMNPDTKEK INEKIITDNK
     ERKIFINNIK KQIDLEEKKI NHTKEQNKKL LEDYEKSKKD YEELLEKFYE MKFNNNFDKD
     VVDKIFSARY TYNVEKQRYN NKFSSSNNSV YNVQKLKKAL SYLEDYSLRK GISEKDFNHY
     YTLKTGLEAD IKKLTEEIKS SENKILEKNF KGLTHSANAS LEVYDIVKLQ VQKVLLIKKI
     EDLRKIELFL KNAQLKDSIH VPNIYKPQNK PEPYYLIVLK KEVDKLKEFI PKVKDMLKKE
     QAVLSSITQP LVAASETTED GGHSTHTLSQ SGETEVTEET EETEETVGHT TTVTITLPPK
     EVKVVENSIE HKSNDNSQAL TKTVYLKKLD EFLTKSYICH KYILVSNSSM DQKLLEVYNL
     TPEEENELKS CDPLDLLFNI QNNIPAMYSL YDSMNNDLQH LFFELYQKEM IYYLHKLKEE
     NHIKKLLEEQ KQITGTSSTS SPGNTTVNTA QSATHSNSQN QQSNASSTNT QNGVAVSSGP
     AVVEESHDPL TVLSISNDLK GIVSLLNLGN KTKVPNPLTI STTEMEKFYE NILKNNDTYF
     NDDIKQFVKS NSKVITGLTE TQKNALNDEI KKLKDTLQLS FDLYNKYKLK LDRLFNKKKE
     LGQDKMQIKK LTLLKEQLES KLNSLNNPHN VLQNFSVFFN KKKEAEIAET ENTLENTKIL
     LKHYKGLVKY YNGESSPLKT LSEVSIQTED NYANLEKFRV LSKIDGKLND NLHLGKKKLS
     FLSSGLHHLI TELKEVIKNK NYTGNSPSEN NKKVNEALKS YENFLPEAKV TTVVTPPQPD
     VTPSPLSVRV SGSSGSTKEE TQIPTSGSLL TELQQVVQLQ NYDEEDDSLV VLPIFGESED
     NDEYLDQVVT GEAISVTMDN ILSGFENEYD VIYLKPLAGV YRSLKKQIEK NIFTFNLNLN
     DILNSRLKKR KYFLDVLESD LMQFKHISSN EYIIEDSFKL LNSEQKNTLL KSYKYIKESV
     ENDIKFAQEG ISYYEKVLAK YKDDLESIKK VIKEEKEKFP SSPPTTPPSP AKTDEQKKES
     KFLPFLTNIE TLYNNLVNKI DDYLINLKAK INDCNVEKDE AHVKITKLSD LKAIDDKIDL
     FKNHNDFEAI KKLINDDTKK DMLGKLLSTG LVQNFPNTII SKLIEGKFQD MLNISQHQCV
     KKQCPENSGC FRHLDEREEC KCLLNYKQEG DKCVENPNPT CNENNGGCDA DAKCTEEDSG
     SNGKKITCEC TKPDSYPLFD GIFCSSSNFL GISFLLILML ILYSFI