COLL6_MIMIV

ID   COLL6_MIMIV             Reviewed;        1387 AA.
AC   Q5UQ50;
DT   13-SEP-2005, integrated into UniProtKB/Swiss-Prot.
DT   07-DEC-2004, sequence version 1.
DT   29-SEP-2021, entry version 59.
DE   RecName: Full=Collagen-like protein 6;
GN   OrderedLocusNames=MIMI_L668;
OS   Acanthamoeba polyphaga mimivirus (APMV).
OC   Viruses; Varidnaviria; Bamfordvirae; Nucleocytoviricota; Megaviricetes;
OC   Imitervirales; Mimiviridae; Mimivirus.
OX   NCBI_TaxID=212035;
OH   NCBI_TaxID=5757; Acanthamoeba polyphaga (Amoeba).
RN   [1]
RP   NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA].
RC   STRAIN=Rowbotham-Bradford;
RX   PubMed=15486256; DOI=10.1126/science.1101485;
RA   Raoult D., Audic S., Robert C., Abergel C., Renesto P., Ogata H.,
RA   La Scola B., Susan M., Claverie J.-M.;
RT   "The 1.2-megabase genome sequence of Mimivirus.";
RL   Science 306:1344-1350(2004).
CC   -!- FUNCTION: May participate in the formation of a layer of cross-linked
CC       glycosylated fibrils at the viral surface thus giving it a hairy-like
CC       appearance. {ECO:0000305}.
CC   -!- SUBCELLULAR LOCATION: Virion.
CC   -!- PTM: May be hydroxylated on lysine by the viral-encoded procollagen-
CC       lysine,2-oxoglutarate 5-dioxygenase. {ECO:0000305}.
CC   ---------------------------------------------------------------------------
CC   Copyrighted by the UniProt Consortium, see https://www.uniprot.org/terms
CC   Distributed under the Creative Commons Attribution (CC BY 4.0) License
CC   ---------------------------------------------------------------------------
DR   EMBL; AY653733; AAV50929.1; -; Genomic_DNA.
DR   RefSeq; YP_003987190.1; NC_014649.1.
DR   GeneID; 9925314; -.
DR   KEGG; vg:9925314; -.
DR   Proteomes; UP000001134; Genome.
DR   InterPro; IPR008160; Collagen.
DR   Pfam; PF01391; Collagen; 11.
PE   4: Predicted;
KW   Collagen; Glycoprotein; Hydroxylation; Reference proteome; Repeat; Virion.
FT   CHAIN           1..1387
FT                   /note="Collagen-like protein 6"
FT                   /id="PRO_0000059421"
FT   DOMAIN          95..154
FT                   /note="Collagen-like 1"
FT   DOMAIN          161..220
FT                   /note="Collagen-like 2"
FT   DOMAIN          266..325
FT                   /note="Collagen-like 3"
FT   DOMAIN          344..403
FT                   /note="Collagen-like 4"
FT   DOMAIN          450..508
FT                   /note="Collagen-like 5"
FT   DOMAIN          512..751
FT                   /note="Collagen-like 6"
FT   REGION          98..219
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          268..422
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          454..753
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        110..217
FT                   /note="Basic and acidic residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        270..353
FT                   /note="Basic and acidic residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        362..401
FT                   /note="Basic and acidic residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        454..535
FT                   /note="Basic and acidic residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        543..745
FT                   /note="Basic and acidic residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   CARBOHYD        6
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        794
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        814
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        819
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        826
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        846
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        886
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        894
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        969
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1032
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1077
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1123
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1200
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1224
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1232
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
FT   CARBOHYD        1233
FT                   /note="N-linked (GlcNAc...) asparagine; by host"
FT                   /evidence="ECO:0000255"
SQ   SEQUENCE   1387 AA;  141188 MW;  C0FD8A7FD90EBCF5 CRC64;
     MKNYWNCSVS DSEMNLKKKQ MQKNFKNTCD SVSETFVGSG IPSSTFGKNG DIYLDRTTQY
     YYKKNNCIWI KYFCNGYCCF KGCKGGFFCQ KGDKGNNGNN GNNGEKGQKG LKGIKGDIGD
     KGSKGDIGEK GDIGDKGDFG DKGIDGNKGS KGDIGDTGSK GDKGDKGDKG SKGDIGDKGS
     KGDIGVKGSK GDNGDKGSKG DIGVKGSKGD KGNKGDKGDN GLSILSGLDI PSPDLGMDGD
     LYLDTITDEL YKKINGEWIE ITNLKGEKGE IGSKGTKGDD GNKGNKGIKG DKGTTGDKGD
     KGDVGNKGDA GDKGDAGKKG EKGEMGNKGD IGDKGNDGIK GDFGSKGYKG DKGSKGTKGN
     NGFKGDRGDK GDKGSKGDKG DNGIKGNKGS KGDKGDNGIK GEKGESGSSI LFGMGLPDQN
     QGEDGDIYID TLTGELYRKV NGLWVPEIDI KGDKGEKGDR GNVGDKGEKG DIGLKGDKGE
     KGEKGNVGDK GDIGTKGDKG NVGDKGDIGI KGEKGDIGTK GDIGNKGDKG DKGDIGNKGN
     IGNKGEKGDK GVKGDIGEKG EKGDKGVKGD KGEKGEKGEK GEKGEKGDKG NKGDKGNKGD
     KGDKSDKGDK GNKGDKGNKG DKGNKGDKGD NGDKGDKGDN GDKGNKGDKG DNGDKGDKGD
     NGDKGNKGDK GDNGDKGDNG DKGNKGDNGD KGNKGDKGDN GDKGNKGDKG DNGDKGNKGD
     KGDKGDNGDK GDNGDKGDNG DKGDKGESGS SCQIENNDGV TIMSVCTPGI ASIQAYQYEI
     TDISGLENPY DPSNISGLNF KLFDTVKGAF RTGNFTADNM TNVGINSTAM GYHTQATGSG
     SFSFGNNTNG IISSNGIGSF VMGITTSSGV IISEGDGSIA SGYSTNSSTI EIQNNSLSSI
     IHGYSISGSS MRLMEGNIGS MIIGSSETGS IVQSGSGSIA SLINVRATSG TISIGSMSYG
     SKIFGYSNNG TITISDNVHG SQISGIVTNN GQMTIGTLSH GSYLHGYADT SSTISIGTNS
     FGSECIGLAQ NNGTINNGDL SFGCRISGWT LSGLLSTGSG SCGTILYGVA VNSGIINTSG
     RNFGCFVGGY CAYYGKITIG ANSFGTICHG TADASGTILV GTNSTGNLVV GSSQGTISLG
     STNFGSVILG YTENSGSIIS DGNNRGIFMH GYSSSASLYT ASGSCGTVLM GYGTSGSAIN
     VSGLGSFTFG YCPSSGEITQ VLANGSFAFG RNNTTVSENS FSLGYGARSY MPGSMAFSSF
     ATSGNPLRAG SAQTIKVLTR NLNTEFVLAD GNFPTLPYTG YGNIKAKIIG SSGTMSVLYF
     QVFFDGSTHT VTIPTTPAGG QIVYSNPVAV SPAPTFTPVA TVPGFSVTIA NPGTQTFVAS
     FGIVNIS