CO1A1_TOXSP

ID   CO1A1_TOXSP             Reviewed;         982 AA.
AC   C0HJP7;
DT   22-JUL-2015, integrated into UniProtKB/Swiss-Prot.
DT   22-JUL-2015, sequence version 1.
DT   03-AUG-2022, entry version 15.
DE   RecName: Full=Collagen alpha-1(I) chain {ECO:0000303|PubMed:25799987};
DE   AltName: Full=Alpha-1 type I collagen {ECO:0000250|UniProtKB:P02452};
DE   Flags: Fragments;
GN   Name=COL1A1 {ECO:0000250|UniProtKB:P02452};
OS   Toxodon sp.
OC   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia;
OC   Eutheria; Notoungulata; Toxodontidae; Toxodon; unclassified Toxodon.
OX   NCBI_TaxID=1563122 {ECO:0000303|PubMed:25799987};
RN   [1] {ECO:0000305}
RP   PROTEIN SEQUENCE, AND IDENTIFICATION BY MASS SPECTROMETRY.
RC   TISSUE=Bone {ECO:0000303|PubMed:25799987};
RX   PubMed=25799987; DOI=10.1038/nature14249;
RA   Welker F., Collins M.J., Thomas J.A., Wadsley M., Brace S., Cappellini E.,
RA   Turvey S.T., Reguero M., Gelfo J.N., Kramarz A., Burger J.,
RA   Thomas-Oates J., Ashford D.A., Ashton P.D., Rowsell K., Porter D.M.,
RA   Kessler B., Fischer R., Baessmann C., Kaspar S., Olsen J.V., Kiley P.,
RA   Elliott J.A., Kelstrup C.D., Mullin V., Hofreiter M., Willerslev E.,
RA   Hublin J.J., Orlando L., Barnes I., MacPhee R.D.;
RT   "Ancient proteins resolve the evolutionary history of Darwin's South
RT   American ungulates.";
RL   Nature 522:81-84(2015).
CC   -!- FUNCTION: Type I collagen is a member of group I collagen (fibrillar
CC       forming collagen). {ECO:0000305}.
CC   -!- SUBUNIT: Trimers of one alpha 2(I) and two alpha 1(I) chains.
CC       {ECO:0000305}.
CC   -!- SUBCELLULAR LOCATION: Secreted. Secreted, extracellular space.
CC       Secreted, extracellular space, extracellular matrix {ECO:0000305}.
CC   -!- TISSUE SPECIFICITY: Forms the fibrils of tendon, ligaments and bones.
CC       In bones, the fibrils are mineralized with calcium hydroxyapatite.
CC       {ECO:0000305}.
CC   -!- PTM: Prolines at the third position of the tripeptide repeating unit
CC       (G-X-Y) are hydroxylated in some or all of the chains. {ECO:0000305}.
CC   -!- MISCELLANEOUS: These protein fragments were extracted from fossils. The
CC       tryptic peptides required multiple purification steps in order to
CC       eliminate contaminants and to increase the concentration of peptidic
CC       material. {ECO:0000305|PubMed:25799987}.
CC   -!- SIMILARITY: Belongs to the fibrillar collagen family. {ECO:0000305}.
CC   ---------------------------------------------------------------------------
CC   Copyrighted by the UniProt Consortium, see https://www.uniprot.org/terms
CC   Distributed under the Creative Commons Attribution (CC BY 4.0) License
CC   ---------------------------------------------------------------------------
DR   AlphaFoldDB; C0HJP7; -.
DR   PRIDE; C0HJP7; -.
DR   GO; GO:0005581; C:collagen trimer; IEA:UniProtKB-KW.
DR   GO; GO:0005615; C:extracellular space; IEA:UniProtKB-SubCell.
DR   InterPro; IPR008160; Collagen.
DR   Pfam; PF01391; Collagen; 11.
PE   1: Evidence at protein level;
KW   Calcium; Collagen; Direct protein sequencing; Extinct organism protein;
KW   Extracellular matrix; Hydroxylation; Phosphoprotein; Repeat; Secreted.
FT   CHAIN           1..982
FT                   /note="Collagen alpha-1(I) chain"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT                   /id="PRO_0000433499"
FT   REGION          1..982
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        1..36
FT                   /note="Pro residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        229..243
FT                   /note="Pro residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        358..381
FT                   /note="Pro residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        687..701
FT                   /note="Pro residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        950..982
FT                   /note="Pro residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   MOD_RES         81
FT                   /note="Phosphoserine"
FT                   /evidence="ECO:0000250|UniProtKB:P02454"
FT   MOD_RES         586
FT                   /note="Phosphoserine"
FT                   /evidence="ECO:0000250|UniProtKB:P02454"
FT   UNSURE          65
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          71
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          83
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          116
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          215
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          289
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          343
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          349
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          454
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          476
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          525
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          537
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          564
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          568
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          652
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          750
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          759
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          771
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          796
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          801
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          874
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          906
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          945
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          948
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   UNSURE          952
FT                   /note="I or L"
FT                   /evidence="ECO:0000269|PubMed:25799987"
FT   NON_CONS        9..10
FT                   /evidence="ECO:0000303|PubMed:25799987"
FT   NON_CONS        281..282
FT                   /evidence="ECO:0000303|PubMed:25799987"
FT   NON_CONS        508..509
FT                   /evidence="ECO:0000303|PubMed:25799987"
FT   NON_CONS        702..703
FT                   /evidence="ECO:0000303|PubMed:25799987"
FT   NON_CONS        901..902
FT                   /evidence="ECO:0000303|PubMed:25799987"
SQ   SEQUENCE   982 AA;  87148 MW;  2D35D9E8C05B3C10 CRC64;
     GPMGPSGPRG FQGPPGEPGE PGASGPMGPR GPPGPPGKNG DDGEAGKPGR PGERGPPGPQ
     GARGIPGTAG IPGMKGHRGF SGIDGAKGDA GPAGPKGEPG SPGENGAPGQ MGPRGIPGER
     GRPGPTGPAG ARGNDGATGA AGPPGPTGPA GPPGFPGAVG AKGEAGPQGA RGSEGPQGVR
     GEPGPPGPAG AAGPAGNPGA DGQPGAKGAN GAPGIAGAPG FPGARGPSGP QGPSGPPGPK
     GNSGEPGAPG SKGDAGAKGE PGPTGVQGPP GPAGEEGKRG AGEPGPTGIP GPPGERGGPG
     SRGFPGADGV AGPKGPAGER GAPGPAGPKG SPGEAGRPGE AGIPGAKGIT GSPGSPGPDG
     KTGPPGPAGQ DGRPGPPGPP GARGQAGVMG FPGPKGAAGE PGKAGERGVP GPPGAVGPAG
     KDGEAGAQGP PGSAGPAGER GEQGPAGSPG FQGIPGPAGP PGESGKPGEQ GVPGDIGAPG
     PSGARGERGF PGERGVQGPP GPAGPRGAGD AGAPGAPGSQ GAPGIQGMPG ERGAAGIPGP
     KGDRGDAGPK GADGSPGKDG VRGITGPIGP PGPAGAPGDK GESGPSGPAG PTGARGAPGD
     RGEPGPPGPA GFAGPPGADG QPGAKGEPGD AGAKGDAGPA GPAGPTGPPG PIGNVGAPGP
     KGARGSAGPP GATGFPGAAG RVGPPGPAGN AGPPGPPGPV GKKGPRGETG PAGRPGEVGP
     PGPPGPAGEK GSPGSDGPAG APGTPGPQGI AGQRGVVGIP GQRGERGFPG IPGPSGEPGK
     QGPSGASGER GPPGPIGPPG IAGPPGESGR EGAPGAEGSP GRDGSPGPKG DRGEAGPAGP
     PGAPGAPGAP GPVGPAGKSG DRGETGPAGP AGPIGPTGAR GPAGPQGPRG DKGETGEQGD
     RGFSGIQGPP GPPGSPGEQG PAGASGPAGP RGPPGSAGAP GKDGINGIPG PIGPPGPRGR
     TGPAGPRGPP GPPGAPGPPG PP