SIM1_PANTR

ID   SIM1_PANTR              Reviewed;         766 AA.
AC   A2T6X9;
DT   01-MAY-2007, integrated into UniProtKB/Swiss-Prot.
DT   06-MAR-2007, sequence version 1.
DT   03-AUG-2022, entry version 98.
DE   RecName: Full=Single-minded homolog 1;
GN   Name=SIM1;
OS   Pan troglodytes (Chimpanzee).
OC   Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia;
OC   Eutheria; Euarchontoglires; Primates; Haplorrhini; Catarrhini; Hominidae;
OC   Pan.
OX   NCBI_TaxID=9598;
RN   [1]
RP   NUCLEOTIDE SEQUENCE [GENOMIC DNA].
RA   Nickel G.C., Tefft D.L., Trevarthen K., Funt J., Adams M.D.;
RT   "Positive selection in transcription factor genes on the human lineage.";
RL   Submitted (AUG-2006) to the EMBL/GenBank/DDBJ databases.
CC   -!- FUNCTION: Transcriptional factor that may have pleiotropic effects
CC       during embryogenesis and in the adult. {ECO:0000250}.
CC   -!- SUBUNIT: Efficient DNA binding requires dimerization with another bHLH
CC       protein. Heterodimer; forms a heterodimer with ARNT, ARNT2 (By
CC       similarity). {ECO:0000250|UniProtKB:Q61045}.
CC   -!- SUBCELLULAR LOCATION: Nucleus {ECO:0000255|PROSITE-ProRule:PRU00632,
CC       ECO:0000255|PROSITE-ProRule:PRU00981}.
CC   ---------------------------------------------------------------------------
CC   Copyrighted by the UniProt Consortium, see https://www.uniprot.org/terms
CC   Distributed under the Creative Commons Attribution (CC BY 4.0) License
CC   ---------------------------------------------------------------------------
DR   EMBL; DQ977329; ABM91934.1; -; Genomic_DNA.
DR   RefSeq; NP_001074957.1; NM_001081488.1.
DR   RefSeq; XP_009449955.1; XM_009451680.2.
DR   AlphaFoldDB; A2T6X9; -.
DR   SMR; A2T6X9; -.
DR   STRING; 9598.ENSPTRP00000031505; -.
DR   PaxDb; A2T6X9; -.
DR   Ensembl; ENSPTRT00000034090; ENSPTRP00000031505; ENSPTRG00000018447.
DR   GeneID; 472084; -.
DR   KEGG; ptr:472084; -.
DR   CTD; 6492; -.
DR   VGNC; VGNC:7909; SIM1.
DR   eggNOG; KOG3559; Eukaryota.
DR   GeneTree; ENSGT00940000156143; -.
DR   HOGENOM; CLU_010044_4_0_1; -.
DR   InParanoid; A2T6X9; -.
DR   OrthoDB; 231698at2759; -.
DR   TreeFam; TF317772; -.
DR   Proteomes; UP000002277; Chromosome 6.
DR   Bgee; ENSPTRG00000018447; Expressed in adult mammalian kidney and 4 other tissues.
DR   GO; GO:0005634; C:nucleus; IEA:UniProtKB-SubCell.
DR   GO; GO:0000981; F:DNA-binding transcription factor activity, RNA polymerase II-specific; IBA:GO_Central.
DR   GO; GO:0046982; F:protein heterodimerization activity; ISS:UniProtKB.
DR   GO; GO:0000977; F:RNA polymerase II transcription regulatory region sequence-specific DNA binding; IBA:GO_Central.
DR   GO; GO:0030154; P:cell differentiation; IEA:UniProtKB-KW.
DR   GO; GO:0007399; P:nervous system development; IEA:UniProtKB-KW.
DR   GO; GO:0006357; P:regulation of transcription by RNA polymerase II; IBA:GO_Central.
DR   CDD; cd00130; PAS; 2.
DR   Gene3D; 4.10.280.10; -; 1.
DR   InterPro; IPR011598; bHLH_dom.
DR   InterPro; IPR036638; HLH_DNA-bd_sf.
DR   InterPro; IPR001610; PAC.
DR   InterPro; IPR000014; PAS.
DR   InterPro; IPR035965; PAS-like_dom_sf.
DR   InterPro; IPR013767; PAS_fold.
DR   InterPro; IPR013655; PAS_fold_3.
DR   InterPro; IPR010578; SIM_C.
DR   Pfam; PF00010; HLH; 1.
DR   Pfam; PF00989; PAS; 1.
DR   Pfam; PF08447; PAS_3; 1.
DR   Pfam; PF06621; SIM_C; 1.
DR   SMART; SM00353; HLH; 1.
DR   SMART; SM00086; PAC; 1.
DR   SMART; SM00091; PAS; 2.
DR   SUPFAM; SSF47459; SSF47459; 1.
DR   SUPFAM; SSF55785; SSF55785; 2.
DR   PROSITE; PS50888; BHLH; 1.
DR   PROSITE; PS50112; PAS; 2.
DR   PROSITE; PS51302; SIM_C; 1.
PE   3: Inferred from homology;
KW   Developmental protein; Differentiation; DNA-binding; Neurogenesis; Nucleus;
KW   Reference proteome; Repeat; Transcription; Transcription regulation.
FT   CHAIN           1..766
FT                   /note="Single-minded homolog 1"
FT                   /id="PRO_0000285525"
FT   DOMAIN          1..53
FT                   /note="bHLH"
FT                   /evidence="ECO:0000255|PROSITE-ProRule:PRU00981"
FT   DOMAIN          77..147
FT                   /note="PAS 1"
FT                   /evidence="ECO:0000255|PROSITE-ProRule:PRU00140"
FT   DOMAIN          218..288
FT                   /note="PAS 2"
FT                   /evidence="ECO:0000255|PROSITE-ProRule:PRU00140"
FT   DOMAIN          292..335
FT                   /note="PAC"
FT   DOMAIN          336..766
FT                   /note="Single-minded C-terminal"
FT                   /evidence="ECO:0000255|PROSITE-ProRule:PRU00632"
FT   REGION          353..431
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          528..563
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          642..662
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   MOTIF           368..387
FT                   /note="Nuclear localization signal"
FT                   /evidence="ECO:0000250"
FT   COMPBIAS        353..394
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        536..563
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        646..662
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
SQ   SEQUENCE   766 AA;  85514 MW;  B1989C537D136A79 CRC64;
     MKEKSKNAAR TRREKENSEF YELAKLLPLP SAITSQLDKA SIIRLTTSYL KMRVVFPEGL
     GEAWGHSSRT SPLDNVGREL GSHLLQTLDG FIFVVAPDGK IMYISETASV HLGLSQVELT
     GNSIYEYIHP ADHDEMTAVL TAHQPYHSHF VQEYEIERSF FLRMKCVLAK RNAGLTCGGY
     KVIHCSGYLK IRQYSLDMSP FDGCYQNVGL VAVGHSLPPS AVTEIKLHSN MFMFRASLDM
     KLIFLDSRVA ELTGYEPQDL IEKTLYHHVH GCDTFHLRCA HHLLLVKGQV TTKYYRFLAK
     HGGWVWVQSY ATIVHNSRSS RPHCIVSVNY VLTDTEYKGL QLSLDQISAS KPAFSYTSSS
     TPTMTDNRKG AKSRLSSSKS KSRTSPYPQY SGFHTERSES DHDSQWGGSP LTDTASPQLL
     DPADRPGSQH DASCAYRQFS DRSSLCYGFA LDHSRLVEER HFHTQACEGG RCEAGRYFLG
     TPQAGREPWW GSRAALPLTK ASPESREAYE NSMPHIASVH RIHGRGHWDE DSVVSSPDPG
     SASESGDRYR TEQYQSSPHE PSKIETLIRA TQQMIKEEEN RLQLRKAPSD QLASINGAGK
     KHSLCFANYQ QPPPTGEICH GSALANTSPC DHIQQREGKM LSPRENDYDN SPTALSRISS
     PNSDRISKSS LILAKDYLHS DISPHQTAGD HPTVSPNCFG SHRQYLDKHA YTLTGYALEH
     LYDSETIRNY SLGCNGSHFD VTSHLRMQPD PAQGHKGTSV IITNGS