NLP1_ARATH

ID   NLP1_ARATH              Reviewed;         909 AA.
AC   Q8H111; Q56XE7;
DT   30-NOV-2010, integrated into UniProtKB/Swiss-Prot.
DT   01-MAR-2003, sequence version 1.
DT   25-MAY-2022, entry version 104.
DE   RecName: Full=Protein NLP1;
DE            Short=AtNLP1;
DE   AltName: Full=NIN-like protein 1;
DE   AltName: Full=Nodule inception protein-like protein 1;
GN   Name=NLP1; OrderedLocusNames=At2g17150; ORFNames=F6P23.15, T23A1;
OS   Arabidopsis thaliana (Mouse-ear cress).
OC   Eukaryota; Viridiplantae; Streptophyta; Embryophyta; Tracheophyta;
OC   Spermatophyta; Magnoliopsida; eudicotyledons; Gunneridae; Pentapetalae;
OC   rosids; malvids; Brassicales; Brassicaceae; Camelineae; Arabidopsis.
OX   NCBI_TaxID=3702;
RN   [1]
RP   NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA].
RC   STRAIN=cv. Columbia;
RX   PubMed=10617197; DOI=10.1038/45471;
RA   Lin X., Kaul S., Rounsley S.D., Shea T.P., Benito M.-I., Town C.D.,
RA   Fujii C.Y., Mason T.M., Bowman C.L., Barnstead M.E., Feldblyum T.V.,
RA   Buell C.R., Ketchum K.A., Lee J.J., Ronning C.M., Koo H.L., Moffat K.S.,
RA   Cronin L.A., Shen M., Pai G., Van Aken S., Umayam L., Tallon L.J.,
RA   Gill J.E., Adams M.D., Carrera A.J., Creasy T.H., Goodman H.M.,
RA   Somerville C.R., Copenhaver G.P., Preuss D., Nierman W.C., White O.,
RA   Eisen J.A., Salzberg S.L., Fraser C.M., Venter J.C.;
RT   "Sequence and analysis of chromosome 2 of the plant Arabidopsis thaliana.";
RL   Nature 402:761-768(1999).
RN   [2]
RP   GENOME REANNOTATION.
RC   STRAIN=cv. Columbia;
RX   PubMed=27862469; DOI=10.1111/tpj.13415;
RA   Cheng C.Y., Krishnakumar V., Chan A.P., Thibaud-Nissen F., Schobel S.,
RA   Town C.D.;
RT   "Araport11: a complete reannotation of the Arabidopsis thaliana reference
RT   genome.";
RL   Plant J. 89:789-804(2017).
RN   [3]
RP   NUCLEOTIDE SEQUENCE [LARGE SCALE MRNA] (ISOFORM 1).
RC   STRAIN=cv. Columbia;
RX   PubMed=14593172; DOI=10.1126/science.1088305;
RA   Yamada K., Lim J., Dale J.M., Chen H., Shinn P., Palm C.J., Southwick A.M.,
RA   Wu H.C., Kim C.J., Nguyen M., Pham P.K., Cheuk R.F., Karlin-Newmann G.,
RA   Liu S.X., Lam B., Sakano H., Wu T., Yu G., Miranda M., Quach H.L.,
RA   Tripp M., Chang C.H., Lee J.M., Toriumi M.J., Chan M.M., Tang C.C.,
RA   Onodera C.S., Deng J.M., Akiyama K., Ansari Y., Arakawa T., Banh J.,
RA   Banno F., Bowser L., Brooks S.Y., Carninci P., Chao Q., Choy N., Enju A.,
RA   Goldsmith A.D., Gurjal M., Hansen N.F., Hayashizaki Y., Johnson-Hopson C.,
RA   Hsuan V.W., Iida K., Karnes M., Khan S., Koesema E., Ishida J., Jiang P.X.,
RA   Jones T., Kawai J., Kamiya A., Meyers C., Nakajima M., Narusaka M.,
RA   Seki M., Sakurai T., Satou M., Tamse R., Vaysberg M., Wallender E.K.,
RA   Wong C., Yamamura Y., Yuan S., Shinozaki K., Davis R.W., Theologis A.,
RA   Ecker J.R.;
RT   "Empirical analysis of transcriptional activity in the Arabidopsis
RT   genome.";
RL   Science 302:842-846(2003).
RN   [4]
RP   NUCLEOTIDE SEQUENCE [LARGE SCALE MRNA] (ISOFORM 2).
RC   STRAIN=cv. Columbia;
RA   Totoki Y., Seki M., Ishida J., Nakajima M., Enju A., Kamiya A.,
RA   Narusaka M., Shin-i T., Nakagawa M., Sakamoto N., Oishi K., Kohara Y.,
RA   Kobayashi M., Toyoda A., Sakaki Y., Sakurai T., Iida K., Akiyama K.,
RA   Satou M., Toyoda T., Konagaya A., Carninci P., Kawai J., Hayashizaki Y.,
RA   Shinozaki K.;
RT   "Large-scale analysis of RIKEN Arabidopsis full-length (RAFL) cDNAs.";
RL   Submitted (MAR-2005) to the EMBL/GenBank/DDBJ databases.
RN   [5]
RP   GENE FAMILY, AND NOMENCLATURE.
RX   PubMed=15785851; DOI=10.1007/s00239-004-0144-2;
RA   Schauser L., Wieloch W., Stougaard J.;
RT   "Evolution of NIN-like proteins in Arabidopsis, rice, and Lotus
RT   japonicus.";
RL   J. Mol. Evol. 60:229-237(2005).
CC   -!- FUNCTION: Probable transcription factor. {ECO:0000250}.
CC   -!- SUBCELLULAR LOCATION: Nucleus {ECO:0000255|PROSITE-ProRule:PRU00852}.
CC   -!- ALTERNATIVE PRODUCTS:
CC       Event=Alternative splicing; Named isoforms=2;
CC       Name=1;
CC         IsoId=Q8H111-1; Sequence=Displayed;
CC       Name=2;
CC         IsoId=Q8H111-2; Sequence=VSP_040192, VSP_040193, VSP_040194;
CC   ---------------------------------------------------------------------------
CC   Copyrighted by the UniProt Consortium, see https://www.uniprot.org/terms
CC   Distributed under the Creative Commons Attribution (CC BY 4.0) License
CC   ---------------------------------------------------------------------------
DR   EMBL; AC007127; -; NOT_ANNOTATED_CDS; Genomic_DNA.
DR   EMBL; CP002685; AEC06591.1; -; Genomic_DNA.
DR   EMBL; CP002685; AEC06592.1; -; Genomic_DNA.
DR   EMBL; CP002685; ANM62251.1; -; Genomic_DNA.
DR   EMBL; BT000911; AAN41311.1; -; mRNA.
DR   EMBL; AK221727; BAD93733.1; -; mRNA.
DR   RefSeq; NP_001031361.2; NM_001036284.3. [Q8H111-2]
DR   RefSeq; NP_001324424.1; NM_001335542.1. [Q8H111-1]
DR   RefSeq; NP_179306.2; NM_127269.3. [Q8H111-1]
DR   AlphaFoldDB; Q8H111; -.
DR   SMR; Q8H111; -.
DR   BioGRID; 1577; 8.
DR   IntAct; Q8H111; 5.
DR   STRING; 3702.AT2G17150.1; -.
DR   iPTMnet; Q8H111; -.
DR   PaxDb; Q8H111; -.
DR   PRIDE; Q8H111; -.
DR   EnsemblPlants; AT2G17150.1; AT2G17150.1; AT2G17150. [Q8H111-1]
DR   EnsemblPlants; AT2G17150.2; AT2G17150.2; AT2G17150. [Q8H111-2]
DR   EnsemblPlants; AT2G17150.6; AT2G17150.6; AT2G17150. [Q8H111-1]
DR   GeneID; 816220; -.
DR   Gramene; AT2G17150.1; AT2G17150.1; AT2G17150. [Q8H111-1]
DR   Gramene; AT2G17150.2; AT2G17150.2; AT2G17150. [Q8H111-2]
DR   Gramene; AT2G17150.6; AT2G17150.6; AT2G17150. [Q8H111-1]
DR   KEGG; ath:AT2G17150; -.
DR   Araport; AT2G17150; -.
DR   TAIR; locus:2059692; AT2G17150.
DR   eggNOG; ENOG502QQ6H; Eukaryota.
DR   HOGENOM; CLU_008971_0_0_1; -.
DR   InParanoid; Q8H111; -.
DR   OMA; RTREDPC; -.
DR   OrthoDB; 1337805at2759; -.
DR   PhylomeDB; Q8H111; -.
DR   PRO; PR:Q8H111; -.
DR   Proteomes; UP000006548; Chromosome 2.
DR   ExpressionAtlas; Q8H111; baseline and differential.
DR   Genevisible; Q8H111; AT.
DR   GO; GO:0005634; C:nucleus; IEA:UniProtKB-SubCell.
DR   GO; GO:0003677; F:DNA binding; IEA:UniProtKB-KW.
DR   GO; GO:0003700; F:DNA-binding transcription factor activity; ISS:TAIR.
DR   CDD; cd06407; PB1_NLP; 1.
DR   InterPro; IPR045012; NLP.
DR   InterPro; IPR000270; PB1_dom.
DR   InterPro; IPR034891; PB1_NLP.
DR   InterPro; IPR003035; RWP-RK_dom.
DR   PANTHER; PTHR32002; PTHR32002; 1.
DR   Pfam; PF00564; PB1; 1.
DR   Pfam; PF02042; RWP-RK; 1.
DR   SMART; SM00666; PB1; 1.
DR   PROSITE; PS51745; PB1; 1.
DR   PROSITE; PS51519; RWP_RK; 1.
PE   2: Evidence at transcript level;
KW   Alternative splicing; DNA-binding; Nucleus; Reference proteome;
KW   Transcription; Transcription regulation.
FT   CHAIN           1..909
FT                   /note="Protein NLP1"
FT                   /id="PRO_0000401486"
FT   DOMAIN          595..676
FT                   /note="RWP-RK"
FT                   /evidence="ECO:0000255|PROSITE-ProRule:PRU00852"
FT   DOMAIN          811..894
FT                   /note="PB1"
FT                   /evidence="ECO:0000255|PROSITE-ProRule:PRU01081"
FT   REGION          51..71
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          536..556
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          568..605
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   REGION          690..745
FT                   /note="Disordered"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   COMPBIAS        568..592
FT                   /note="Polar residues"
FT                   /evidence="ECO:0000256|SAM:MobiDB-lite"
FT   VAR_SEQ         294..297
FT                   /note="EFLQ -> E (in isoform 2)"
FT                   /evidence="ECO:0000303|Ref.4"
FT                   /id="VSP_040192"
FT   VAR_SEQ         631..657
FT                   /note="VCPTTLKRICRQHGIMRWPSRKIKKVG -> GKRMLYTAGDIAPFFMNFDSY
FT                   CFLGKA (in isoform 2)"
FT                   /evidence="ECO:0000303|Ref.4"
FT                   /id="VSP_040193"
FT   VAR_SEQ         658..909
FT                   /note="Missing (in isoform 2)"
FT                   /evidence="ECO:0000303|Ref.4"
FT                   /id="VSP_040194"
SQ   SEQUENCE   909 AA;  100886 MW;  F8A8AFD3DB0DA470 CRC64;
     MEDDGGSDGG EGNGGFSPNS SFGAFADTAM DLDFMDELLF DGCWLETTDS KSLKQTEQSP
     SASTAMNDNS PFLCFGENPS QDNFSNEETE RMFPQAEKFL LEEAEVGKSW WIAPSASEGP
     SSSVKERLLQ AISGLNEAVQ DKDFLVQIWV PIQQEGKSFL TTWAQPHLFN QEYSSLAEYR
     HVSETYNFPA DEGMKDFVGL PGRVFLQKFP EWTPDVRFFR RDEYPRIKEA QKCDVRGSLA
     LPVFERGSGT CLGVVEIVTT TQKMNYRQEL EKMCKALEAV DLRSSSNLNT PSSEFLQVYS
     DFYCAALPEI KDFLATICRS YDFPLALSWA PCARQGKVGS RHSDENFSEC VSTIDSACSV
     PDEQSKSFWE ACSEHHLLQG EGIVGKAFEA TKLFFVPEVA TFSKTNYPLA HHAKISGLHA
     ALAVPLKSKS GLVEFVLEFF FPKACLDTEA QQEMLKSLCV TLQQDFRSSN LFIKDLELEV
     VLPVRETMLF SENLLCGAET VESLTEIQMQ ESSWIAHMIK ANEKGKDVSL SWEYQKEDPK
     ELSSGRENSQ LDPVPNNVPL EAEQLQQAST PGLRVDIGPS TESASTGGGN MLSSRRPGEK
     KRAKTEKTIG LEVLRQYFAG SLKDAAKSIG VCPTTLKRIC RQHGIMRWPS RKIKKVGHSL
     KKLQLVMDSV QGAQGSIQLD SFYTSFPELN SPNMSSNGPS LKSNEQPSHL NAQTDNGIMA
     EENPRSPSSS CSKSSGSSNN NENTGNILVA EDADAVLKRA HSEAQLHNVN QEETKCLART
     QSHKTFKEPL VLDNSSPLTG SSNTSLRARG AIKVKATFGE ARIRFTLLPS WGFAELKQEI
     ARRFNIDDIS WFDLKYLDDD KEWVLLTCEA DLVECIDIYR LTQTHTIKIS LNEASQVKLS
     GSFGNTGLS