ID Q98MG8_RHILO Unreviewed; 2147 AA.
AC Q98MG8;
DT 01-OCT-2001, integrated into UniProtKB/TrEMBL.
DT 01-OCT-2001, sequence version 1.
DT 27-MAR-2024, entry version 105.
DE SubName: Full=Hypothetical glycine-rich protein {ECO:0000313|EMBL:BAB48145.1};
GN OrderedLocusNames=mlr0585 {ECO:0000313|EMBL:BAB48145.1};
OS Mesorhizobium japonicum (strain LMG 29417 / CECT 9101 / MAFF 303099)
OS (Mesorhizobium loti (strain MAFF 303099)).
OC Bacteria; Pseudomonadota; Alphaproteobacteria; Hyphomicrobiales;
OC Phyllobacteriaceae; Mesorhizobium.
OX NCBI_TaxID=266835 {ECO:0000313|EMBL:BAB48145.1, ECO:0000313|Proteomes:UP000000552};
RN [1] {ECO:0000313|EMBL:BAB48145.1, ECO:0000313|Proteomes:UP000000552}
RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA].
RC STRAIN=LMG 29417 / CECT 9101 / MAFF 303099
RC {ECO:0000313|Proteomes:UP000000552};
RX PubMed=11214968; DOI=10.1093/dnares/7.6.331;
RA Kaneko T., Nakamura Y., Sato S., Asamizu E., Kato T., Sasamoto S.,
RA Watanabe A., Idesawa K., Ishikawa A., Kawashima K., Kimura T., Kishida Y.,
RA Kiyokawa C., Kohara M., Matsumoto M., Matsuno A., Mochizuki Y.,
RA Nakayama S., Nakazaki N., Shimpo S., Sugimoto M., Takeuchi C., Yamada M.,
RA Tabata S.;
RT "Complete genome structure of the nitrogen-fixing symbiotic bacterium
RT Mesorhizobium loti.";
RL DNA Res. 7:331-338(2000).
CC ---------------------------------------------------------------------------
CC Copyrighted by the UniProt Consortium, see https://www.uniprot.org/terms
CC Distributed under the Creative Commons Attribution (CC BY 4.0) License
CC ---------------------------------------------------------------------------
DR EMBL; BA000012; BAB48145.1; -; Genomic_DNA.
DR KEGG; mlo:mlr0585; -.
DR eggNOG; COG3209; Bacteria.
DR eggNOG; COG4675; Bacteria.
DR HOGENOM; CLU_235637_0_0_5; -.
DR Proteomes; UP000000552; Chromosome.
DR InterPro; IPR008160; Collagen.
DR InterPro; IPR025592; DUF4347.
DR PANTHER; PTHR24023; COLLAGEN ALPHA; 1.
DR PANTHER; PTHR24023:SF1082; COLLAGEN ALPHA-1(X) CHAIN; 1.
DR Pfam; PF01391; Collagen; 2.
DR Pfam; PF14252; DUF4347; 1.
PE 4: Predicted;
FT DOMAIN 34..196
FT /note="DUF4347"
FT /evidence="ECO:0000259|Pfam:PF14252"
FT REGION 284..2074
FT /note="Disordered"
FT /evidence="ECO:0000256|SAM:MobiDB-lite"
FT REGION 2099..2147
FT /note="Disordered"
FT /evidence="ECO:0000256|SAM:MobiDB-lite"
FT COMPBIAS 284..1992
FT /note="Polar residues"
FT /evidence="ECO:0000256|SAM:MobiDB-lite"
FT COMPBIAS 1999..2040
FT /note="Basic and acidic residues"
FT /evidence="ECO:0000256|SAM:MobiDB-lite"
FT COMPBIAS 2041..2066
FT /note="Polar residues"
FT /evidence="ECO:0000256|SAM:MobiDB-lite"
FT COMPBIAS 2099..2136
FT /note="Polar residues"
FT /evidence="ECO:0000256|SAM:MobiDB-lite"
SQ SEQUENCE 2147 AA; 181048 MW; FE2191AA8408E9AB CRC64;
MLFSRGHAGR ACVPLNLKLN SSPQEPVMAR ASEILFLDPS IPDLETALRN VRPEVDAIVL
DKRQPAARQM AEALEGRNGL DAVHILAHGA PGRLGFGSGE WSSDTLVRDA ANLAAIGRAL
ADCGGLRLWS CETGYGAAGE AFVKALSEAT GAGVSAAVGL VGAEALGGRW DLPISPMSRV
APPLTNTGTA SYAGVLSLEV TLTGSLDTAG SISQKAVQYY ITNSSNVIVA SFTLPSKSSA
QFSSVAMIVD VPVSGTYTIT ALVQDDTDDN NQWSVVSAGT FNLSNNSVTS GPSSNSDGVF
TLTGVSSTSN SGSTGPTGAT GATGATGATG RTGSTGATGS TGATGATGAT GHTGSTGATG
STGATGSTGA TGSTGATGST GATGATGSTG ATGATGATGS TGATGPTGAT GATGATGSTG
ATGSTGATGA TGSTGATGAT GATGSTGATG PTGATGATGA TGSTGATGST GATGDTGATG
STGATGSTGA TGSTGATGDT GATGSTGATG STGSTGATGA TGDTGATGST GATGATGATG
DTGATGSTGA TGSTGDTGAT GATGSTGSTG ATGSTGATGA TGDTGATGST GATGSTGATG
STGATGSTGA TGSTGATGST GATGSTGATG STGATGSTGA TGATGDTGAT GSTGATGSTG
STGATGATGD TGATGSTGAT GATGATGDTG ATGSTGATGS TGATGSTGAT GSTGATGATG
STGATGATGS TGATGSTGAT GSTGATGSTG ATGATGSTGA TGSTGATGAT GATGSTGATG
STGATGSTGA TGSTGATGST GATGATGDTG ATGSTGATGS TGSTGATGDT GATGSTGSTG
ATGATGSTGA TGSTGATGAT GSTGDTGATG ATGSTGATGS TGATGSTGAT GSTGATGSTG
DTGATGATGS TGATGSTGAT GATGATGSTG ATGSTGATGS TGATGSTGAT GATGSTGATG
STGATGSTGA TGSTGATGST GATGSTGDTG ATGATGSTGA TGSTGATGAT GATGSTGATG
STGATGSTGA TGSTGATGAT GSTGATGSTG ATGSTGATGS TGATGSTGAT GSTGATGSTG
ATGSTGATGS TGATGSTGAT GSTGATGSTG ATGSTGATGS TGATGSTGAT GSTGATGSTG
STGATGATGA TGSTGATGST GATGSTGATG STGATGSTGA TGSTGATGST GATGSTGATG
STGATGSTGA TGSTGATGST GATGSTGATG ATGSTGATGS TGATGSTGAT GATGSTGATG
STGATGSTGA TGSTGASGST GATGSTGATG STGATGSTGA TGSTGATGST GATGATGSTG
ATGATGSTGA TGSTGATGST GATGSTGATG STGATGSTGA TGATGATGST GATGSTGATG
STGATGSTGA TGATGSTGST GATGATGSTG ATGSTGATGS TGATGATGST GATGSTGATG
STGATGSTGA TGSTGATGST GATGATGSTG ATGSTGATGS TGATGATGST GATGSTGATG
STGATGSTGA TGATGSTGAT GSTGATGSTG ATGSTGASGS TGATGSTGAT GSTGATGSTG
ATGSTGATGA TGSTGSTGAT GSTGATGSTG ATGSTGATGS TGATGSTGAT GSTGATGSTG
ATGSTGATGS TGASGSTGAT GSTGATGSTG ATGSTGATGS TGATGATGST GSTGATGSTG
ATGSTGATGS TGATGSTGAT GSTGATGSTG ATGSTGATGS TGATGSTGAT GSTGATGSTG
ATGSTGATGS TGATGSTGAT GSTGATGSTG ATGSTGATGS TGATGSTGAT GSTGATGSTG
ATGSTGATGS TGATGSTGAT GSTGATGSTG ATGATGSTGA TGSTGATGST GATGSTGATG
STGATGATGS TGATGSTGAT GSTGATGATG ATGSTGATGS TGATGSTGAT GATGSTGATG
ATGSTGATGS TGSTGATGAT GSTGATGSTG ATGSTGATGS TGATGSTGST GSTGATGSTG
ATGSTGAPGP TGATGATGSA DDDDKHHHHH HHHGNNGNGD DDRSNRGNRR DQDDDDGKSG
NGNNAKVTAS TLGLKDTTQF LQSGAPDGNS GPGKHASFGQ LVGLAATSVT TDLLNVLKTV
SGSGNNQNKP SGASTDLTSD QTKPGAGYAS NEHTVKTSLK DLLKPHE
//