| | """ |
| | FLORES language code mapping to 2 letter ISO language code for compatibility |
| | with Indic NLP Library (https://github.com/anoopkunchukuttan/indic_nlp_library) |
| | """ |
| | flores_codes = { |
| | "asm_Beng": "as", |
| | "awa_Deva": "hi", |
| | "ben_Beng": "bn", |
| | "bho_Deva": "hi", |
| | "brx_Deva": "hi", |
| | "doi_Deva": "hi", |
| | "eng_Latn": "en", |
| | "gom_Deva": "kK", |
| | "guj_Gujr": "gu", |
| | "hin_Deva": "hi", |
| | "hne_Deva": "hi", |
| | "kan_Knda": "kn", |
| | "kas_Arab": "ur", |
| | "kas_Deva": "hi", |
| | "kha_Latn": "en", |
| | "lus_Latn": "en", |
| | "mag_Deva": "hi", |
| | "mai_Deva": "hi", |
| | "mal_Mlym": "ml", |
| | "mar_Deva": "mr", |
| | "mni_Beng": "bn", |
| | "mni_Mtei": "hi", |
| | "npi_Deva": "ne", |
| | "ory_Orya": "or", |
| | "pan_Guru": "pa", |
| | "san_Deva": "hi", |
| | "sat_Olck": "or", |
| | "snd_Arab": "ur", |
| | "snd_Deva": "hi", |
| | "tam_Taml": "ta", |
| | "tel_Telu": "te", |
| | "urd_Arab": "ur", |
| | } |
| |
|
| |
|
| | flores_to_iso = { |
| | "asm_Beng": "as", |
| | "awa_Deva": "awa", |
| | "ben_Beng": "bn", |
| | "bho_Deva": "bho", |
| | "brx_Deva": "brx", |
| | "doi_Deva": "doi", |
| | "eng_Latn": "en", |
| | "gom_Deva": "gom", |
| | "guj_Gujr": "gu", |
| | "hin_Deva": "hi", |
| | "hne_Deva": "hne", |
| | "kan_Knda": "kn", |
| | "kas_Arab": "ksa", |
| | "kas_Deva": "ksd", |
| | "kha_Latn": "kha", |
| | "lus_Latn": "lus", |
| | "mag_Deva": "mag", |
| | "mai_Deva": "mai", |
| | "mal_Mlym": "ml", |
| | "mar_Deva": "mr", |
| | "mni_Beng": "mnib", |
| | "mni_Mtei": "mnim", |
| | "npi_Deva": "ne", |
| | "ory_Orya": "or", |
| | "pan_Guru": "pa", |
| | "san_Deva": "sa", |
| | "sat_Olck": "sat", |
| | "snd_Arab": "sda", |
| | "snd_Deva": "sdd", |
| | "tam_Taml": "ta", |
| | "tel_Telu": "te", |
| | "urd_Arab": "ur", |
| | } |
| |
|
| | iso_to_flores = {iso_code: flores_code for flores_code, iso_code in flores_to_iso.items()} |
| | |
| | iso_to_flores["ks"] = "kas_Arab" |
| | iso_to_flores["ks_Deva"] = "kas_Deva" |
| | iso_to_flores["mni"] = "mni_Mtei" |
| | iso_to_flores["mni_Beng"] = "mni_Beng" |
| | iso_to_flores["sd"] = "snd_Arab" |
| | iso_to_flores["sd_Deva"] = "snd_Deva" |
| |
|