File: 34_tr_BGN-PCGN_RUS_Standard.t

package info (click to toggle)
liblingua-translit-perl 0.29-2
  • links: PTS, VCS
  • area: main
  • in suites: bookworm, sid, trixie
  • size: 824 kB
  • sloc: xml: 7,707; perl: 416; makefile: 37
file content (134 lines) | stat: -rw-r--r-- 7,505 bytes parent folder | download | duplicates (2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
#  ===========================================================================
#    BGN/PCGN Romanization System for Russian (Standard Variant)
#    for Lingua::Translit Perl Module
#    https://github.com/ndlecic/bgn-pcgn_rus
#
#    Copyright 2017 Nikola D. Lečić <nikola.lecic@anthesphoria.net>
#  ===========================================================================
#
#  This implementation of BGN/PCGN romanization system comes in two
#  variants:
#    - strict
#    - standard
#  Please see respective XML files for explanations.

use strict;
use utf8;
use Test::More tests => 7;
use Lingua::Translit;

my $name        =   "BGN/PCGN RUS Standard";
my $reversible  =   0;

my $input       =   "Все люди рождаются свободными и равными в " .
                    "своём достоинстве и правах. Они наделены разумом и " .
                    "совестью и должны поступать в отношении друг " .
                    "друга в духе братства.";
my $output_ok   =   "Vse lyudi rozhdayutsya svobodnymi i ravnymi v " .
                    "svoyëm dostoinstve i pravakh. Oni nadeleny razumom i " .
                    "sovest'yu i dolzhny postupat' v otnoshenii drug " .
                    "druga v dukhe bratstva.";

my $context     =   "акце́нт, Елисеев, Алетейя, Мейер, Кайафа, " .
                    "Йадав, её; Её, подъём, Йэн, йэн, додекаэдр, " .
                    "ещё, чьё, интеръекционный, выудить, Майя, " .
                    "9-е мая, фойе, Фейербах, Чистые пруды, " .
                    "Достоевский, Толстой, Горкий, Аркадий, Белый, " .
                    "Юрий, Сергей, Хрущёв, Горбачёв";
my $context_ok  =   "aktsent, Yeliseyev, Aleteyya, Meyyer, Kayafa, " .
                    "Yadav, yeyë; Yeyë, pod''yëm, Yen, yen, dodekaedr, " .
                    "yeshchë, ch'yë, inter''yektsionnyy, vyudit', Mayya, " .
                    "9-ye maya, foyye, Feyyerbakh, Chistyye prudy, " .
                    "Dostoyevskiy, Tolstoy, Gorkiy, Arkadiy, Belyy, " .
                    "Yuriy, Sergey, Khrushchëv, Gorbachëv";

my $abbr        =   "ВЦИОМ, РАНХиГС, НЭП, РОССПЭН, АЭС, РЖД, СПбГУ, " .
                    "ЮАР, ЮФУ, ЮУрГУ, РостГЭУ-РИНХ, " .
                    "Ю. Я. Щербаков и Е. Е. Ёлкина";
my $abbr_ok     =   "VTsIOM, RANKhiGS, NEP, ROSSPEN, AES, RZhD, SPbGU, " .
                    "YuAR, YuFU, YuUrGU, RostGEU-RINKh, " .
                    "Yu. Ya. Shcherbakov i Ye. Ye. Yëlkina";

my $excl        =   "Ыыыыыы! ЫЫЫЫЫЫ! Ай-ай-ай. Ээээээххх... " .
                    "Жжжжжж! Йех-ай-яй! Ё-моё...";
my $excl_ok     =   "Yyyyyy! YYYYYY! Ay-ay-ay. Eeeeeekhkhkh... " .
                    "Zhzhzhzhzhzh! Yyekh-ay-yay! Yë-moyë...";

# Geographic names (geo and nonrusgeo tests) are taken from
# https://en.wikipedia.org/wiki/BGN/PCGN_romanization_of_Russian
# https://en.wikipedia.org/wiki/Wikipedia:Romanization_of_Russian
my $geo =           "Азов, Тамбов, Барнаул, Кубань, Владимир, " .
                    "Ульяновск, Грозный, Волгодонск, Дзержинский, " .
                    "Нелидово, Елизово, Чапаевск, Юрьев, Съезд, " .
                    "Белкин, Ёлкин, Остриё, Громадьё, Подъёмный, " .
                    "Озёрный, Жуков, Лужники, Звенигород, Вязьма, " .
                    "Иркутск, Апатиты, Бийск, Киров, Енисейск, " .
                    "Ломоносов, Нелидово, Менделеев, Каменка, " .
                    "Новосибирск, Кандалакша, Омск, Красноярск, " .
                    "Петрозаводск, Серпухов, Ростов, " .
                    "Северобайкальск, Сковородино, Чайковский, " .
                    "Тамбов, Мытищи, Углич, Дудинка, Фурманов, Уфа, " .
                    "Хабаровск, Прохладный, Цимлянск, Ельцин, " .
                    "Чебоксары, Печора, Шахтёрск, Мышкин, Щёлково, " .
                    "Ртищево, Тында, Тюмень, Электрогорск, " .
                    "Радиоэлектроника, Юбилейный, Ключевская, " .
                    "Якутск, Брянск, Набережные Челны";
my $geo_ok =        "Azov, Tambov, Barnaul, Kuban', Vladimir, " .
                    "Ul'yanovsk, Groznyy, Volgodonsk, Dzerzhinskiy, " .
                    "Nelidovo, Yelizovo, Chapayevsk, Yur'yev, " .
                    "S''yezd, Belkin, Yëlkin, Ostriyë, Gromad'yë, " .
                    "Pod''yëmnyy, Ozërnyy, Zhukov, Luzhniki, " .
                    "Zvenigorod, Vyaz'ma, Irkutsk, Apatity, Biysk, " .
                    "Kirov, Yeniseysk, Lomonosov, Nelidovo, " .
                    "Mendeleyev, Kamenka, Novosibirsk, Kandalaksha, " .
                    "Omsk, Krasnoyarsk, Petrozavodsk, Serpukhov, " .
                    "Rostov, Severobaykal'sk, Skovorodino, " .
                    "Chaykovskiy, Tambov, Mytishchi, Uglich, " .
                    "Dudinka, Furmanov, Ufa, Khabarovsk, " .
                    "Prokhladnyy, Tsimlyansk, Yel'tsin, Cheboksary, " .
                    "Pechora, Shakhtërsk, Myshkin, Shchëlkovo, " .
                    "Rtishchevo, Tynda, Tyumen', Elektrogorsk, " .
                    "Radioelektronika, Yubileynyy, Klyuchevskaya, " .
                    "Yakutsk, Bryansk, Naberezhnyye Chelny";

my $nonrusgeo   =   "Йёнчёпинг, Тыайа, Сайылык, Ойусардах, " .
                    "Йошкар-Ола, Ыгыатта, Тыэкан, Суык-Су, " .
                    "Куыркъявр, Иссык-Куль, Вяртсиля, " .
                    "Ташчишма, Улан-Удэ, Мусийкъонгийкоте, " .
                    "Рыркайпий, Йемен";
my $nonrusgeo_ok=   "Yyënchëping, Tyaya, Sayylyk, Oyusardakh, " .
                    "Yoshkar-Ola, Ygyatta, Tyekan, Suyk-Su, " .
                    "Kuyrk''yavr, Issyk-Kul', Vyartsilya, " .
                    "Tashchishma, Ulan-Ude, Musiyk''ongiykote, " .
                    "Ryrkaypiy, Yyemen";

my $tr = new Lingua::Translit($name);

# 1
is($tr->can_reverse(), $reversible, "$name: Reversibility");

# 2
my $output = $tr->translit($input);
is($output, $output_ok, "$name: Universal declaration of human rights");

# 3
$output = $tr->translit($context);
is($output, $context_ok, "$name: Context-sensitive sequences and various name endings");

# 4
$output = $tr->translit($abbr);
is($output, $abbr_ok, "$name: Abbreviations");

# 5
$output = $tr->translit($excl);
is($output, $excl_ok, "$name: Various exclamations");

# 6
$output = $tr->translit($geo);
is($output, $geo_ok, "$name: Various geographic names");

# 7
$output = $tr->translit($nonrusgeo);
is($output, $nonrusgeo_ok, "$name: Complex names of non-Russian origin");

# vim: sts=4 sw=4 ai et