package info (click to toggle)
sentencepiece 0.2.1-1
  • links: PTS, VCS
  • area: main
  • in suites: forky, sid
  • size: 53,912 kB
  • sloc: cpp: 190,245; python: 1,776; xml: 231; perl: 198; sh: 58; pascal: 50; makefile: 23

Folder: src

d .. (parent)
d d rwxr-xr-x 140 builtin_pb
- - rw-r--r-- 12,242 CMakeLists.txt
- - rw-r--r-- 6,591 bpe_model.cc
- - rw-r--r-- 1,748 bpe_model.h
- - rw-r--r-- 9,294 bpe_model_test.cc
- - rw-r--r-- 10,630 bpe_model_trainer.cc
- - rw-r--r-- 4,616 bpe_model_trainer.h
- - rw-r--r-- 4,789 bpe_model_trainer_test.cc
- - rw-r--r-- 22,104 builder.cc
- - rw-r--r-- 5,734 builder.h
- - rw-r--r-- 7,281 builder_test.cc
- - rw-r--r-- 1,304 char_model.cc
- - rw-r--r-- 1,061 char_model.h
- - rw-r--r-- 3,525 char_model_test.cc
- - rw-r--r-- 1,784 char_model_trainer.cc
- - rw-r--r-- 1,265 char_model_trainer.h
- - rw-r--r-- 2,482 char_model_trainer_test.cc
- - rw-r--r-- 4,838 common.h
- - rw-r--r-- 6,757 compile_charsmap_main.cc
- - rw-r--r-- 4,105 error.cc
- - rw-r--r-- 3,547 filesystem.cc
- - rw-r--r-- 1,852 filesystem.h
- - rw-r--r-- 1,553 filesystem_test.cc
- - rw-r--r-- 2,605 freelist.h
- - rw-r--r-- 1,280 freelist_test.cc
- - rw-r--r-- 1,856 init.h
- - rw-r--r-- 5,365 init_test.cc
- - rw-r--r-- 1,596 model_factory.cc
- - rw-r--r-- 972 model_factory.h
- - rw-r--r-- 1,743 model_factory_test.cc
- - rw-r--r-- 7,123 model_interface.cc
- - rw-r--r-- 8,751 model_interface.h
- - rw-r--r-- 15,351 model_interface_test.cc
- - rw-r--r-- 7,274,179 normalization_rule.h
- - rw-r--r-- 12,139 normalizer.cc
- - rw-r--r-- 5,813 normalizer.h
- - rw-r--r-- 17,616 normalizer_test.cc
- - rw-r--r-- 2,132 pretokenizer_for_training.cc
- - rw-r--r-- 2,152 pretokenizer_for_training.h
- - rw-r--r-- 2,892 pretokenizer_for_training_test.cc
- - rw-r--r-- 2,708 sentencepiece.proto
- - rw-r--r-- 14,023 sentencepiece_model.proto
- - rw-r--r-- 39,526 sentencepiece_processor.cc
- - rw-r--r-- 28,388 sentencepiece_processor.h
- - rw-r--r-- 54,053 sentencepiece_processor_test.cc
- - rw-r--r-- 14,832 sentencepiece_trainer.cc
- - rw-r--r-- 8,559 sentencepiece_trainer.h
- - rw-r--r-- 16,800 sentencepiece_trainer_test.cc
- - rw-r--r-- 11,012 spec_parser.h
- - rw-r--r-- 4,037 spm_decode_main.cc
- - rw-r--r-- 6,714 spm_encode_main.cc
- - rw-r--r-- 2,083 spm_export_vocab_main.cc
- - rw-r--r-- 4,214 spm_normalize_main.cc
- - rw-r--r-- 13,264 spm_train_main.cc
- - rw-r--r-- 1,077 test_main.cc
- - rw-r--r-- 1,875 testharness.cc
- - rw-r--r-- 8,910 testharness.h
- - rw-r--r-- 2,090 trainer_factory.cc
- - rw-r--r-- 1,104 trainer_factory.h
- - rw-r--r-- 1,656 trainer_factory_test.cc
- - rw-r--r-- 29,150 trainer_interface.cc
- - rw-r--r-- 5,731 trainer_interface.h
- - rw-r--r-- 20,693 trainer_interface_test.cc
- - rw-r--r-- 1,239 unicode_script.cc
- - rw-r--r-- 2,817 unicode_script.h
- - rw-r--r-- 106,446 unicode_script_map.h
- - rw-r--r-- 1,525 unicode_script_test.cc
- - rw-r--r-- 34,081 unigram_model.cc
- - rw-r--r-- 7,330 unigram_model.h
- - rw-r--r-- 32,283 unigram_model_test.cc
- - rw-r--r-- 22,768 unigram_model_trainer.cc
- - rw-r--r-- 3,945 unigram_model_trainer.h
- - rw-r--r-- 6,795 unigram_model_trainer_test.cc
- - rw-r--r-- 8,709 util.cc
- - rw-r--r-- 11,601 util.h
- - rw-r--r-- 13,323 util_test.cc
- - rw-r--r-- 1,124 word_model.cc
- - rw-r--r-- 1,045 word_model.h
- - rw-r--r-- 2,639 word_model_test.cc
- - rw-r--r-- 2,105 word_model_trainer.cc
- - rw-r--r-- 1,372 word_model_trainer.h
- - rw-r--r-- 2,440 word_model_trainer_test.cc