File: test_tokenizer.cc

package info (click to toggle)
logserver 1.13.2-1
links: PTS, VCS
area: main
in suites: forky, sid
size: 720 kB
sloc: cpp: 10,815; makefile: 3
file content (110 lines) | stat: -rw-r--r-- 2,818 bytes
#include "test.h"

#include "tokenizer.h"

TEST_CASE("trim") {
	CHECK(Tokenizer::trim("  abc  ") == "abc");
	CHECK(Tokenizer::trim("abcd ") == "abcd");
	CHECK(Tokenizer::trim("ab  cd") == "ab  cd");
	CHECK(Tokenizer::trim("abc") == "abc");
	CHECK(Tokenizer::trim("  bcd") == "bcd");
	CHECK(Tokenizer::trim("  \tbcd\t") == "bcd");
	CHECK(Tokenizer::trim("a,b,c", "ac") == ",b,");
	CHECK(Tokenizer::trim("a b c", "ac") == " b ");
	CHECK(Tokenizer::trim("a,b,c", ",ac") == "b");
}

TEST_CASE("extract") {
	int i, j;
	float f;
	string s, t;
	bool b;

	int ret;

	ret = Tokenizer::extract("%=%", "val=true", &s, &b);
	CHECK(ret == 2);
	CHECK(s == "val");
	CHECK(b);

	ret = Tokenizer::extract("%=%", "0=false", &s, &b);
	CHECK(ret == 2);
	CHECK(s == "0");
	CHECK(!b);

	ret = Tokenizer::extract("%+2=%", "1+2=3 ", &i, &j);
	CHECK(ret == 2);
	CHECK(i == 1);
	CHECK(j == 3);

	j = -1;
	ret = Tokenizer::extract("%-2=%", "1+2=3 ", &i, &j);
	CHECK(ret == 1);
	CHECK(i == 1);
	CHECK(j == -1);

	ret = Tokenizer::extract("%&%=%&%", "query?a=b&c=0.34&d=e",
				 nullptr, &s, &f, nullptr);
	CHECK(ret == 4);
	CHECK(s == "c");
	CHECK(f == 0.34f);

	ret = Tokenizer::extract("function(%, %)", "function(parm1, parm2)",
				 &s, &t);
	CHECK(ret == 2);
	CHECK(s == "parm1");
	CHECK(t == "parm2");
}

TEST_CASE("annotate quote") {
	string rt = "__________\"'''''''''''\"_________________";
	string in = "this is a \"string with\" some quoted part";
	string out;
	Tokenizer::annotate_quote(in, &out);
	CHECK(out == rt);
}

TEST_CASE("annotate multi quote") {
	string rt = "________\"'\"________\"''''\"_\"'''''''''''\"";
	string in = "this is \"a\" string \"with\" \"some quotes\"";
	string out;
	Tokenizer::annotate_quote(in, &out);
	CHECK(out == rt);
}

TEST_CASE("split mind quote") {
	string in = "this,can,\"be,split\",fine";
	vector<string> out = {"this", "can", "\"be,split\"", "fine"};
	vector<string_view> ret;
	Tokenizer::split_mind_quote(in, ",", &ret);
	CHECK(ret.size() == out.size());
	for (size_t i = 0; i < ret.size(); ++i) {
		CHECK(ret[i] == out[i]);
	}
}

TEST_CASE("split mind quote no quotes") {
	string in = "this,can,be,split,fine";
	vector<string> out = {"this", "can", "be", "split", "fine"};
	vector<string_view> ret;
	Tokenizer::split_mind_quote(in, ",", &ret);
	CHECK(ret.size() == out.size());
	for (size_t i = 0; i < ret.size(); ++i) {
		CHECK(ret[i] == out[i]);
	}
}

TEST_CASE("split mind quote multi") {
	string in = "this-\"can-be-split\"-\"just-fine\"";
	vector<string> out = {"this", "\"can-be-split\"", "\"just-fine\""};
	vector<string_view> ret;
	Tokenizer::split_mind_quote(in, "-", &ret);
	CHECK(ret.size() == out.size());
	for (size_t i = 0; i < ret.size(); ++i) {
		CHECK(ret[i] == out[i]);
	}
}

/* TODO: tests for the rest of tokenizer, however this covers the functions
 * logserver uses */