File: test_comment_midline.test

package info (click to toggle)

duckdb 1.5.1-2

links: PTS, VCS
area: main
in suites:
size: 299,196 kB
sloc: cpp: 865,414; ansic: 57,292; python: 18,871; sql: 12,663; lisp: 11,751; yacc: 7,412; lex: 1,682; sh: 747; makefile: 558

file content (143 lines) | stat: -rw-r--r-- 2,463 bytes

parent folder | download | duplicates (4)

# name: test/sql/copy/csv/test_comment_midline.test
# description: Test that the comment option of csv reading works properly
# group: [csv]

statement ok
PRAGMA enable_verification

query II
from read_csv('{DATA_DIR}/csv/comments/14648.csv',
   header=false,
   sep=',',
   null_padding=true,
   comment='#',
   ignore_errors=true
   );
----
a	b
a	NULL
x	y

query II
from read_csv('{DATA_DIR}/csv/comments/14648.csv',
   header=false,
   sep=',',
   comment='#',
   ignore_errors=true
   );
----
a	b
x	y

statement error
from read_csv('{DATA_DIR}/csv/comments/14648.csv',
   header=false,
   sep=',',
   comment='#'
   );
----
Error when sniffing file "{DATA_DIR}/csv/comments/14648.csv".

# Not a comment
query III
FROM '{DATA_DIR}/csv/comments/14635.csv'
----
a	#b	c

# Ignore errors will have,
query III
FROM read_csv('{DATA_DIR}/csv/comments/14635.csv', ignore_errors = true, columns = {'header1': 'VARCHAR', 'header2': 'VARCHAR', 'header3': 'VARCHAR'}, quote = '', escape = '', delim =',');
----
a	#b	c

# If we only have midline comments, the comment must be explicitly given by the user
query I
FROM '{DATA_DIR}/csv/comments/only_midline.csv';
----
6;7

query II
FROM read_csv('{DATA_DIR}/csv/comments/only_midline.csv', comment = '#');
----
1	3
6	7


query II
FROM '{DATA_DIR}/csv/comments/mid_line.csv';
----
1	3
6	7

query II
FROM '{DATA_DIR}/csv/comments/mid_line_header.csv';
----
1	3
6	7

query II
FROM '{DATA_DIR}/csv/comments/mid_line_quote.csv';
----
1	3
6	7#test

query II
FROM '{DATA_DIR}/csv/comments/mid_line_null.csv';
----
1	3
6	NULL

query II
FROM '{DATA_DIR}/csv/comments/simple_mid_line.csv';
----
1	3
6	7
1	3
6	7

query II
FROM '{DATA_DIR}/csv/comments/midline_empty_space.csv';
----
1	3
6	7

query II
FROM read_csv('{DATA_DIR}/csv/comments/mid_line_invalid.csv', ignore_errors = true, delim = ';', comment = '#', auto_detect = false, columns= {'a':'integer', 'b':'integer'}, strict_mode=True);
----
1	3
6	7
8	9

# Lets try over a vector size
query II
FROM '{DATA_DIR}/csv/comments/midline_big.csv' limit 5;
----
1	3
6	7
1	3
6	7
1	3

# Check commented data-points are not in the data
query II
FROM '{DATA_DIR}/csv/comments/midline_big.csv' where  a = 20
----

query I
SELECT count(*) FROM '{DATA_DIR}/csv/comments/midline_big.csv'
----
1448

# Lets try with a buffer limit

loop buffer_size 30 35

query II
FROM read_csv('{DATA_DIR}/csv/comments/simple_mid_line.csv', buffer_size = ${buffer_size}) limit 5;
----
1	3
6	7
1	3
6	7

endloop