ql/src/test/queries/clientpositive/char_udf1.q - hive - Git at Google

 --! qt:dataset:src
 drop table char_udf_1;

 create table char_udf_1 (c1 string, c2 string, c3 char(10), c4 char(20));
 insert overwrite table char_udf_1
   select key, value, key, value from src where key = '238' limit 1;


 -- UDFs with char support
 select
   concat(c1, c2),
   concat(c3, c4),
   concat(c1, c2) = concat(c3, c4)
 from char_udf_1 limit 1;

 select
   upper(c2),
   upper(c4),
   upper(c2) = upper(c4)
 from char_udf_1 limit 1;

 select
   lower(c2),
   lower(c4),
   lower(c2) = lower(c4)
 from char_udf_1 limit 1;

 -- Scalar UDFs
 select
   ascii(c2),
   ascii(c4),
   ascii(c2) = ascii(c4)
 from char_udf_1 limit 1;

 select
   concat_ws('|', c1, c2),
   concat_ws('|', c3, c4),
   concat_ws('|', c1, c2) = concat_ws('|', c3, c4)
 from char_udf_1 limit 1;

 select
   decode(encode(c2, 'US-ASCII'), 'US-ASCII'),
   decode(encode(c4, 'US-ASCII'), 'US-ASCII'),
   decode(encode(c2, 'US-ASCII'), 'US-ASCII') = decode(encode(c4, 'US-ASCII'), 'US-ASCII')
 from char_udf_1 limit 1;

 select
   instr(c2, '_'),
   instr(c4, '_'),
   instr(c2, '_') = instr(c4, '_')
 from char_udf_1 limit 1;

 select
   length(c2),
   length(c4),
   length(c2) = length(c4)
 from char_udf_1 limit 1;

 select
   locate('a', 'abcdabcd', 3),
   locate(cast('a' as char(1)), cast('abcdabcd' as char(10)), 3),
   locate('a', 'abcdabcd', 3) = locate(cast('a' as char(1)), cast('abcdabcd' as char(10)), 3)
 from char_udf_1 limit 1;

 select
   lpad(c2, 15, ' '),
   lpad(c4, 15, ' '),
   lpad(c2, 15, ' ') = lpad(c4, 15, ' ')
 from char_udf_1 limit 1;

 select
   ltrim(c2),
   ltrim(c4),
   ltrim(c2) = ltrim(c4)
 from char_udf_1 limit 1;

 -- In hive wiki page https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF
 -- we only allow A regexp B, not regexp (A,B).

 select
   c2 regexp 'val',
   c4 regexp 'val',
   (c2 regexp 'val') = (c4 regexp 'val')
 from char_udf_1 limit 1;

 select
   regexp_extract(c2, 'val_([0-9]+)', 1),
   regexp_extract(c4, 'val_([0-9]+)', 1),
   regexp_extract(c2, 'val_([0-9]+)', 1) = regexp_extract(c4, 'val_([0-9]+)', 1)
 from char_udf_1 limit 1;

 select
   regexp_replace(c2, 'val', 'replaced'),
   regexp_replace(c4, 'val', 'replaced'),
   regexp_replace(c2, 'val', 'replaced') = regexp_replace(c4, 'val', 'replaced')
 from char_udf_1 limit 1;

 select
   reverse(c2),
   reverse(c4),
   reverse(c2) = reverse(c4)
 from char_udf_1 limit 1;

 select
   rpad(c2, 15, ' '),
   rpad(c4, 15, ' '),
   rpad(c2, 15, ' ') = rpad(c4, 15, ' ')
 from char_udf_1 limit 1;

 select
   rtrim(c2),
   rtrim(c4),
   rtrim(c2) = rtrim(c4)
 from char_udf_1 limit 1;

 select
   sentences('See spot run.  See jane run.'),
   sentences(cast('See spot run.  See jane run.' as char(50)))
 from char_udf_1 limit 1;

 select
   split(c2, '_'),
   split(c4, '_')
 from char_udf_1 limit 1;

 select
   str_to_map('a:1,b:2,c:3',',',':'),
   str_to_map(cast('a:1,b:2,c:3' as char(20)),',',':')
 from char_udf_1 limit 1;

 select
   substr(c2, 1, 3),
   substr(c4, 1, 3),
   substr(c2, 1, 3) = substr(c4, 1, 3)
 from char_udf_1 limit 1;

 select
   trim(c2),
   trim(c4),
   trim(c2) = trim(c4)
 from char_udf_1 limit 1;


 -- Aggregate Functions
 select
   compute_stats(c2, 'fm', 16),
   compute_stats(c4, 'fm', 16)
 from char_udf_1;

 select
   min(c2),
   min(c4)
 from char_udf_1;

 select
   max(c2),
   max(c4)
 from char_udf_1;


 drop table char_udf_1;
	--! qt:dataset:src
	drop table char_udf_1;

	create table char_udf_1 (c1 string, c2 string, c3 char(10), c4 char(20));
	insert overwrite table char_udf_1
	select key, value, key, value from src where key = '238' limit 1;


	-- UDFs with char support
	select
	concat(c1, c2),
	concat(c3, c4),
	concat(c1, c2) = concat(c3, c4)
	from char_udf_1 limit 1;

	select
	upper(c2),
	upper(c4),
	upper(c2) = upper(c4)
	from char_udf_1 limit 1;

	select
	lower(c2),
	lower(c4),
	lower(c2) = lower(c4)
	from char_udf_1 limit 1;

	-- Scalar UDFs
	select
	ascii(c2),
	ascii(c4),
	ascii(c2) = ascii(c4)
	from char_udf_1 limit 1;

	select
	concat_ws('\|', c1, c2),
	concat_ws('\|', c3, c4),
	concat_ws('\|', c1, c2) = concat_ws('\|', c3, c4)
	from char_udf_1 limit 1;

	select
	decode(encode(c2, 'US-ASCII'), 'US-ASCII'),
	decode(encode(c4, 'US-ASCII'), 'US-ASCII'),
	decode(encode(c2, 'US-ASCII'), 'US-ASCII') = decode(encode(c4, 'US-ASCII'), 'US-ASCII')
	from char_udf_1 limit 1;

	select
	instr(c2, '_'),
	instr(c4, '_'),
	instr(c2, '_') = instr(c4, '_')
	from char_udf_1 limit 1;

	select
	length(c2),
	length(c4),
	length(c2) = length(c4)
	from char_udf_1 limit 1;

	select
	locate('a', 'abcdabcd', 3),
	locate(cast('a' as char(1)), cast('abcdabcd' as char(10)), 3),
	locate('a', 'abcdabcd', 3) = locate(cast('a' as char(1)), cast('abcdabcd' as char(10)), 3)
	from char_udf_1 limit 1;

	select
	lpad(c2, 15, ' '),
	lpad(c4, 15, ' '),
	lpad(c2, 15, ' ') = lpad(c4, 15, ' ')
	from char_udf_1 limit 1;

	select
	ltrim(c2),
	ltrim(c4),
	ltrim(c2) = ltrim(c4)
	from char_udf_1 limit 1;

	-- In hive wiki page https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF
	-- we only allow A regexp B, not regexp (A,B).

	select
	c2 regexp 'val',
	c4 regexp 'val',
	(c2 regexp 'val') = (c4 regexp 'val')
	from char_udf_1 limit 1;

	select
	regexp_extract(c2, 'val_([0-9]+)', 1),
	regexp_extract(c4, 'val_([0-9]+)', 1),
	regexp_extract(c2, 'val_([0-9]+)', 1) = regexp_extract(c4, 'val_([0-9]+)', 1)
	from char_udf_1 limit 1;

	select
	regexp_replace(c2, 'val', 'replaced'),
	regexp_replace(c4, 'val', 'replaced'),
	regexp_replace(c2, 'val', 'replaced') = regexp_replace(c4, 'val', 'replaced')
	from char_udf_1 limit 1;

	select
	reverse(c2),
	reverse(c4),
	reverse(c2) = reverse(c4)
	from char_udf_1 limit 1;

	select
	rpad(c2, 15, ' '),
	rpad(c4, 15, ' '),
	rpad(c2, 15, ' ') = rpad(c4, 15, ' ')
	from char_udf_1 limit 1;

	select
	rtrim(c2),
	rtrim(c4),
	rtrim(c2) = rtrim(c4)
	from char_udf_1 limit 1;

	select
	sentences('See spot run. See jane run.'),
	sentences(cast('See spot run. See jane run.' as char(50)))
	from char_udf_1 limit 1;

	select
	split(c2, '_'),
	split(c4, '_')
	from char_udf_1 limit 1;

	select
	str_to_map('a:1,b:2,c:3',',',':'),
	str_to_map(cast('a:1,b:2,c:3' as char(20)),',',':')
	from char_udf_1 limit 1;

	select
	substr(c2, 1, 3),
	substr(c4, 1, 3),
	substr(c2, 1, 3) = substr(c4, 1, 3)
	from char_udf_1 limit 1;

	select
	trim(c2),
	trim(c4),
	trim(c2) = trim(c4)
	from char_udf_1 limit 1;


	-- Aggregate Functions
	select
	compute_stats(c2, 'fm', 16),
	compute_stats(c4, 'fm', 16)
	from char_udf_1;

	select
	min(c2),
	min(c4)
	from char_udf_1;

	select
	max(c2),
	max(c4)
	from char_udf_1;


	drop table char_udf_1;