tests/python/unittest/test_target_target.py - tvm - Git at Google

 # Licensed to the Apache Software Foundation (ASF) under one
 # or more contributor license agreements.  See the NOTICE file
 # distributed with this work for additional information
 # regarding copyright ownership.  The ASF licenses this file
 # to you under the Apache License, Version 2.0 (the
 # "License"); you may not use this file except in compliance
 # with the License.  You may obtain a copy of the License at
 #
 #   http://www.apache.org/licenses/LICENSE-2.0
 #
 # Unless required by applicable law or agreed to in writing,
 # software distributed under the License is distributed on an
 # "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 # KIND, either express or implied.  See the License for the
 # specific language governing permissions and limitations
 # under the License.
 import json
 import sys

 import pytest
 import tvm
 from tvm.target import Target, arm_cpu, bifrost, cuda, intel_graphics, mali, rocm, vta


 @tvm.target.generic_func
 def mygeneric(data):
     # default generic function
     return data + 1


 @mygeneric.register(["cuda", "gpu"])
 def cuda_func(data):
     return data + 2


 @mygeneric.register("rocm")
 def rocm_func(data):
     return data + 3


 @mygeneric.register("cpu")
 def rocm_func(data):
     return data + 10


 def test_all_targets_device_type_verify():
     """Consistency verification for all targets' device type"""
     all_targets = [tvm.target.Target(t) for t in tvm.target.Target.list_kinds()]

     for tgt in all_targets:
         # skip target hook
         relay_to_tir = tgt.get_kind_attr("RelayToTIR")
         tir_to_runtime = tgt.get_kind_attr("TIRToRuntime")
         if relay_to_tir is not None or tir_to_runtime is not None:
             continue

         if tgt.kind.name not in tvm._ffi.runtime_ctypes.Device.STR2MASK:
             raise KeyError("Cannot find target kind: %s in Device.STR2MASK" % tgt.kind.name)

         assert tgt.kind.device_type == tvm._ffi.runtime_ctypes.Device.STR2MASK[tgt.kind.name]


 def test_target_dispatch():
     with tvm.target.cuda():
         assert mygeneric(1) == 3
         assert mygeneric.get_packed_func()(1) == 3

     with tvm.target.rocm():
         assert mygeneric(1) == 4
         assert mygeneric.get_packed_func()(1) == 4

     with tvm.target.Target("cuda"):
         assert mygeneric(1) == 3
         assert mygeneric.get_packed_func()(1) == 3

     with tvm.target.arm_cpu():
         assert mygeneric(1) == 11
         assert mygeneric.get_packed_func()(1) == 11

     with tvm.target.Target("metal"):
         assert mygeneric(1) == 3
         assert mygeneric.get_packed_func()(1) == 3

     assert tvm.target.Target.current() is None


 @tvm.target.override_native_generic_func("test_target_temp_strategy")
 def target_generic(data):
     # default generic function
     return data + 1


 @target_generic.register(["cuda", "gpu"])
 def target_cuda_func(data):
     return data + 2


 def temp_target_cuda_func(data):
     return data + 3


 def test_target_temp_strategy():
     class TempStrategy(object):
         def __init__(self, name, target, fstrategy):
             generic_fstrategy = tvm.target.get_native_generic_func(name)
             self.target = target
             self.name = name
             self.origin_func = {}
             with tvm.target.Target(target) as target_obj:
                 for tgt_key in target_obj.keys:
                     self.origin_func[tgt_key] = generic_fstrategy.get_packed_func()
                     generic_fstrategy.register(fstrategy, tgt_key, allow_override=True)

         def __enter__(self):
             return self

         def __exit__(self, typ, value, traceback):
             generic_fstrategy = tvm.target.get_native_generic_func(self.name)
             with tvm.target.Target(self.target) as target_obj:
                 for tgt_key in target_obj.keys:
                     generic_fstrategy.register(
                         self.origin_func[tgt_key], tgt_key, allow_override=True
                     )

     with tvm.target.Target("cuda"):
         assert target_generic(1) == 3

     # The strategy func change to temp_target_cuda_func.
     with TempStrategy("test_target_temp_strategy", "cuda", temp_target_cuda_func):
         with tvm.target.Target("cuda"):
             assert target_generic(1) == 4

     with tvm.target.Target("cuda"):
         assert target_generic(1) == 3


 def test_target_string_parse():
     target = tvm.target.Target("cuda -model=unknown -libs=cublas,cudnn")

     assert target.kind.name == "cuda"
     assert target.model == "unknown"
     assert set(target.keys) == set(["cuda", "gpu"])
     assert set(target.libs) == set(["cublas", "cudnn"])
     assert str(target) == str(tvm.target.cuda(options="-libs=cublas,cudnn"))

     assert tvm.target.intel_graphics().device_name == "intel_graphics"
     assert tvm.target.mali().device_name == "mali"
     assert tvm.target.arm_cpu().device_name == "arm_cpu"


 def test_target_string_with_spaces():
     target = tvm.target.Target(
         "vulkan -device_name='Name of GPU with spaces' -device_type=discrete"
     )
     assert target.attrs["device_name"] == "Name of GPU with spaces"
     assert target.attrs["device_type"] == "discrete"

     target = tvm.target.Target(str(target))

     assert target.attrs["device_name"] == "Name of GPU with spaces"
     assert target.attrs["device_type"] == "discrete"


 def test_target_create():
     targets = [cuda(), rocm(), mali(), intel_graphics(), arm_cpu("rk3399"), vta(), bifrost()]
     for tgt in targets:
         assert tgt is not None


 def test_target_config():
     """
     Test that constructing a target from a dictionary works.
     """
     target_config = {
         "kind": "llvm",
         "keys": ["arm_cpu", "cpu"],
         "device": "arm_cpu",
         "libs": ["cblas"],
         "mfloat-abi": "hard",
         "mattr": ["+neon", "-avx512f"],
     }
     # Convert config dictionary to json string.
     target_config_str = json.dumps(target_config)
     # Test both dictionary input and json string.
     for config in [target_config, target_config_str]:
         target = tvm.target.Target(config)
         assert target.kind.name == "llvm"
         assert all([key in target.keys for key in ["arm_cpu", "cpu"]])
         assert target.device_name == "arm_cpu"
         assert target.libs == ["cblas"]
         assert target.attrs["mfloat-abi"] == "hard"
         assert all([attr in target.attrs["mattr"] for attr in ["+neon", "-avx512f"]])


 def test_config_map():
     """
     Confirm that constructing a target with invalid
     attributes fails as expected.
     """
     target_config = {"kind": "llvm", "libs": {"a": "b", "c": "d"}}
     with pytest.raises(ValueError):
         tvm.target.Target(target_config)


 def test_composite_target():
     tgt = tvm.target.Target("composite --host=llvm --devices=cuda,opencl")
     assert tgt.kind.name == "composite"
     assert tgt.host.kind.name == "llvm"
     assert len(tgt.attrs["devices"]) == 2
     cuda_device, opencl_device = tgt.attrs["devices"]
     assert cuda_device.kind.name == "cuda"
     assert opencl_device.kind.name == "opencl"


 def test_target_tag_0():
     tgt = tvm.target.Target("nvidia/geforce-rtx-2080-ti")
     assert tgt.kind.name == "cuda"
     assert tgt.attrs["arch"] == "sm_75"
     assert tgt.attrs["shared_memory_per_block"] == 49152
     assert tgt.attrs["max_threads_per_block"] == 1024
     assert tgt.attrs["thread_warp_size"] == 32
     assert tgt.attrs["registers_per_block"] == 65536


 def test_target_tag_1():
     tgt = tvm.target.Target("nvidia/jetson-nano")
     assert tgt.kind.name == "cuda"
     assert tgt.attrs["arch"] == "sm_53"
     assert tgt.attrs["shared_memory_per_block"] == 49152
     assert tgt.attrs["max_threads_per_block"] == 1024
     assert tgt.attrs["thread_warp_size"] == 32
     assert tgt.attrs["registers_per_block"] == 32768


 def test_list_kinds():
     targets = tvm.target.Target.list_kinds()
     assert len(targets) != 0
     assert "llvm" in targets
     assert all(isinstance(target_name, str) for target_name in targets)


 def test_target_host_tags():
     tgt = tvm.target.Target("nvidia/jetson-nano", "nvidia/geforce-rtx-2080-ti")
     assert tgt.kind.name == "cuda"
     assert tgt.attrs["arch"] == "sm_53"
     assert tgt.attrs["shared_memory_per_block"] == 49152
     assert tgt.attrs["max_threads_per_block"] == 1024
     assert tgt.attrs["thread_warp_size"] == 32
     assert tgt.attrs["registers_per_block"] == 32768
     assert tgt.host.kind.name == "cuda"
     assert tgt.host.attrs["arch"] == "sm_75"
     assert tgt.host.attrs["shared_memory_per_block"] == 49152
     assert tgt.host.attrs["max_threads_per_block"] == 1024
     assert tgt.host.attrs["thread_warp_size"] == 32
     assert tgt.host.attrs["registers_per_block"] == 65536


 def test_target_host_tag_dict():
     tgt = tvm.target.Target("nvidia/jetson-nano", {"kind": "llvm"})
     assert tgt.kind.name == "cuda"
     assert tgt.attrs["arch"] == "sm_53"
     assert tgt.attrs["shared_memory_per_block"] == 49152
     assert tgt.attrs["max_threads_per_block"] == 1024
     assert tgt.attrs["thread_warp_size"] == 32
     assert tgt.attrs["registers_per_block"] == 32768
     assert tgt.host.kind.name == "llvm"


 def test_target_host_single_dict():
     tgt = tvm.target.Target({"kind": "llvm", "host": "nvidia/jetson-nano"})
     assert tgt.kind.name == "llvm"
     assert tgt.host.kind.name == "cuda"
     assert tgt.host.attrs["arch"] == "sm_53"
     assert tgt.host.attrs["shared_memory_per_block"] == 49152
     assert tgt.host.attrs["max_threads_per_block"] == 1024
     assert tgt.host.attrs["thread_warp_size"] == 32
     assert tgt.host.attrs["registers_per_block"] == 32768


 def test_target_host_single_string():
     tgt = tvm.target.Target("cuda --host llvm")
     assert tgt.kind.name == "cuda"
     assert tgt.host.kind.name == "llvm"


 def test_target_host_single_string_with_tag():
     tgt = tvm.target.Target("cuda --host nvidia/jetson-nano")
     assert tgt.kind.name == "cuda"
     assert tgt.host.kind.name == "cuda"
     assert tgt.host.attrs["arch"] == "sm_53"
     assert tgt.host.attrs["shared_memory_per_block"] == 49152
     assert tgt.host.attrs["max_threads_per_block"] == 1024
     assert tgt.host.attrs["thread_warp_size"] == 32
     assert tgt.host.attrs["registers_per_block"] == 32768


 def test_target_host_merge_0():
     tgt = tvm.target.Target(tvm.target.Target("cuda --host nvidia/jetson-nano"), None)
     assert tgt.kind.name == "cuda"
     assert tgt.host.kind.name == "cuda"
     assert tgt.host.attrs["arch"] == "sm_53"
     assert tgt.host.attrs["shared_memory_per_block"] == 49152
     assert tgt.host.attrs["max_threads_per_block"] == 1024
     assert tgt.host.attrs["thread_warp_size"] == 32
     assert tgt.host.attrs["registers_per_block"] == 32768


 def test_target_host_merge_1():
     tgt = tvm.target.Target("cuda --host llvm")
     tgt = tvm.target.Target(tgt, tgt.host)
     assert tgt.kind.name == "cuda"
     assert tgt.host.kind.name == "llvm"


 def test_target_host_merge_2():
     """Test picking the same host is ok."""
     tgt = tvm.target.Target(tvm.target.Target("cuda --host llvm"), tvm.target.Target("llvm"))
     assert tgt.kind.name == "cuda"
     assert tgt.host.kind.name == "llvm"


 @pytest.mark.skip(reason="Causing infinite loop because of pytest and handle issue")
 def test_target_host_merge_3():
     with pytest.raises(ValueError, match=r"target host has to be a string or dictionary."):
         tvm.target.Target(tvm.target.Target("cuda --host llvm"), 12.34)


 def test_target_with_host():
     tgt = tvm.target.Target("cuda")
     llvm = tvm.target.Target("llvm")
     tgt = tgt.with_host(llvm)
     assert tgt.kind.name == "cuda"
     assert tgt.host.kind.name == "llvm"
     cuda_host = tvm.target.Target("nvidia/jetson-nano")
     tgt = tgt.with_host(cuda_host)
     assert tgt.host.kind.name == "cuda"
     assert tgt.host.attrs["arch"] == "sm_53"
     assert tgt.host.attrs["shared_memory_per_block"] == 49152
     assert tgt.host.attrs["max_threads_per_block"] == 1024
     assert tgt.host.attrs["thread_warp_size"] == 32
     assert tgt.host.attrs["registers_per_block"] == 32768


 def test_check_and_update_host_consist_0():
     target = None
     host = None
     target, host = Target.check_and_update_host_consist(target, host)


 def test_check_and_update_host_consist_1():
     target = None
     host = "llvm"
     with pytest.raises(AssertionError, match=r"Target host is not empty when target is empty."):
         target, host = Target.check_and_update_host_consist(target, host)


 def test_check_and_update_host_consist_2():
     target = Target("cuda")
     host = Target("llvm")
     target, host = Target.check_and_update_host_consist(target, host)
     assert target.kind.name == "cuda"
     assert target.host.kind.name == "llvm"


 def test_check_and_update_host_consist_3():
     target = Target(target="cuda", host="llvm")
     host = None
     target, host = Target.check_and_update_host_consist(target, host)
     assert target.kind.name == "cuda"
     assert target.host.kind.name == "llvm"
     assert host.kind.name == "llvm"
     assert target.host == host


 def test_target_attr_bool_value():
     target0 = Target("vulkan --supports_float16=True")
     assert target0.attrs["supports_float16"] == 1
     target1 = Target("vulkan --supports_float16=true")
     assert target1.attrs["supports_float16"] == 1
     target2 = Target("vulkan --supports_float16=False")
     assert target2.attrs["supports_float16"] == 0
     target3 = Target("vulkan --supports_float16=false")
     assert target3.attrs["supports_float16"] == 0


 if __name__ == "__main__":
     sys.exit(pytest.main([__file__] + sys.argv[1:]))
	# Licensed to the Apache Software Foundation (ASF) under one
	# or more contributor license agreements. See the NOTICE file
	# distributed with this work for additional information
	# regarding copyright ownership. The ASF licenses this file
	# to you under the Apache License, Version 2.0 (the
	# "License"); you may not use this file except in compliance
	# with the License. You may obtain a copy of the License at
	#
	# http://www.apache.org/licenses/LICENSE-2.0
	#
	# Unless required by applicable law or agreed to in writing,
	# software distributed under the License is distributed on an
	# "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
	# KIND, either express or implied. See the License for the
	# specific language governing permissions and limitations
	# under the License.
	import json
	import sys

	import pytest
	import tvm
	from tvm.target import Target, arm_cpu, bifrost, cuda, intel_graphics, mali, rocm, vta


	@tvm.target.generic_func
	def mygeneric(data):
	# default generic function
	return data + 1


	@mygeneric.register(["cuda", "gpu"])
	def cuda_func(data):
	return data + 2


	@mygeneric.register("rocm")
	def rocm_func(data):
	return data + 3


	@mygeneric.register("cpu")
	def rocm_func(data):
	return data + 10


	def test_all_targets_device_type_verify():
	"""Consistency verification for all targets' device type"""
	all_targets = [tvm.target.Target(t) for t in tvm.target.Target.list_kinds()]

	for tgt in all_targets:
	# skip target hook
	relay_to_tir = tgt.get_kind_attr("RelayToTIR")
	tir_to_runtime = tgt.get_kind_attr("TIRToRuntime")
	if relay_to_tir is not None or tir_to_runtime is not None:
	continue

	if tgt.kind.name not in tvm._ffi.runtime_ctypes.Device.STR2MASK:
	raise KeyError("Cannot find target kind: %s in Device.STR2MASK" % tgt.kind.name)

	assert tgt.kind.device_type == tvm._ffi.runtime_ctypes.Device.STR2MASK[tgt.kind.name]


	def test_target_dispatch():
	with tvm.target.cuda():
	assert mygeneric(1) == 3
	assert mygeneric.get_packed_func()(1) == 3

	with tvm.target.rocm():
	assert mygeneric(1) == 4
	assert mygeneric.get_packed_func()(1) == 4

	with tvm.target.Target("cuda"):
	assert mygeneric(1) == 3
	assert mygeneric.get_packed_func()(1) == 3

	with tvm.target.arm_cpu():
	assert mygeneric(1) == 11
	assert mygeneric.get_packed_func()(1) == 11

	with tvm.target.Target("metal"):
	assert mygeneric(1) == 3
	assert mygeneric.get_packed_func()(1) == 3

	assert tvm.target.Target.current() is None


	@tvm.target.override_native_generic_func("test_target_temp_strategy")
	def target_generic(data):
	# default generic function
	return data + 1


	@target_generic.register(["cuda", "gpu"])
	def target_cuda_func(data):
	return data + 2


	def temp_target_cuda_func(data):
	return data + 3


	def test_target_temp_strategy():
	class TempStrategy(object):
	def __init__(self, name, target, fstrategy):
	generic_fstrategy = tvm.target.get_native_generic_func(name)
	self.target = target
	self.name = name
	self.origin_func = {}
	with tvm.target.Target(target) as target_obj:
	for tgt_key in target_obj.keys:
	self.origin_func[tgt_key] = generic_fstrategy.get_packed_func()
	generic_fstrategy.register(fstrategy, tgt_key, allow_override=True)

	def __enter__(self):
	return self

	def __exit__(self, typ, value, traceback):
	generic_fstrategy = tvm.target.get_native_generic_func(self.name)
	with tvm.target.Target(self.target) as target_obj:
	for tgt_key in target_obj.keys:
	generic_fstrategy.register(
	self.origin_func[tgt_key], tgt_key, allow_override=True
	)

	with tvm.target.Target("cuda"):
	assert target_generic(1) == 3

	# The strategy func change to temp_target_cuda_func.
	with TempStrategy("test_target_temp_strategy", "cuda", temp_target_cuda_func):
	with tvm.target.Target("cuda"):
	assert target_generic(1) == 4

	with tvm.target.Target("cuda"):
	assert target_generic(1) == 3


	def test_target_string_parse():
	target = tvm.target.Target("cuda -model=unknown -libs=cublas,cudnn")

	assert target.kind.name == "cuda"
	assert target.model == "unknown"
	assert set(target.keys) == set(["cuda", "gpu"])
	assert set(target.libs) == set(["cublas", "cudnn"])
	assert str(target) == str(tvm.target.cuda(options="-libs=cublas,cudnn"))

	assert tvm.target.intel_graphics().device_name == "intel_graphics"
	assert tvm.target.mali().device_name == "mali"
	assert tvm.target.arm_cpu().device_name == "arm_cpu"


	def test_target_string_with_spaces():
	target = tvm.target.Target(
	"vulkan -device_name='Name of GPU with spaces' -device_type=discrete"
	)
	assert target.attrs["device_name"] == "Name of GPU with spaces"
	assert target.attrs["device_type"] == "discrete"

	target = tvm.target.Target(str(target))

	assert target.attrs["device_name"] == "Name of GPU with spaces"
	assert target.attrs["device_type"] == "discrete"


	def test_target_create():
	targets = [cuda(), rocm(), mali(), intel_graphics(), arm_cpu("rk3399"), vta(), bifrost()]
	for tgt in targets:
	assert tgt is not None


	def test_target_config():
	"""
	Test that constructing a target from a dictionary works.
	"""
	target_config = {
	"kind": "llvm",
	"keys": ["arm_cpu", "cpu"],
	"device": "arm_cpu",
	"libs": ["cblas"],
	"mfloat-abi": "hard",
	"mattr": ["+neon", "-avx512f"],
	}
	# Convert config dictionary to json string.
	target_config_str = json.dumps(target_config)
	# Test both dictionary input and json string.
	for config in [target_config, target_config_str]:
	target = tvm.target.Target(config)
	assert target.kind.name == "llvm"
	assert all([key in target.keys for key in ["arm_cpu", "cpu"]])
	assert target.device_name == "arm_cpu"
	assert target.libs == ["cblas"]
	assert target.attrs["mfloat-abi"] == "hard"
	assert all([attr in target.attrs["mattr"] for attr in ["+neon", "-avx512f"]])


	def test_config_map():
	"""
	Confirm that constructing a target with invalid
	attributes fails as expected.
	"""
	target_config = {"kind": "llvm", "libs": {"a": "b", "c": "d"}}
	with pytest.raises(ValueError):
	tvm.target.Target(target_config)


	def test_composite_target():
	tgt = tvm.target.Target("composite --host=llvm --devices=cuda,opencl")
	assert tgt.kind.name == "composite"
	assert tgt.host.kind.name == "llvm"
	assert len(tgt.attrs["devices"]) == 2
	cuda_device, opencl_device = tgt.attrs["devices"]
	assert cuda_device.kind.name == "cuda"
	assert opencl_device.kind.name == "opencl"


	def test_target_tag_0():
	tgt = tvm.target.Target("nvidia/geforce-rtx-2080-ti")
	assert tgt.kind.name == "cuda"
	assert tgt.attrs["arch"] == "sm_75"
	assert tgt.attrs["shared_memory_per_block"] == 49152
	assert tgt.attrs["max_threads_per_block"] == 1024
	assert tgt.attrs["thread_warp_size"] == 32
	assert tgt.attrs["registers_per_block"] == 65536


	def test_target_tag_1():
	tgt = tvm.target.Target("nvidia/jetson-nano")
	assert tgt.kind.name == "cuda"
	assert tgt.attrs["arch"] == "sm_53"
	assert tgt.attrs["shared_memory_per_block"] == 49152
	assert tgt.attrs["max_threads_per_block"] == 1024
	assert tgt.attrs["thread_warp_size"] == 32
	assert tgt.attrs["registers_per_block"] == 32768


	def test_list_kinds():
	targets = tvm.target.Target.list_kinds()
	assert len(targets) != 0
	assert "llvm" in targets
	assert all(isinstance(target_name, str) for target_name in targets)


	def test_target_host_tags():
	tgt = tvm.target.Target("nvidia/jetson-nano", "nvidia/geforce-rtx-2080-ti")
	assert tgt.kind.name == "cuda"
	assert tgt.attrs["arch"] == "sm_53"
	assert tgt.attrs["shared_memory_per_block"] == 49152
	assert tgt.attrs["max_threads_per_block"] == 1024
	assert tgt.attrs["thread_warp_size"] == 32
	assert tgt.attrs["registers_per_block"] == 32768
	assert tgt.host.kind.name == "cuda"
	assert tgt.host.attrs["arch"] == "sm_75"
	assert tgt.host.attrs["shared_memory_per_block"] == 49152
	assert tgt.host.attrs["max_threads_per_block"] == 1024
	assert tgt.host.attrs["thread_warp_size"] == 32
	assert tgt.host.attrs["registers_per_block"] == 65536


	def test_target_host_tag_dict():
	tgt = tvm.target.Target("nvidia/jetson-nano", {"kind": "llvm"})
	assert tgt.kind.name == "cuda"
	assert tgt.attrs["arch"] == "sm_53"
	assert tgt.attrs["shared_memory_per_block"] == 49152
	assert tgt.attrs["max_threads_per_block"] == 1024
	assert tgt.attrs["thread_warp_size"] == 32
	assert tgt.attrs["registers_per_block"] == 32768
	assert tgt.host.kind.name == "llvm"


	def test_target_host_single_dict():
	tgt = tvm.target.Target({"kind": "llvm", "host": "nvidia/jetson-nano"})
	assert tgt.kind.name == "llvm"
	assert tgt.host.kind.name == "cuda"
	assert tgt.host.attrs["arch"] == "sm_53"
	assert tgt.host.attrs["shared_memory_per_block"] == 49152
	assert tgt.host.attrs["max_threads_per_block"] == 1024
	assert tgt.host.attrs["thread_warp_size"] == 32
	assert tgt.host.attrs["registers_per_block"] == 32768


	def test_target_host_single_string():
	tgt = tvm.target.Target("cuda --host llvm")
	assert tgt.kind.name == "cuda"
	assert tgt.host.kind.name == "llvm"


	def test_target_host_single_string_with_tag():
	tgt = tvm.target.Target("cuda --host nvidia/jetson-nano")
	assert tgt.kind.name == "cuda"
	assert tgt.host.kind.name == "cuda"
	assert tgt.host.attrs["arch"] == "sm_53"
	assert tgt.host.attrs["shared_memory_per_block"] == 49152
	assert tgt.host.attrs["max_threads_per_block"] == 1024
	assert tgt.host.attrs["thread_warp_size"] == 32
	assert tgt.host.attrs["registers_per_block"] == 32768


	def test_target_host_merge_0():
	tgt = tvm.target.Target(tvm.target.Target("cuda --host nvidia/jetson-nano"), None)
	assert tgt.kind.name == "cuda"
	assert tgt.host.kind.name == "cuda"
	assert tgt.host.attrs["arch"] == "sm_53"
	assert tgt.host.attrs["shared_memory_per_block"] == 49152
	assert tgt.host.attrs["max_threads_per_block"] == 1024
	assert tgt.host.attrs["thread_warp_size"] == 32
	assert tgt.host.attrs["registers_per_block"] == 32768


	def test_target_host_merge_1():
	tgt = tvm.target.Target("cuda --host llvm")
	tgt = tvm.target.Target(tgt, tgt.host)
	assert tgt.kind.name == "cuda"
	assert tgt.host.kind.name == "llvm"


	def test_target_host_merge_2():
	"""Test picking the same host is ok."""
	tgt = tvm.target.Target(tvm.target.Target("cuda --host llvm"), tvm.target.Target("llvm"))
	assert tgt.kind.name == "cuda"
	assert tgt.host.kind.name == "llvm"


	@pytest.mark.skip(reason="Causing infinite loop because of pytest and handle issue")
	def test_target_host_merge_3():
	with pytest.raises(ValueError, match=r"target host has to be a string or dictionary."):
	tvm.target.Target(tvm.target.Target("cuda --host llvm"), 12.34)


	def test_target_with_host():
	tgt = tvm.target.Target("cuda")
	llvm = tvm.target.Target("llvm")
	tgt = tgt.with_host(llvm)
	assert tgt.kind.name == "cuda"
	assert tgt.host.kind.name == "llvm"
	cuda_host = tvm.target.Target("nvidia/jetson-nano")
	tgt = tgt.with_host(cuda_host)
	assert tgt.host.kind.name == "cuda"
	assert tgt.host.attrs["arch"] == "sm_53"
	assert tgt.host.attrs["shared_memory_per_block"] == 49152
	assert tgt.host.attrs["max_threads_per_block"] == 1024
	assert tgt.host.attrs["thread_warp_size"] == 32
	assert tgt.host.attrs["registers_per_block"] == 32768


	def test_check_and_update_host_consist_0():
	target = None
	host = None
	target, host = Target.check_and_update_host_consist(target, host)


	def test_check_and_update_host_consist_1():
	target = None
	host = "llvm"
	with pytest.raises(AssertionError, match=r"Target host is not empty when target is empty."):
	target, host = Target.check_and_update_host_consist(target, host)


	def test_check_and_update_host_consist_2():
	target = Target("cuda")
	host = Target("llvm")
	target, host = Target.check_and_update_host_consist(target, host)
	assert target.kind.name == "cuda"
	assert target.host.kind.name == "llvm"


	def test_check_and_update_host_consist_3():
	target = Target(target="cuda", host="llvm")
	host = None
	target, host = Target.check_and_update_host_consist(target, host)
	assert target.kind.name == "cuda"
	assert target.host.kind.name == "llvm"
	assert host.kind.name == "llvm"
	assert target.host == host


	def test_target_attr_bool_value():
	target0 = Target("vulkan --supports_float16=True")
	assert target0.attrs["supports_float16"] == 1
	target1 = Target("vulkan --supports_float16=true")
	assert target1.attrs["supports_float16"] == 1
	target2 = Target("vulkan --supports_float16=False")
	assert target2.attrs["supports_float16"] == 0
	target3 = Target("vulkan --supports_float16=false")
	assert target3.attrs["supports_float16"] == 0


	if __name__ == "__main__":
	sys.exit(pytest.main([__file__] + sys.argv[1:]))