example/bayesian-methods/utils.py - mxnet-test - Git at Google

 import mxnet as mx
 import mxnet.ndarray as nd
 import numpy
 import logging


 class BiasXavier(mx.initializer.Xavier):
     def _init_bias(self, _, arr):
         scale = numpy.sqrt(self.magnitude / arr.shape[0])
         mx.random.uniform(-scale, scale, out=arr)

 class SGLDScheduler(mx.lr_scheduler.LRScheduler):
     def __init__(self, begin_rate, end_rate, total_iter_num, factor):
         super(SGLDScheduler, self).__init__()
         if factor >= 1.0:
             raise ValueError("Factor must be less than 1 to make lr reduce")
         self.begin_rate = begin_rate
         self.end_rate = end_rate
         self.total_iter_num = total_iter_num
         self.factor = factor
         self.b = (total_iter_num - 1.0) / ((begin_rate / end_rate) ** (1.0 / factor) - 1.0)
         self.a = begin_rate / (self.b ** (-factor))
         self.count = 0

     def __call__(self, num_update):
         self.base_lr = self.a * ((self.b + num_update) ** (-self.factor))
         self.count += 1
         return self.base_lr

 def get_executor(sym, ctx, data_inputs, initializer=None):
     data_shapes = {k: v.shape for k, v in data_inputs.items()}
     arg_names = sym.list_arguments()
     aux_names = sym.list_auxiliary_states()
     param_names = list(set(arg_names) - set(data_inputs.keys()))
     arg_shapes, output_shapes, aux_shapes = sym.infer_shape(**data_shapes)
     arg_name_shape = {k: s for k, s in zip(arg_names, arg_shapes)}
     params = {n: nd.empty(arg_name_shape[n], ctx=ctx) for n in param_names}
     params_grad = {n: nd.empty(arg_name_shape[n], ctx=ctx) for n in param_names}
     aux_states = {k: nd.empty(s, ctx=ctx) for k, s in zip(aux_names, aux_shapes)}
     exe = sym.bind(ctx=ctx, args=dict(params, **data_inputs),
                    args_grad=params_grad,
                    aux_states=aux_states)
     if initializer is not None:
         for k, v in params.items():
             initializer(k, v)
     return exe, params, params_grad, aux_states

 def copy_param(exe, new_param=None):
     if new_param is None:
         new_param = {k: nd.empty(v.shape, ctx=mx.cpu()) for k,v in exe.arg_dict.items()}
     for k, v in new_param.items():
         exe.arg_dict[k].copyto(v)
     return new_param

 def sample_test_acc(exe, X, Y, sample_pool=None, label_num=None, minibatch_size=100):
     if label_num is None:
         pred = numpy.zeros((X.shape[0],)).astype('float32')
     else:
         pred = numpy.zeros((X.shape[0], label_num)).astype('float32')
     iter = mx.io.NDArrayIter(data=X, label=Y, batch_size=minibatch_size, shuffle=False)
     denominator = 0.0
     if sample_pool is None:
         curr_instance = 0
         iter.reset()
         for batch in iter:
             exe.arg_dict['data'][:] = batch.data[0]
             exe.forward(is_train=False)
             batch_size = minibatch_size - batch.pad
             pred[curr_instance:curr_instance + minibatch_size - batch.pad, :] \
                 += exe.outputs[0].asnumpy()[:batch_size]
             curr_instance += batch_size
     else:
         old_param = copy_param(exe)
         for sample in sample_pool:
             if type(sample) is list:
                 denominator += sample[0]
             else:
                 denominator += 1.0
         for sample in sample_pool:
             if type(sample) is list:
                 ratio = sample[0]/denominator
                 param = sample[1]
             else:
                 ratio = 1.0/denominator
                 param = sample
             exe.copy_params_from(param)
             curr_instance = 0
             iter.reset()
             for batch in iter:
                 exe.arg_dict['data'][:] = batch.data[0]
                 exe.forward(is_train=False)
                 batch_size = minibatch_size - batch.pad
                 pred[curr_instance:curr_instance + minibatch_size - batch.pad, :] \
                     += ratio * exe.outputs[0].asnumpy()[:batch_size]
                 curr_instance += batch_size
         exe.copy_params_from(old_param)
     correct = (pred.argmax(axis=1) == Y).sum()
     total = Y.shape[0]
     acc = correct/float(total)
     return correct, total, acc


 def sample_test_regression(exe, X, Y, sample_pool=None, minibatch_size=100, save_path="regression.txt"):
     old_param = copy_param(exe)
     if sample_pool is not None:
         pred = numpy.zeros(Y.shape + (len(sample_pool),))
         ratio = numpy.zeros((len(sample_pool),))
         if type(sample_pool[0]) is list:
             denominator = sum(sample[0] for sample in sample_pool)
             for i, sample in enumerate(sample_pool):
                 ratio[i] = sample[0]/float(denominator)
         else:
             ratio[:] = 1.0/ Y.shape[0]
         iterator = mx.io.NDArrayIter(data=X, label=Y, batch_size=minibatch_size, shuffle=False)
         for i, sample in enumerate(sample_pool):
             if type(sample) is list:
                 sample_param = sample[1]
             else:
                 sample_param = sample
             iterator.reset()
             exe.copy_params_from(sample_param)
             curr_instance = 0
             for batch in iterator:
                 exe.arg_dict['data'][:] = batch.data[0]
                 exe.forward(is_train=False)
                 batch_len = minibatch_size - batch.pad
                 pred[curr_instance:curr_instance + minibatch_size - batch.pad, :, i] = \
                     exe.outputs[0].asnumpy()[:batch_len]
                 curr_instance += batch_len
         mean = pred.mean(axis=2)
         var = pred.std(axis=2)**2
         #print numpy.concatenate((Y, mean), axis=1)
         mse = numpy.square(Y.reshape((Y.shape[0], )) - mean.reshape((mean.shape[0], ))).mean()
         numpy.savetxt(save_path, numpy.concatenate((mean, var), axis=1))
     else:
         mean_var = numpy.zeros((Y.shape[0], 2))
         iterator = mx.io.NDArrayIter(data=X, label=Y, batch_size=minibatch_size, shuffle=False)
         iterator.reset()
         curr_instance = 0
         for batch in iterator:
             exe.arg_dict['data'][:] = batch.data[0]
             exe.forward(is_train=False)
             mean_var[curr_instance:curr_instance + minibatch_size - batch.pad, 0] = exe.outputs[0].asnumpy()[:minibatch_size - batch.pad].flatten()
             mean_var[curr_instance:curr_instance + minibatch_size - batch.pad, 1] = numpy.exp(exe.outputs[1].asnumpy())[:minibatch_size - batch.pad].flatten()
             curr_instance += minibatch_size - batch.pad
         mse = numpy.square(Y.reshape((Y.shape[0],)) - mean_var[:, 0]).mean()
         numpy.savetxt(save_path, mean_var)
     exe.copy_params_from(old_param)
     return mse

 def pred_test(testing_data, exe, param_list=None, save_path=""):
     ret = numpy.zeros((testing_data.shape[0], 2))
     if param_list is None:
         for i in range(testing_data.shape[0]):
             exe.arg_dict['data'][:] = testing_data[i, 0]
             exe.forward(is_train=False)
             ret[i, 0] = exe.outputs[0].asnumpy()
             ret[i, 1] = numpy.exp(exe.outputs[1].asnumpy())
         numpy.savetxt(save_path, ret)
     else:
         for i in range(testing_data.shape[0]):
             pred = numpy.zeros((len(param_list),))
             for j in range(len(param_list)):
                 exe.copy_params_from(param_list[j])
                 exe.arg_dict['data'][:] = testing_data[i, 0]
                 exe.forward(is_train=False)
                 pred[j] = exe.outputs[0].asnumpy()
             ret[i, 0] = pred.mean()
             ret[i, 1] = pred.std()**2
         numpy.savetxt(save_path, ret)
     mse = numpy.square(ret[:, 0] - testing_data[:, 0] **3).mean()
     return mse, ret
	import mxnet as mx
	import mxnet.ndarray as nd
	import numpy
	import logging


	class BiasXavier(mx.initializer.Xavier):
	def _init_bias(self, _, arr):
	scale = numpy.sqrt(self.magnitude / arr.shape[0])
	mx.random.uniform(-scale, scale, out=arr)

	class SGLDScheduler(mx.lr_scheduler.LRScheduler):
	def __init__(self, begin_rate, end_rate, total_iter_num, factor):
	super(SGLDScheduler, self).__init__()
	if factor >= 1.0:
	raise ValueError("Factor must be less than 1 to make lr reduce")
	self.begin_rate = begin_rate
	self.end_rate = end_rate
	self.total_iter_num = total_iter_num
	self.factor = factor
	self.b = (total_iter_num - 1.0) / ((begin_rate / end_rate) ** (1.0 / factor) - 1.0)
	self.a = begin_rate / (self.b ** (-factor))
	self.count = 0

	def __call__(self, num_update):
	self.base_lr = self.a * ((self.b + num_update) ** (-self.factor))
	self.count += 1
	return self.base_lr

	def get_executor(sym, ctx, data_inputs, initializer=None):
	data_shapes = {k: v.shape for k, v in data_inputs.items()}
	arg_names = sym.list_arguments()
	aux_names = sym.list_auxiliary_states()
	param_names = list(set(arg_names) - set(data_inputs.keys()))
	arg_shapes, output_shapes, aux_shapes = sym.infer_shape(**data_shapes)
	arg_name_shape = {k: s for k, s in zip(arg_names, arg_shapes)}
	params = {n: nd.empty(arg_name_shape[n], ctx=ctx) for n in param_names}
	params_grad = {n: nd.empty(arg_name_shape[n], ctx=ctx) for n in param_names}
	aux_states = {k: nd.empty(s, ctx=ctx) for k, s in zip(aux_names, aux_shapes)}
	exe = sym.bind(ctx=ctx, args=dict(params, **data_inputs),
	args_grad=params_grad,
	aux_states=aux_states)
	if initializer is not None:
	for k, v in params.items():
	initializer(k, v)
	return exe, params, params_grad, aux_states

	def copy_param(exe, new_param=None):
	if new_param is None:
	new_param = {k: nd.empty(v.shape, ctx=mx.cpu()) for k,v in exe.arg_dict.items()}
	for k, v in new_param.items():
	exe.arg_dict[k].copyto(v)
	return new_param

	def sample_test_acc(exe, X, Y, sample_pool=None, label_num=None, minibatch_size=100):
	if label_num is None:
	pred = numpy.zeros((X.shape[0],)).astype('float32')
	else:
	pred = numpy.zeros((X.shape[0], label_num)).astype('float32')
	iter = mx.io.NDArrayIter(data=X, label=Y, batch_size=minibatch_size, shuffle=False)
	denominator = 0.0
	if sample_pool is None:
	curr_instance = 0
	iter.reset()
	for batch in iter:
	exe.arg_dict['data'][:] = batch.data[0]
	exe.forward(is_train=False)
	batch_size = minibatch_size - batch.pad
	pred[curr_instance:curr_instance + minibatch_size - batch.pad, :] \
	+= exe.outputs[0].asnumpy()[:batch_size]
	curr_instance += batch_size
	else:
	old_param = copy_param(exe)
	for sample in sample_pool:
	if type(sample) is list:
	denominator += sample[0]
	else:
	denominator += 1.0
	for sample in sample_pool:
	if type(sample) is list:
	ratio = sample[0]/denominator
	param = sample[1]
	else:
	ratio = 1.0/denominator
	param = sample
	exe.copy_params_from(param)
	curr_instance = 0
	iter.reset()
	for batch in iter:
	exe.arg_dict['data'][:] = batch.data[0]
	exe.forward(is_train=False)
	batch_size = minibatch_size - batch.pad
	pred[curr_instance:curr_instance + minibatch_size - batch.pad, :] \
	+= ratio * exe.outputs[0].asnumpy()[:batch_size]
	curr_instance += batch_size
	exe.copy_params_from(old_param)
	correct = (pred.argmax(axis=1) == Y).sum()
	total = Y.shape[0]
	acc = correct/float(total)
	return correct, total, acc


	def sample_test_regression(exe, X, Y, sample_pool=None, minibatch_size=100, save_path="regression.txt"):
	old_param = copy_param(exe)
	if sample_pool is not None:
	pred = numpy.zeros(Y.shape + (len(sample_pool),))
	ratio = numpy.zeros((len(sample_pool),))
	if type(sample_pool[0]) is list:
	denominator = sum(sample[0] for sample in sample_pool)
	for i, sample in enumerate(sample_pool):
	ratio[i] = sample[0]/float(denominator)
	else:
	ratio[:] = 1.0/ Y.shape[0]
	iterator = mx.io.NDArrayIter(data=X, label=Y, batch_size=minibatch_size, shuffle=False)
	for i, sample in enumerate(sample_pool):
	if type(sample) is list:
	sample_param = sample[1]
	else:
	sample_param = sample
	iterator.reset()
	exe.copy_params_from(sample_param)
	curr_instance = 0
	for batch in iterator:
	exe.arg_dict['data'][:] = batch.data[0]
	exe.forward(is_train=False)
	batch_len = minibatch_size - batch.pad
	pred[curr_instance:curr_instance + minibatch_size - batch.pad, :, i] = \
	exe.outputs[0].asnumpy()[:batch_len]
	curr_instance += batch_len
	mean = pred.mean(axis=2)
	var = pred.std(axis=2)**2
	#print numpy.concatenate((Y, mean), axis=1)
	mse = numpy.square(Y.reshape((Y.shape[0], )) - mean.reshape((mean.shape[0], ))).mean()
	numpy.savetxt(save_path, numpy.concatenate((mean, var), axis=1))
	else:
	mean_var = numpy.zeros((Y.shape[0], 2))
	iterator = mx.io.NDArrayIter(data=X, label=Y, batch_size=minibatch_size, shuffle=False)
	iterator.reset()
	curr_instance = 0
	for batch in iterator:
	exe.arg_dict['data'][:] = batch.data[0]
	exe.forward(is_train=False)
	mean_var[curr_instance:curr_instance + minibatch_size - batch.pad, 0] = exe.outputs[0].asnumpy()[:minibatch_size - batch.pad].flatten()
	mean_var[curr_instance:curr_instance + minibatch_size - batch.pad, 1] = numpy.exp(exe.outputs[1].asnumpy())[:minibatch_size - batch.pad].flatten()
	curr_instance += minibatch_size - batch.pad
	mse = numpy.square(Y.reshape((Y.shape[0],)) - mean_var[:, 0]).mean()
	numpy.savetxt(save_path, mean_var)
	exe.copy_params_from(old_param)
	return mse

	def pred_test(testing_data, exe, param_list=None, save_path=""):
	ret = numpy.zeros((testing_data.shape[0], 2))
	if param_list is None:
	for i in range(testing_data.shape[0]):
	exe.arg_dict['data'][:] = testing_data[i, 0]
	exe.forward(is_train=False)
	ret[i, 0] = exe.outputs[0].asnumpy()
	ret[i, 1] = numpy.exp(exe.outputs[1].asnumpy())
	numpy.savetxt(save_path, ret)
	else:
	for i in range(testing_data.shape[0]):
	pred = numpy.zeros((len(param_list),))
	for j in range(len(param_list)):
	exe.copy_params_from(param_list[j])
	exe.arg_dict['data'][:] = testing_data[i, 0]
	exe.forward(is_train=False)
	pred[j] = exe.outputs[0].asnumpy()
	ret[i, 0] = pred.mean()
	ret[i, 1] = pred.std()**2
	numpy.savetxt(save_path, ret)
	mse = numpy.square(ret[:, 0] - testing_data[:, 0] **3).mean()
	return mse, ret