ccv_cnnp_model

Bug Summary

File:	nnc/ccv_cnnp_model_addons.c
Warning:	line 400, column 3 Declared variable-length array (VLA) has negative size
Annotated Source Code

Press '?' to see keyboard shortcuts
Show analyzer invocation
clang -cc1 -cc1 -triple x86_64-unknown-linux-gnu -analyze -disable-free -clear-ast-before-backend -disable-llvm-verifier -discard-value-names -main-file-name ccv_cnnp_model_addons.c -analyzer-checker=core -analyzer-checker=apiModeling -analyzer-checker=unix -analyzer-checker=deadcode -analyzer-checker=security.insecureAPI.UncheckedReturn -analyzer-checker=security.insecureAPI.getpw -analyzer-checker=security.insecureAPI.gets -analyzer-checker=security.insecureAPI.mktemp -analyzer-checker=security.insecureAPI.mkstemp -analyzer-checker=security.insecureAPI.vfork -analyzer-checker=nullability.NullPassedToNonnull -analyzer-checker=nullability.NullReturnedFromNonnull -analyzer-output plist -w -setup-static-analyzer -mrelocation-model pic -pic-level 2 -pic-is-pie -mframe-pointer=none -fmath-errno -ffp-contract=on -fno-rounding-math -mconstructor-aliases -funwind-tables=2 -target-cpu x86-64 -target-feature +sse2 -tune-cpu generic -debugger-tuning=gdb -fdebug-compilation-dir=/home/liu/actions-runner/_work/ccv/ccv/lib/nnc -fcoverage-compilation-dir=/home/liu/actions-runner/_work/ccv/ccv/lib/nnc -resource-dir /usr/local/lib/clang/19 -I ../ -I /usr/local/cuda/include -D HAVE_CBLAS -D HAVE_LIBPNG -D HAVE_LIBJPEG -D HAVE_FFTW3 -D HAVE_PTHREAD -D HAVE_LIBLINEAR -D HAVE_TESSERACT -D HAVE_AVCODEC -D HAVE_AVFORMAT -D HAVE_AVUTIL -D HAVE_SWSCALE -D HAVE_SSE2 -D HAVE_GSL -D HAVE_CUDA -D HAVE_CUDNN -D HAVE_NCCL -D USE_SYSTEM_CUB -I /usr/local/include -internal-isystem /usr/local/lib/clang/19/include -internal-isystem /usr/local/include -internal-isystem /usr/lib/gcc/x86_64-linux-gnu/12/../../../../x86_64-linux-gnu/include -internal-externc-isystem /usr/include/x86_64-linux-gnu -internal-externc-isystem /include -internal-externc-isystem /usr/include -O3 -ferror-limit 19 -fgnuc-version=4.2.1 -fskip-odr-check-in-gmf -vectorize-loops -vectorize-slp -analyzer-output=html -faddrsig -D__GCC_HAVE_DWARF2_CFI_ASM=1 -o /home/liu/actions-runner/_work/ccv/ccv/_analyze/2026-04-23-174101-1054636-1 -x c ccv_cnnp_model_addons.c
1#include "ccv_nnc.h"
2#include "ccv_nnc_easy.h"
3#include "ccv_nnc_internal.h"
4#include "ccv_internal.h"
5#include "_ccv_cnnp_model.h"
6 
7// MARK - Add-on Functions
8 
9static int _ccv_cnnp_model_clip_grad_norm_reduce_norm2(const ccv_nnc_cmd_t cmd, const ccv_nnc_hint_t hint, const int flags, ccv_nnc_tensor_t* const* const inputs, const int input_size, ccv_nnc_tensor_t* const* const outputs, const int output_size, ccv_nnc_stream_context_t* const stream_context)
10{
11	const int device_id = CCV_TENSOR_GET_DEVICE_ID(inputs[0]->info.type)(((inputs[0]->info.type) & 0xfff00) >> 8);
12	ccv_nnc_tensor_t* const old_norm2 = outputs[1 + device_id * 2];
13	ccv_nnc_tensor_t* const norm2 = outputs[1 + device_id * 2 + 1];
14	const int tensor_count = ccv_nnc_tensor_count(inputs[0]->info);
15	if (tensor_count == 1)
16		ccv_nnc_cmd_exec(CMD_MUL_FORWARD(1)ccv_nnc_cmd(CCV_NNC_MUL_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={1,}}}, 0), hint, flags, TENSOR_LIST(inputs[0], inputs[0])(ccv_nnc_tensor_t* []){inputs[0], inputs[0]}, (1 +1 +1 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(norm2)(ccv_nnc_tensor_t* []){norm2}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
17	else {
18		ccv_nnc_cmd_exec(CMD_REDUCE_NORM2_FORWARD()ccv_nnc_cmd(CCV_NNC_REDUCE_NORM2_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.reduce={.count=(1 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1),.axis={}}}
), 0), hint, flags, TENSOR_LIST(inputs[0])(ccv_nnc_tensor_t* []){inputs[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(norm2)(ccv_nnc_tensor_t* []){norm2}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
19		ccv_nnc_cmd_exec(CMD_MUL_FORWARD(1)ccv_nnc_cmd(CCV_NNC_MUL_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={1,}}}, 0), hint, flags, TENSOR_LIST(norm2, norm2)(ccv_nnc_tensor_t* []){norm2, norm2}, (1 +1 +1 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(norm2)(ccv_nnc_tensor_t* []){norm2}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
20	}
21	ccv_nnc_cmd_exec(CMD_ADD_FORWARD(1, 1)ccv_nnc_cmd(CCV_NNC_ADD_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={1, 1}}}, 0), hint, flags, TENSOR_LIST(old_norm2, norm2)(ccv_nnc_tensor_t* []){old_norm2, norm2}, (1 +1 +1 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(old_norm2)(ccv_nnc_tensor_t* []){old_norm2}, (1 +1 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
22	return CCV_NNC_EXEC_SUCCESS;
23}
24 
25static ccv_nnc_cmd_vtab_t clip_grad_norm_reduce_norm2_vtab = {
26	.exec = _ccv_cnnp_model_clip_grad_norm_reduce_norm2
27};
28 
29static int _ccv_cnnp_model_clip_grad_norm_scatter_norm2(const ccv_nnc_cmd_t cmd, const ccv_nnc_hint_t hint, const int flags, ccv_nnc_tensor_t* const* const inputs, const int input_size, ccv_nnc_tensor_t* const* const outputs, const int output_size, ccv_nnc_stream_context_t* const stream_context)
30{
31	const int device_id = CCV_TENSOR_GET_DEVICE_ID(inputs[0]->info.type)(((inputs[0]->info.type) & 0xfff00) >> 8);
32	ccv_nnc_tensor_t* const norm2 = inputs[1 + device_id * 2];
33	ccv_nnc_cmd_exec(CMD_MUL_FORWARD(1)ccv_nnc_cmd(CCV_NNC_MUL_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={1,}}}, 0), hint, flags, TENSOR_LIST(inputs[0], norm2)(ccv_nnc_tensor_t* []){inputs[0], norm2}, (1 +1 +1 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(outputs[0])(ccv_nnc_tensor_t* []){outputs[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
34	return CCV_NNC_EXEC_SUCCESS;
35}
36 
37static ccv_nnc_cmd_vtab_t clip_grad_norm_scatter_norm2_vtab = {
38	.exec = _ccv_cnnp_model_clip_grad_norm_scatter_norm2
39};
40 
41void ccv_cnnp_model_parameters_clip_grad_norm(ccv_cnnp_model_t* const model, const ccv_cnnp_model_io_t parameters, int norm_type, float max_norm, ccv_nnc_stream_context_t* const stream_context)
42{
43	assert(norm_type == 2)((void) sizeof ((norm_type == 2) ? 1 : 0), __extension__ ({ if
 (norm_type == 2) ; else __assert_fail ("norm_type == 2", "ccv_cnnp_model_addons.c"
, 43, __extension__ __PRETTY_FUNCTION__); }));
44	ccv_cnnp_compiled_data_t* const compiled_data = model->compiled_data;
45	assert(compiled_data)((void) sizeof ((compiled_data) ? 1 : 0), __extension__ ({ if
 (compiled_data) ; else __assert_fail ("compiled_data", "ccv_cnnp_model_addons.c"
, 45, __extension__ __PRETTY_FUNCTION__); }));
46	const int parallel_count = ccv_max(model->parallel_count, 1)({ typeof (model->parallel_count) _a = (model->parallel_count
); typeof (1) _b = (1); (_a > _b) ? _a : _b; });
47	ccv_nnc_tensor_t* norm2[parallel_count * 2];
48	ccv_nnc_tensor_t* max_normt[parallel_count];
49	const int stream_type = model->compiled_data->stream_type;
50	int i;
51	if (stream_type == CCV_STREAM_CONTEXT_GPU)
52	{
53		for (i = 0; i < parallel_count; i++)
54		{
55			ccv_nnc_tensor_param_t info = {
56				.type = CCV_TENSOR_GPU_MEMORY,
57				.format = CCV_TENSOR_FORMAT_NHWC,
58				.datatype = CCV_32F,
59				.dim = {1},
60			};
61			CCV_TENSOR_SET_DEVICE_ID(info.type, i)(info.type) = (((info.type) & ~0xfff00) | (((i) & 0xfff
) << 8));
62			norm2[i * 2] = ccv_nnc_tensor_new(ccv_nnc_xpu_alloc(&compiled_data->xpu_alloc, i, stream_context, ccv_nnc_tensor_data_size(info)), info, 0);
63			norm2[i * 2 + 1] = ccv_nnc_tensor_new(ccv_nnc_xpu_alloc(&compiled_data->xpu_alloc, i, stream_context, ccv_nnc_tensor_data_size(info)), info, 0);
64			max_normt[i] = ccv_nnc_tensor_new(ccv_nnc_xpu_alloc(&compiled_data->xpu_alloc, i, stream_context, ccv_nnc_tensor_data_size(info)), info, 0);
65		}
66	} else {
67		for (i = 0; i < parallel_count; i++)
68		{
69			ccv_nnc_tensor_param_t info = {
70				.type = CCV_TENSOR_CPU_MEMORY,
71				.format = CCV_TENSOR_FORMAT_NHWC,
72				.datatype = CCV_32F,
73				.dim = {1},
74			};
75			norm2[i * 2] = ccv_nnc_tensor_new(0, info, 0);
76			norm2[i * 2 + 1] = ccv_nnc_tensor_new(0, info, 0);
77			max_normt[i] = ccv_nnc_tensor_new(0, info, 0);
78		}
79	}
80	// zero out old norm2.
81	if (parallel_count > 1)
82	{
83		ccv_nnc_stream_context_t* streams[parallel_count];
84		ccv_nnc_stream_signal_t* signal;
85		if (stream_context)
86			signal = ccv_nnc_stream_context_emit_signal_new(stream_context);
87		for (i = 0; i < parallel_count; i++)
88		{
89			const int stream_type = CCV_TENSOR_GET_MEMORY(norm2[i * 2]->info.type)((norm2[i * 2]->info.type) & 0x3) == CCV_TENSOR_GPU_MEMORY ? CCV_STREAM_CONTEXT_GPU : CCV_STREAM_CONTEXT_CPU;
90			const int device_id = CCV_TENSOR_GET_DEVICE_ID(norm2[i * 2]->info.type)(((norm2[i * 2]->info.type) & 0xfff00) >> 8);
91			int type = stream_type;
92			CCV_STREAM_SET_DEVICE_ID(type, device_id)(type) = (((type) & ~0xfff00) | (((device_id) & 0xfff
) << 8));
93			ccv_nnc_stream_context_t* const stream_0 = ccv_cnnp_compiled_data_get_stream(compiled_data, type);
94			// Wait signal to finish.
95			if (stream_context)
96				ccv_nnc_stream_context_wait_signal(stream_0, signal);
97			ccv_nnc_cmd_exec(CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, 0, TENSOR_LIST(norm2[i * 2])(ccv_nnc_tensor_t* []){norm2[i * 2]}, (1 +1 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_0);
98			if (stream_context)
99			{
100				ccv_nnc_stream_signal_t* const signal = ccv_nnc_stream_context_emit_signal_new(stream_0);
101				ccv_nnc_stream_context_wait_signal(stream_context, signal);
102			}
103			streams[i] = stream_0;
104		}
105		// If this should be blocking, blocking it.
106		if (!stream_context)
107			for (i = 0; i < parallel_count; i++)
108				if (streams[i])
109					ccv_nnc_stream_context_wait(streams[i]);
110	} else {
111		ccv_nnc_cmd_exec(CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, 0, TENSOR_LIST(norm2[0])(ccv_nnc_tensor_t* []){norm2[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
112	}
113	// Gather norm2.
114	ccv_nnc_cmd_t reduce_cmd = {
115		.cmd = CCV_NNC_CUSTOM_FORWARD,
116		.isa = &clip_grad_norm_reduce_norm2_vtab,
117	};
118	ccv_cnnp_model_parameter_gradients_map(model, parameters, reduce_cmd, ccv_nnc_no_hint, 0, 0, 0, norm2, parallel_count * 2, stream_context);
119	// Now compute max(max_norm / norm2, 1.0).
120	if (parallel_count > 1)
121	{
122		ccv_nnc_stream_context_t* streams[parallel_count];
123		ccv_nnc_stream_signal_t* signal;
124		if (stream_context)
125			signal = ccv_nnc_stream_context_emit_signal_new(stream_context);
126		for (i = 0; i < parallel_count; i++)
127		{
128			const int stream_type = CCV_TENSOR_GET_MEMORY(norm2[i * 2]->info.type)((norm2[i * 2]->info.type) & 0x3) == CCV_TENSOR_GPU_MEMORY ? CCV_STREAM_CONTEXT_GPU : CCV_STREAM_CONTEXT_CPU;
129			const int device_id = CCV_TENSOR_GET_DEVICE_ID(norm2[i * 2]->info.type)(((norm2[i * 2]->info.type) & 0xfff00) >> 8);
130			int type = stream_type;
131			CCV_STREAM_SET_DEVICE_ID(type, device_id)(type) = (((type) & ~0xfff00) | (((device_id) & 0xfff
) << 8));
132			ccv_nnc_stream_context_t* const stream_0 = ccv_cnnp_compiled_data_get_stream(compiled_data, type);
133			// Wait signal to finish.
134			if (stream_context)
135				ccv_nnc_stream_context_wait_signal(stream_0, signal);
136			ccv_nnc_cmd_exec(CMD_EWSQRT_FORWARD()ccv_nnc_cmd(CCV_NNC_EWSQRT_FORWARD, 0, ccv_nnc_cmd_auto, 0), ccv_nnc_no_hint, 0, TENSOR_LIST(norm2[i * 2])(ccv_nnc_tensor_t* []){norm2[i * 2]}, (1 +1 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(norm2[i * 2])(ccv_nnc_tensor_t* []){norm2[i * 2]}, (1 +1 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_0);
137			ccv_nnc_cmd_exec(CMD_SET_FORWARD(max_norm)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={max_norm,}}}, 0), ccv_nnc_no_hint, 0, 0, 0, TENSOR_LIST(max_normt[i])(ccv_nnc_tensor_t* []){max_normt[i]}, (1 +1 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_0);
138			ccv_nnc_cmd_exec(CMD_EWDIV_FORWARD()ccv_nnc_cmd(CCV_NNC_EWDIV_FORWARD, 0, ccv_nnc_cmd_auto, 0), ccv_nnc_no_hint, 0, TENSOR_LIST(max_normt[i], norm2[i * 2])(ccv_nnc_tensor_t* []){max_normt[i], norm2[i * 2]}, (1 +1 +1 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1
), TENSOR_LIST(norm2[i * 2])(ccv_nnc_tensor_t* []){norm2[i * 2]}, (1 +1 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_0);
139			ccv_nnc_cmd_exec(CMD_CLAMP_FORWARD(NAN, 1)ccv_nnc_cmd(CCV_NNC_CLAMP_FORWARD, 0, (ccv_nnc_cmd_param_t){.
size={.dim={1,1,1}},.clamp={.min=(__builtin_nanf ("")),.max=1
}}, 0), ccv_nnc_no_hint, 0, TENSOR_LIST(norm2[i * 2])(ccv_nnc_tensor_t* []){norm2[i * 2]}, (1 +1 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(norm2[i * 2])(ccv_nnc_tensor_t* []){norm2[i * 2]}, (1 +1 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_0);
140			if (stream_context)
141			{
142				ccv_nnc_stream_signal_t* const signal = ccv_nnc_stream_context_emit_signal_new(stream_0);
143				ccv_nnc_stream_context_wait_signal(stream_context, signal);
144			}
145			streams[i] = stream_0;
146		}
147		// If this should be blocking, blocking it.
148		if (!stream_context)
149			for (i = 0; i < parallel_count; i++)
150				if (streams[i])
151					ccv_nnc_stream_context_wait(streams[i]);
152	} else {
153		ccv_nnc_cmd_exec(CMD_EWSQRT_FORWARD()ccv_nnc_cmd(CCV_NNC_EWSQRT_FORWARD, 0, ccv_nnc_cmd_auto, 0), ccv_nnc_no_hint, 0, TENSOR_LIST(norm2[0])(ccv_nnc_tensor_t* []){norm2[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(norm2[0])(ccv_nnc_tensor_t* []){norm2[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
154		ccv_nnc_cmd_exec(CMD_SET_FORWARD(max_norm)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={max_norm,}}}, 0), ccv_nnc_no_hint, 0, 0, 0, TENSOR_LIST(max_normt[0])(ccv_nnc_tensor_t* []){max_normt[0]}, (1 +1 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
155		ccv_nnc_cmd_exec(CMD_EWDIV_FORWARD()ccv_nnc_cmd(CCV_NNC_EWDIV_FORWARD, 0, ccv_nnc_cmd_auto, 0), ccv_nnc_no_hint, 0, TENSOR_LIST(max_normt[0], norm2[0])(ccv_nnc_tensor_t* []){max_normt[0], norm2[0]}, (1 +1 +1 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(norm2[0])(ccv_nnc_tensor_t* []){norm2[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
156		ccv_nnc_cmd_exec(CMD_CLAMP_FORWARD(NAN, 1)ccv_nnc_cmd(CCV_NNC_CLAMP_FORWARD, 0, (ccv_nnc_cmd_param_t){.
size={.dim={1,1,1}},.clamp={.min=(__builtin_nanf ("")),.max=1
}}, 0), ccv_nnc_no_hint, 0, TENSOR_LIST(norm2[0])(ccv_nnc_tensor_t* []){norm2[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(norm2[0])(ccv_nnc_tensor_t* []){norm2[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
157	}
158	ccv_nnc_cmd_t scatter_cmd = {
159		.cmd = CCV_NNC_CUSTOM_FORWARD,
160		.isa = &clip_grad_norm_scatter_norm2_vtab,
161	};
162	ccv_cnnp_model_parameter_gradients_map(model, parameters, scatter_cmd, ccv_nnc_no_hint, 0, norm2, parallel_count * 2, 0, 0, stream_context);
163	if (stream_type == CCV_STREAM_CONTEXT_GPU)
164		for (i = 0; i < parallel_count; i++)
165		{
166			ccv_nnc_xpu_free(&compiled_data->xpu_alloc, norm2[i * 2]->data.u8);
167			ccv_nnc_xpu_free(&compiled_data->xpu_alloc, norm2[i * 2 + 1]->data.u8);
168			ccv_nnc_xpu_free(&compiled_data->xpu_alloc, max_normt[i]->data.u8);
169		}
170	for (i = 0; i < parallel_count; i++)
171	{
172		ccv_nnc_tensor_free(norm2[i * 2]);
173		ccv_nnc_tensor_free(norm2[i * 2 + 1]);
174		ccv_nnc_tensor_free(max_normt[i]);
175	}
176}
177 
178// MARK - Add-on Functions
179 
180static int _ccv_cnnp_model_isnan(const ccv_nnc_cmd_t cmd, const ccv_nnc_hint_t hint, const int flags, ccv_nnc_tensor_t* const* const inputs, const int input_size, ccv_nnc_tensor_t* const* const outputs, const int output_size, ccv_nnc_stream_context_t* const stream_context)
181{
182	const int device_id = CCV_TENSOR_GET_DEVICE_ID(inputs[0]->info.type)(((inputs[0]->info.type) & 0xfff00) >> 8);
183	ccv_nnc_tensor_t* const old_isnanr = outputs[1 + device_id * 2];
184	ccv_nnc_tensor_t* const isnanr = outputs[1 + device_id * 2 + 1];
185	ccv_nnc_cmd_t reduce_cmd = CMD_REDUCE_ISNAN_FORWARD()ccv_nnc_cmd(CCV_NNC_REDUCE_ISNAN_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.reduce={.count=(1 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1),.axis={}}}
), 0);
186	reduce_cmd.info.reduce.count = ccv_nnc_tensor_nd(inputs[0]->info.dim);
187	int i;
188	for (i = 0; i < cmd.info.reduce.count; i++)
189		reduce_cmd.info.reduce.axis[i] = i;
190	ccv_nnc_cmd_exec(reduce_cmd, hint, flags, TENSOR_LIST(inputs[0])(ccv_nnc_tensor_t* []){inputs[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(isnanr)(ccv_nnc_tensor_t* []){isnanr}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
191	ccv_nnc_cmd_exec(CMD_EWSUM_FORWARD()ccv_nnc_cmd(CCV_NNC_EWSUM_FORWARD, 0, ccv_nnc_cmd_auto, 0), hint, flags, TENSOR_LIST(old_isnanr, isnanr)(ccv_nnc_tensor_t* []){old_isnanr, isnanr}, (1 +1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(old_isnanr)(ccv_nnc_tensor_t* []){old_isnanr}, (1 +1 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
192	return CCV_NNC_EXEC_SUCCESS;
193}
194 
195static ccv_nnc_cmd_vtab_t reduce_isnan_vtab = {
196	.exec = _ccv_cnnp_model_isnan
197};
198 
199int ccv_cnnp_model_parameter_gradients_isnan(ccv_cnnp_model_t* const model, const ccv_cnnp_model_io_t parameters, ccv_nnc_stream_context_t* const stream_context)
200{
201	ccv_cnnp_compiled_data_t* const compiled_data = model->compiled_data;
202	assert(compiled_data)((void) sizeof ((compiled_data) ? 1 : 0), __extension__ ({ if
 (compiled_data) ; else __assert_fail ("compiled_data", "ccv_cnnp_model_addons.c"
, 202, __extension__ __PRETTY_FUNCTION__); }));
203	const int parallel_count = ccv_max(model->parallel_count, 1)({ typeof (model->parallel_count) _a = (model->parallel_count
); typeof (1) _b = (1); (_a > _b) ? _a : _b; });
204	ccv_nnc_tensor_t* isnanr[parallel_count * 2];
205	const int stream_type = model->compiled_data->stream_type;
206	int i;
207	if (stream_type == CCV_STREAM_CONTEXT_GPU)
208	{
209		for (i = 0; i < parallel_count; i++)
210		{
211			ccv_nnc_tensor_param_t info = {
212				.type = CCV_TENSOR_GPU_MEMORY,
213				.format = CCV_TENSOR_FORMAT_NHWC,
214				.datatype = CCV_32S,
215				.dim = {1},
216			};
217			CCV_TENSOR_SET_DEVICE_ID(info.type, i)(info.type) = (((info.type) & ~0xfff00) | (((i) & 0xfff
) << 8));
218			isnanr[i * 2] = ccv_nnc_tensor_new(ccv_nnc_xpu_alloc(&compiled_data->xpu_alloc, i, stream_context, ccv_nnc_tensor_data_size(info)), info, 0);
219			isnanr[i * 2 + 1] = ccv_nnc_tensor_new(ccv_nnc_xpu_alloc(&compiled_data->xpu_alloc, i, stream_context, ccv_nnc_tensor_data_size(info)), info, 0);
220		}
221	} else {
222		for (i = 0; i < parallel_count; i++)
223		{
224			ccv_nnc_tensor_param_t info = {
225				.type = CCV_TENSOR_CPU_MEMORY,
226				.format = CCV_TENSOR_FORMAT_NHWC,
227				.datatype = CCV_32S,
228				.dim = {1},
229			};
230			isnanr[i * 2] = ccv_nnc_tensor_new(0, info, 0);
231			isnanr[i * 2 + 1] = ccv_nnc_tensor_new(0, info, 0);
232		}
233	}
234	// zero out old isnanr.
235	if (parallel_count > 1)
236	{
237		ccv_nnc_stream_context_t* streams[parallel_count];
238		ccv_nnc_stream_signal_t* signal;
239		if (stream_context)
240			signal = ccv_nnc_stream_context_emit_signal_new(stream_context);
241		for (i = 0; i < parallel_count; i++)
242		{
243			const int stream_type = CCV_TENSOR_GET_MEMORY(isnanr[i * 2]->info.type)((isnanr[i * 2]->info.type) & 0x3) == CCV_TENSOR_GPU_MEMORY ? CCV_STREAM_CONTEXT_GPU : CCV_STREAM_CONTEXT_CPU;
244			const int device_id = CCV_TENSOR_GET_DEVICE_ID(isnanr[i * 2]->info.type)(((isnanr[i * 2]->info.type) & 0xfff00) >> 8);
245			int type = stream_type;
246			CCV_STREAM_SET_DEVICE_ID(type, device_id)(type) = (((type) & ~0xfff00) | (((device_id) & 0xfff
) << 8));
247			ccv_nnc_stream_context_t* const stream_0 = ccv_cnnp_compiled_data_get_stream(compiled_data, type);
248			// Wait signal to finish.
249			if (stream_context)
250				ccv_nnc_stream_context_wait_signal(stream_0, signal);
251			ccv_nnc_cmd_exec(CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, 0, TENSOR_LIST(isnanr[i * 2])(ccv_nnc_tensor_t* []){isnanr[i * 2]}, (1 +1 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_0);
252			if (stream_context)
253			{
254				ccv_nnc_stream_signal_t* const signal = ccv_nnc_stream_context_emit_signal_new(stream_0);
255				ccv_nnc_stream_context_wait_signal(stream_context, signal);
256			}
257			streams[i] = stream_0;
258		}
259		// If this should be blocking, blocking it.
260		if (!stream_context)
261			for (i = 0; i < parallel_count; i++)
262				if (streams[i])
263					ccv_nnc_stream_context_wait(streams[i]);
264	} else
265		ccv_nnc_cmd_exec(CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, 0, TENSOR_LIST(isnanr[0])(ccv_nnc_tensor_t* []){isnanr[0]}, (1 +1 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), stream_context);
266	// Gather isnanr.
267	ccv_nnc_cmd_t reduce_cmd = {
268		.cmd = CCV_NNC_CUSTOM_FORWARD,
269		.isa = &reduce_isnan_vtab,
270	};
271	ccv_cnnp_model_parameter_gradients_map(model, parameters, reduce_cmd, ccv_nnc_no_hint, 0, 0, 0, isnanr, parallel_count * 2, stream_context);
272	for (i = 0; i < parallel_count; i++)
273		ccv_nnc_tensor_free(isnanr[i * 2 + 1]);
274	int retval = 0;
275	if (stream_type == CCV_TENSOR_GPU_MEMORY)
276	{
277		ccv_nnc_tensor_param_t info = {
278			.type = CCV_TENSOR_CPU_MEMORY,
279			.format = CCV_TENSOR_FORMAT_NHWC,
280			.datatype = CCV_32S,
281			.dim = {1},
282		};
283		ccv_nnc_tensor_t* checknan = ccv_nnc_tensor_new(0, info, 0);
284		for (i = 0; i < parallel_count; i++)
285		{
286			ccv_nnc_cmd_exec(CMD_DATA_TRANSFER_FORWARD()ccv_nnc_cmd(CCV_NNC_DATA_TRANSFER_FORWARD, 0, ccv_nnc_cmd_auto
, 0), ccv_nnc_no_hint, 0, TENSOR_LIST(isnanr[i * 2])(ccv_nnc_tensor_t* []){isnanr[i * 2]}, (1 +1 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_LIST(checknan)(ccv_nnc_tensor_t* []){checknan}, (1 +1 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), 0);
287			if (checknan->data.i32[0] > 0)
288			{
289				retval = 1;
290				break;
291			}
292		}
293		ccv_nnc_tensor_free(checknan);
294	} else {
295		for (i = 0; i < parallel_count; i++)
296			if (isnanr[i * 2]->data.i32[0] > 0)
297			{
298				retval = 1;
299				break;
300			}
301	}
302	for (i = 0; i < parallel_count; i++)
303		ccv_nnc_tensor_free(isnanr[i * 2]);
304	return retval;
305}
306 
307// MARK - Core Layers
308 
309static void _ccv_cnnp_sum_build(ccv_cnnp_model_t* const self, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
310{
311	PRINT(CCV_CLI_VERBOSE, "[cnnp_sum_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_sum_build] -\n"); fflush(stdout); } } while (
0);
312	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 312, __extension__ __PRETTY_FUNCTION__
); }));
313	outputs[0] = ccv_nnc_tensor_symbol_new(graph, ccv_nnc_tensor_symbol_params(graph, inputs[0]), 0);
314	ccv_nnc_graph_exec_symbol_new(graph, CMD_EWSUM_FORWARD()ccv_nnc_cmd(CCV_NNC_EWSUM_FORWARD, 0, ccv_nnc_cmd_auto, 0), inputs, input_size, outputs, output_size, 0);
315}
316 
317static ccv_cnnp_model_t* _ccv_cnnp_sum_copy(const ccv_cnnp_model_t* const self, void* const context);
318 
319static const ccv_cnnp_model_vtab_t ccv_cnnp_sum_isa = {
320	.build = _ccv_cnnp_sum_build,
321	.copy = _ccv_cnnp_sum_copy,
322};
323 
324typedef struct {
325	ccv_cnnp_model_t super;
326	ccv_nnc_tensor_symbol_t output;
327} ccv_cnnp_model_sum_t;
328 
329ccv_cnnp_model_t* ccv_cnnp_sum(const char* const name)
330{
331	ccv_cnnp_model_sum_t* const model_sum = (ccv_cnnp_model_sum_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_sum_t));
332	model_sum->super.isa = &ccv_cnnp_sum_isa;
333	model_sum->super.input_size = 0;
334	model_sum->super.outputs = &model_sum->output;
335	model_sum->super.output_size = 1;
336	ccv_cnnp_model_copy_name(&model_sum->super, name);
337	return (ccv_cnnp_model_t*)model_sum;
338}
339 
340static ccv_cnnp_model_t* _ccv_cnnp_sum_copy(const ccv_cnnp_model_t* const self, void* const context)
341{
342	return ccv_cnnp_sum(self->name);
343}
344 
345typedef struct {
346	ccv_cnnp_model_t super;
347	int axis;
348	ccv_nnc_tensor_symbol_t output;
349} ccv_cnnp_model_concat_t;
350 
351static void _ccv_cnnp_concat_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
352{
353	const ccv_cnnp_model_concat_t* const self = (const ccv_cnnp_model_concat_t*)super;
354	PRINT(CCV_CLI_VERBOSE, "[cnnp_concat_build] 1. -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_concat_build] 1. -\n"); fflush(stdout); } } while
 (0);
1
Assuming the condition is false→
2
←
Taking false branch→
3
←
Loop condition is false.  Exiting loop→
355	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 355, __extension__ __PRETTY_FUNCTION__
); }));
4
←
Assuming 'output_size' is equal to 1→
5
←
Taking true branch→
356	ccv_nnc_tensor_param_t output_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
357	int i, j;
358	if (output_params.dim[0] == 0)
6
←
Assuming the condition is false→
7
←
Taking false branch→
359		for (i = 1; i < input_size; i++)
360		{
361			output_params = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
362			if (output_params.dim[0] != 0)
363				break;
364		}
365	const int nd = ccv_nnc_tensor_nd(output_params.dim);
366	const int axis = self->axis;
367	assert(axis < nd)((void) sizeof ((axis < nd) ? 1 : 0), __extension__ ({ if (
axis < nd) ; else __assert_fail ("axis < nd", "ccv_cnnp_model_addons.c"
, 367, __extension__ __PRETTY_FUNCTION__); }));
8
←
Assuming 'axis' is < 'nd'→
9
←
Taking true branch→
368	output_params.dim[axis] = 0;
369	int input_is_contiguous = 1;
370	for (i = 0; i < input_size; i++)
10
←
Assuming 'i' is >= 'input_size'→
11
←
Loop condition is false. Execution continues on line 394→
371	{
372		const ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
373		const int input_nd = ccv_nnc_tensor_nd(input_params.dim);
374		if (input_nd == 0)
375		{
376			PRINT(CCV_CLI_VERBOSE, "[cnnp_concat_build] %d. input[%d]: -\n", i + 2, i)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_concat_build] %d. input[%d]: -\n", i + 2, i)
; fflush(stdout); } } while (0);
377			input_is_contiguous = 0;
378			continue;
379		}
380		if (CCV_CLI_OUTPUT_LEVEL_IS(CCV_CLI_VERBOSE)(CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
381		{
382			PRINT(CCV_CLI_VERBOSE, "[cnnp_concat_build] %d. input[%d]: (%d", i + 2, i, input_params.dim[0])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_concat_build] %d. input[%d]: (%d", i + 2, i,
 input_params.dim[0]); fflush(stdout); } } while (0);
383			int i;
384			for (i = 1; i < CCV_NNC_MAX_DIM_ALLOC(12) && input_params.dim[i] > 0; i++)
385				PRINT(CCV_CLI_VERBOSE, ", %d", input_params.dim[i])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(", %d", input_params.dim[i]); fflush(stdout); } } while
 (0);
386			PRINT(CCV_CLI_VERBOSE, ")\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(")\n"); fflush(stdout); } } while (0);
387		}
388		assert(input_nd == nd)((void) sizeof ((input_nd == nd) ? 1 : 0), __extension__ ({ if
 (input_nd == nd) ; else __assert_fail ("input_nd == nd", "ccv_cnnp_model_addons.c"
, 388, __extension__ __PRETTY_FUNCTION__); }));
389		for (j = 0; j < nd; j++)
390			if (j != axis)
391				{ assert(input_params.dim[j] == output_params.dim[j])((void) sizeof ((input_params.dim[j] == output_params.dim[j])
 ? 1 : 0), __extension__ ({ if (input_params.dim[j] == output_params
.dim[j]) ; else __assert_fail ("input_params.dim[j] == output_params.dim[j]"
, "ccv_cnnp_model_addons.c", 391, __extension__ __PRETTY_FUNCTION__
); })); }
392		output_params.dim[axis] += input_params.dim[axis];
393	}
394	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
395	int ofs[CCV_NNC_MAX_DIM_ALLOC(12)] = {};
396	int stride[CCV_NNC_MAX_DIM_ALLOC(12)] = {};
397	ccv_nnc_tensor_get_stride(output_params.dim, stride);
398	if (input_is_contiguous11.1
'input_is_contiguous' is 1
)
12
←
Taking true branch→
399	{
400		ccv_nnc_tensor_symbol_t aliases[input_size];
13
←
Declared variable-length array (VLA) has negative size
401		for (i = 0; i < input_size; i++)
402		{
403			const ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
404			aliases[i] = ccv_nnc_tensor_symbol_alias_new(graph, outputs[0], ofs, stride, input_params, 0);
405			ofs[axis] += input_params.dim[axis];
406		}
407		// Format transform is more flexible.
408		ccv_nnc_graph_exec_symbol_new(graph, CMD_FORMAT_TRANSFORM_FORWARD()ccv_nnc_cmd(CCV_NNC_FORMAT_TRANSFORM_FORWARD, 0, ccv_nnc_cmd_auto
, 0), inputs, input_size, aliases, input_size, "concat");
409	} else {
410		ccv_nnc_tensor_symbol_t aliases[input_size];
411		for (i = 0; i < input_size; i++)
412		{
413			const ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
414			if (input_params.dim[0] == 0)
415			{
416				// Create a new alias anyway, but not going to use it, in this way, the alias count will match during absorb.
417				aliases[i] = ccv_nnc_tensor_symbol_alias_new(graph, outputs[0], ofs, stride, input_params, 0);
418				continue;
419			}
420			aliases[i] = ccv_nnc_tensor_symbol_alias_new(graph, outputs[0], ofs, stride, input_params, 0);
421			ofs[axis] += input_params.dim[axis];
422		}
423		// Format transform is more flexible.
424		ccv_nnc_graph_exec_symbol_new(graph, CMD_FORMAT_TRANSFORM_FORWARD()ccv_nnc_cmd(CCV_NNC_FORMAT_TRANSFORM_FORWARD, 0, ccv_nnc_cmd_auto
, 0), inputs, input_size, aliases, input_size, "concat");
425	}
426}
427 
428static ccv_cnnp_model_t* _ccv_cnnp_concat_copy(const ccv_cnnp_model_t* const self, void* const context);
429 
430static const ccv_cnnp_model_vtab_t ccv_cnnp_concat_isa = {
431	.build = _ccv_cnnp_concat_build,
432	.copy = _ccv_cnnp_concat_copy,
433};
434 
435ccv_cnnp_model_t* ccv_cnnp_concat(const int axis, const char* const name)
436{
437	ccv_cnnp_model_concat_t* const model_concat = (ccv_cnnp_model_concat_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_concat_t));
438	model_concat->super.isa = &ccv_cnnp_concat_isa;
439	model_concat->super.input_size = 0;
440	model_concat->super.outputs = &model_concat->output;
441	model_concat->super.output_size = 1;
442	model_concat->axis = axis;
443	ccv_cnnp_model_copy_name(&model_concat->super, name);
444	return (ccv_cnnp_model_t*)model_concat;
445}
446 
447static ccv_cnnp_model_t* _ccv_cnnp_concat_copy(const ccv_cnnp_model_t* const super, void* const context)
448{
449	const ccv_cnnp_model_concat_t* const self = (const ccv_cnnp_model_concat_t*)super;
450	return ccv_cnnp_concat(self->axis, self->super.name);
451}
452 
453typedef struct {
454	ccv_cnnp_model_t super;
455	int axis;
456	ccv_nnc_tensor_symbol_t outputs[1];
457} ccv_cnnp_model_chunk_t;
458 
459static void _ccv_cnnp_chunk_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
460{
461	const ccv_cnnp_model_concat_t* const self = (const ccv_cnnp_model_concat_t*)super;
462	PRINT(CCV_CLI_VERBOSE, "[cnnp_chunk_build] 1. axis: %d\n", self->axis)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_chunk_build] 1. axis: %d\n", self->axis);
 fflush(stdout); } } while (0);
463	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 463, __extension__ __PRETTY_FUNCTION__); }));
464	const ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
465	if (CCV_CLI_OUTPUT_LEVEL_IS(CCV_CLI_VERBOSE)(CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
466	{
467		PRINT(CCV_CLI_VERBOSE, "[cnnp_chunk_build] 2. input: (%d", input_params.dim[0])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_chunk_build] 2. input: (%d", input_params.dim
[0]); fflush(stdout); } } while (0);
468		int i;
469		for (i = 1; i < CCV_NNC_MAX_DIM_ALLOC(12) && input_params.dim[i] > 0; i++)
470			PRINT(CCV_CLI_VERBOSE, ", %d", input_params.dim[i])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(", %d", input_params.dim[i]); fflush(stdout); } } while
 (0);
471		PRINT(CCV_CLI_VERBOSE, ")\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(")\n"); fflush(stdout); } } while (0);
472	}
473	ccv_nnc_tensor_param_t output_params = input_params;
474	int i;
475	const int nd = ccv_nnc_tensor_nd(output_params.dim);
476	const int axis = self->axis;
477	assert(axis < nd)((void) sizeof ((axis < nd) ? 1 : 0), __extension__ ({ if (
axis < nd) ; else __assert_fail ("axis < nd", "ccv_cnnp_model_addons.c"
, 477, __extension__ __PRETTY_FUNCTION__); }));
478	const int n = self->super.output_size;
479	assert(n == output_size)((void) sizeof ((n == output_size) ? 1 : 0), __extension__ ({
 if (n == output_size) ; else __assert_fail ("n == output_size"
, "ccv_cnnp_model_addons.c", 479, __extension__ __PRETTY_FUNCTION__
); }));
480	assert(output_params.dim[axis] % n == 0)((void) sizeof ((output_params.dim[axis] % n == 0) ? 1 : 0), __extension__
 ({ if (output_params.dim[axis] % n == 0) ; else __assert_fail
 ("output_params.dim[axis] % n == 0", "ccv_cnnp_model_addons.c"
, 480, __extension__ __PRETTY_FUNCTION__); }));
481	output_params.dim[axis] = output_params.dim[axis] / n;
482	int ofs[CCV_NNC_MAX_DIM_ALLOC(12)] = {};
483	int stride[CCV_NNC_MAX_DIM_ALLOC(12)] = {};
484	ccv_nnc_tensor_get_stride(input_params.dim, stride);
485	ccv_nnc_tensor_symbol_t to = ccv_nnc_tensor_symbol_alias_to(graph, inputs[0]);
486	if (to.d == CCV_NNC_NO_TENSOR_SYMBOL) // If we are not reshape an alias, it is straightforward.
487	{
488		for (i = 0; i < output_size; i++)
489		{
490			outputs[i] = ccv_nnc_tensor_symbol_alias_new(graph, inputs[0], ofs, stride, output_params, 0);
491			ofs[axis] += output_params.dim[axis];
492		}
493	} else {
494		// Otherwise, we need to check if it is permute. For permute, we cannot do alias directly.
495		// We need to first materialize the permute and then run reshape on top of it, otherwise it will be wrong.
496		int old_stride[CCV_NNC_MAX_DIM_ALLOC(12)];
497		ccv_nnc_tensor_symbol_alias_params(graph, inputs[0], 0, old_stride);
498		// We identify permute by checking if the stride is not in descending order.
499		// This also covered "permute" through reshape, rather than using ccv_cnnp_permute directly.
500		int i, no_permute = 1;
501		for (i = 1; no_permute && i < nd; i++)
502			if (old_stride[i - 1] < old_stride[i])
503				no_permute = 0;
504		if (no_permute)
505		{ // Just straightforward reshape if there is no no permute.
506			for (i = 0; i < output_size; i++)
507			{
508				outputs[i] = ccv_nnc_tensor_symbol_alias_new(graph, inputs[0], ofs, old_stride, output_params, 0);
509				ofs[axis] += output_params.dim[axis];
510			}
511		} else {
512			// Otherwise, we first do format transform to plain tensor and then do reshape.
513			ccv_nnc_tensor_symbol_t permuted = ccv_nnc_tensor_symbol_new(graph, input_params, 0);
514			ccv_nnc_graph_exec_symbol_new(graph, CMD_FORMAT_TRANSFORM_FORWARD()ccv_nnc_cmd(CCV_NNC_FORMAT_TRANSFORM_FORWARD, 0, ccv_nnc_cmd_auto
, 0), TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(permuted)(const ccv_nnc_tensor_symbol_t []){permuted}, (1 +1 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "reshape");
515			for (i = 0; i < output_size; i++)
516			{
517				outputs[i] = ccv_nnc_tensor_symbol_alias_new(graph, permuted, ofs, stride, output_params, 0);
518				ofs[axis] += output_params.dim[axis];
519			}
520		}
521	}
522}
523 
524static ccv_cnnp_model_t* _ccv_cnnp_chunk_copy(const ccv_cnnp_model_t* const self, void* const context);
525 
526static const ccv_cnnp_model_vtab_t ccv_cnnp_chunk_isa = {
527	.build = _ccv_cnnp_chunk_build,
528	.copy = _ccv_cnnp_chunk_copy,
529};
530 
531ccv_cnnp_model_t* ccv_cnnp_chunk(const int n, const int axis, const char* const name)
532{
533	assert(n >= 1)((void) sizeof ((n >= 1) ? 1 : 0), __extension__ ({ if (n >=
 1) ; else __assert_fail ("n >= 1", "ccv_cnnp_model_addons.c"
, 533, __extension__ __PRETTY_FUNCTION__); }));
534	ccv_cnnp_model_chunk_t* const model_chunk = (ccv_cnnp_model_chunk_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_chunk_t) + sizeof(ccv_nnc_tensor_symbol_t) * (n - 1));
535	model_chunk->super.isa = &ccv_cnnp_chunk_isa;
536	model_chunk->super.input_size = 1;
537	model_chunk->super.outputs = model_chunk->outputs;
538	model_chunk->super.output_size = n;
539	model_chunk->axis = axis;
540	ccv_cnnp_model_copy_name(&model_chunk->super, name);
541	return (ccv_cnnp_model_t*)model_chunk;
542}
543 
544static ccv_cnnp_model_t* _ccv_cnnp_chunk_copy(const ccv_cnnp_model_t* const super, void* const context)
545{
546	const ccv_cnnp_model_chunk_t* const self = (const ccv_cnnp_model_chunk_t*)super;
547	return ccv_cnnp_chunk(self->super.output_size, self->axis, self->super.name);
548}
549 
550typedef struct {
551	ccv_cnnp_model_t super;
552	ccv_nnc_tensor_symbol_t output;
553	int format;
554	int dim[CCV_NNC_MAX_DIM_ALLOC(12)];
555	int ofs[CCV_NNC_MAX_DIM_ALLOC(12)];
556	int stride[CCV_NNC_MAX_DIM_ALLOC(12)];
557} ccv_cnnp_model_reshape_t;
558 
559static void _ccv_cnnp_reshape_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
560{
561	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 561, __extension__ __PRETTY_FUNCTION__); }));
562	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 562, __extension__ __PRETTY_FUNCTION__
); }));
563	ccv_cnnp_model_reshape_t* const self = (ccv_cnnp_model_reshape_t*)super;
564	if (CCV_CLI_OUTPUT_LEVEL_IS(CCV_CLI_VERBOSE)(CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
565	{
566		PRINT(CCV_CLI_VERBOSE, "[cnnp_reshape_build] 1. dim: (%d", self->dim[0])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_reshape_build] 1. dim: (%d", self->dim[0]
); fflush(stdout); } } while (0);
567		int i;
568		for (i = 1; i < CCV_NNC_MAX_DIM_ALLOC(12) && self->dim[i] > 0; i++)
569			PRINT(CCV_CLI_VERBOSE, ", %d", self->dim[i])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(", %d", self->dim[i]); fflush(stdout); } } while
 (0);
570		const int count = i;
571		PRINT(CCV_CLI_VERBOSE, "), ofs: (%d", self->ofs[0])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("), ofs: (%d", self->ofs[0]); fflush(stdout); } }
 while (0);
572		for (i = 1; i < count; i++)
573			PRINT(CCV_CLI_VERBOSE, ", %d", self->ofs[i])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(", %d", self->ofs[i]); fflush(stdout); } } while
 (0);
574		PRINT(CCV_CLI_VERBOSE, "), stride: (%d", self->stride[0])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("), stride: (%d", self->stride[0]); fflush(stdout
); } } while (0);
575		for (i = 1; i < count; i++)
576			PRINT(CCV_CLI_VERBOSE, ", %d", self->stride[i])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(", %d", self->stride[i]); fflush(stdout); } } while
 (0);
577		PRINT(CCV_CLI_VERBOSE, ")\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(")\n"); fflush(stdout); } } while (0);
578	}
579	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
580	int dim[CCV_NNC_MAX_DIM_ALLOC(12)];
581	memcpy(dim, self->dim, sizeof(dim));
582	int i, auto_idx = -1;
583	size_t known = 1;
584	const size_t tensor_count = ccv_nnc_tensor_count(params);
585	for (i = 0; i < CCV_NNC_MAX_DIM_ALLOC(12) && dim[i]; i++)
586		if (dim[i] == -1)
587			auto_idx = i;
588		else
589			known *= dim[i];
590	if (auto_idx >= 0)
591	{
592		assert(known > 0 && tensor_count % known == 0)((void) sizeof ((known > 0 && tensor_count % known
 == 0) ? 1 : 0), __extension__ ({ if (known > 0 &&
 tensor_count % known == 0) ; else __assert_fail ("known > 0 && tensor_count % known == 0"
, "ccv_cnnp_model_addons.c", 592, __extension__ __PRETTY_FUNCTION__
); }));
593		dim[auto_idx] = tensor_count / known;
594	}
595	if (CCV_CLI_OUTPUT_LEVEL_IS(CCV_CLI_VERBOSE)(CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
596	{
597		PRINT(CCV_CLI_VERBOSE, "[cnnp_reshape_build] 2. input: (%d", params.dim[0])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_reshape_build] 2. input: (%d", params.dim[0]
); fflush(stdout); } } while (0);
598		int i;
599		for (i = 1; i < CCV_NNC_MAX_DIM_ALLOC(12) && params.dim[i] > 0; i++)
600			PRINT(CCV_CLI_VERBOSE, ", %d", params.dim[i])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(", %d", params.dim[i]); fflush(stdout); } } while (
0);
601		PRINT(CCV_CLI_VERBOSE, ")\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf(")\n"); fflush(stdout); } } while (0);
602	}
603	assert(ccv_nnc_dimension_count(dim) <= ccv_nnc_tensor_count(params))((void) sizeof ((ccv_nnc_dimension_count(dim) <= ccv_nnc_tensor_count
(params)) ? 1 : 0), __extension__ ({ if (ccv_nnc_dimension_count
(dim) <= ccv_nnc_tensor_count(params)) ; else __assert_fail
 ("ccv_nnc_dimension_count(dim) <= ccv_nnc_tensor_count(params)"
, "ccv_cnnp_model_addons.c", 603, __extension__ __PRETTY_FUNCTION__
); }));
604	ccv_nnc_tensor_symbol_t to = ccv_nnc_tensor_symbol_alias_to(graph, inputs[0]);
605	int stride_from_dim[CCV_NNC_MAX_DIM_ALLOC(12)];
606	if (to.d == CCV_NNC_NO_TENSOR_SYMBOL) // If we are not reshape an alias, it is straightforward.
607	{
608		memcpy(params.dim, dim, sizeof(params.dim));
609		int* stride;
610		if (self->stride[0] == 0)
611		{
612			ccv_nnc_tensor_get_stride(dim, stride_from_dim);
613			stride = stride_from_dim;
614		} else
615			stride = self->stride;
616		if (self->format > 0)
617			params.format = self->format;
618		outputs[0] = ccv_nnc_tensor_symbol_alias_new(graph, inputs[0], self->ofs, stride, params, 0);
619	} else {
620		// Otherwise, we need to check if it is permute. For permute, we cannot do alias directly.
621		// We need to first materialize the permute and then run reshape on top of it, otherwise it will be wrong.
622		int old_stride[CCV_NNC_MAX_DIM_ALLOC(12)];
623		ccv_nnc_tensor_symbol_alias_params(graph, inputs[0], 0, old_stride);
624		// We identify permute by checking if the stride is not in descending order.
625		// This also covered "permute" through reshape, rather than using ccv_cnnp_permute directly.
626		const int nd = ccv_nnc_tensor_nd(params.dim);
627		const int new_nd = ccv_nnc_tensor_nd(dim);
628		int i, no_permute = 1;
629		// If the new dim has different nd, or we actually have a stride, we need to check if it is no permute or not.
630		if (new_nd != nd || (self->stride[0] != 0 && memcmp(self->stride, old_stride, sizeof(self->stride))))
631			for (i = 1; no_permute && i < nd; i++)
632				if (old_stride[i - 1] < old_stride[i])
633					no_permute = 0;
634		if (no_permute)
635		{ // Just straightforward reshape if there is no no permute.
636			memcpy(params.dim, dim, sizeof(params.dim));
637			int* stride;
638			if (self->stride[0] == 0)
639			{
640				if (new_nd != nd) // Cannot use old stride.
641				{
642					ccv_nnc_tensor_get_stride(dim, stride_from_dim);
643					stride = stride_from_dim;
644				} else
645					stride = old_stride;
646			} else
647				stride = self->stride;
648			if (self->format > 0)
649				params.format = self->format;
650			outputs[0] = ccv_nnc_tensor_symbol_alias_new(graph, inputs[0], self->ofs, stride, params, 0);
651		} else {
652			// Otherwise, we first do format transform to plain tensor and then do reshape.
653			ccv_nnc_tensor_symbol_t permuted = ccv_nnc_tensor_symbol_new(graph, params, 0);
654			ccv_nnc_graph_exec_symbol_new(graph, CMD_FORMAT_TRANSFORM_FORWARD()ccv_nnc_cmd(CCV_NNC_FORMAT_TRANSFORM_FORWARD, 0, ccv_nnc_cmd_auto
, 0), TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(permuted)(const ccv_nnc_tensor_symbol_t []){permuted}, (1 +1 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "reshape");
655			memcpy(params.dim, dim, sizeof(params.dim));
656			int* stride;
657			if (self->stride[0] == 0)
658			{
659				ccv_nnc_tensor_get_stride(dim, stride_from_dim);
660				stride = stride_from_dim;
661			} else
662				stride = self->stride;
663			if (self->format > 0)
664				params.format = self->format;
665			// And then we create alias against the permuted one.
666			outputs[0] = ccv_nnc_tensor_symbol_alias_new(graph, permuted, self->ofs, stride, params, 0);
667		}
668	}
669}
670 
671static ccv_cnnp_model_t* _ccv_cnnp_reshape_copy(const ccv_cnnp_model_t* const super, void* const context);
672 
673static const ccv_cnnp_model_vtab_t ccv_cnnp_reshape_isa = {
674	.build = _ccv_cnnp_reshape_build,
675	.copy = _ccv_cnnp_reshape_copy,
676};
677 
678ccv_cnnp_model_t* ccv_cnnp_reshape(const int format, const int dim[CCV_NNC_MAX_DIM_ALLOC(12)], const int ofs[CCV_NNC_MAX_DIM_ALLOC(12)], const int stride[CCV_NNC_MAX_DIM_ALLOC(12)], const char* const name)
679{
680	ccv_cnnp_model_reshape_t* const model_reshape = (ccv_cnnp_model_reshape_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_reshape_t));
681	model_reshape->super.isa = &ccv_cnnp_reshape_isa;
682	model_reshape->super.input_size = 1;
683	model_reshape->super.outputs = &model_reshape->output;
684	model_reshape->super.output_size = 1;
685	ccv_cnnp_model_copy_name(&model_reshape->super, name);
686	model_reshape->format = format;
687	memcpy(model_reshape->dim, dim, sizeof(model_reshape->dim));
688	memcpy(model_reshape->ofs, ofs, sizeof(model_reshape->ofs));
689	if (stride[0] != 0)
690		memcpy(model_reshape->stride, stride, sizeof(model_reshape->stride));
691	return (ccv_cnnp_model_t*)model_reshape;
692}
693 
694static ccv_cnnp_model_t* _ccv_cnnp_reshape_copy(const ccv_cnnp_model_t* const super, void* const context)
695{
696	const ccv_cnnp_model_reshape_t* const self = (const ccv_cnnp_model_reshape_t*)super;
697	return ccv_cnnp_reshape(self->format, self->dim, self->ofs, self->stride, self->super.name);
698}
699 
700typedef struct {
701	ccv_cnnp_model_t super;
702	ccv_nnc_tensor_symbol_t output;
703	int type;
704	int begin[CCV_NNC_MAX_DIM_ALLOC(12)];
705	int end[CCV_NNC_MAX_DIM_ALLOC(12)];
706} ccv_cnnp_model_pad_t;
707 
708static void _ccv_cnnp_pad_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
709{
710	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 710, __extension__ __PRETTY_FUNCTION__); }));
711	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 711, __extension__ __PRETTY_FUNCTION__
); }));
712	ccv_cnnp_model_pad_t* const self = (ccv_cnnp_model_pad_t*)super;
713	PRINT(CCV_CLI_VERBOSE, "[cnnp_pad_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_pad_build] -\n"); fflush(stdout); } } while (
0);
714	const ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
715	const int nd = ccv_nnc_tensor_nd(input_params.dim);
716	ccv_nnc_tensor_param_t params = input_params;
717	int i;
718	for (i = 0 ; i < nd; i++)
719		params.dim[i] += self->begin[i] + self->end[i];
720	const ccv_nnc_tensor_symbol_t padded = ccv_nnc_tensor_symbol_new(graph, params, 0);
721	ccv_nnc_cmd_t pad = CMD_PAD_FORWARD(self->type, (), ())ccv_nnc_cmd(CCV_NNC_PAD_FORWARD, 0, ((ccv_nnc_cmd_param_t){.size
={.dim={}},.pad={.type=self->type,.end={}}}), 0);
722	memcpy(pad.info.size.dim, self->begin, sizeof(pad.info.size.dim));
723	memcpy(pad.info.pad.end, self->end, sizeof(pad.info.pad.end));
724	ccv_nnc_graph_exec_symbol_new(graph, pad, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(padded)(const ccv_nnc_tensor_symbol_t []){padded}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "pad");
725	outputs[0] = padded;
726}
727 
728static ccv_cnnp_model_t* _ccv_cnnp_pad_copy(const ccv_cnnp_model_t* const super, void* const context);
729 
730static const ccv_cnnp_model_vtab_t ccv_cnnp_pad_isa = {
731	.build = _ccv_cnnp_pad_build,
732	.copy = _ccv_cnnp_pad_copy,
733};
734 
735ccv_cnnp_model_t* ccv_cnnp_pad(const int type, const int begin[CCV_NNC_MAX_DIM_ALLOC(12)], const int end[CCV_NNC_MAX_DIM_ALLOC(12)], const char* const name)
736{
737	ccv_cnnp_model_pad_t* const model_pad = (ccv_cnnp_model_pad_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_pad_t));
738	model_pad->super.isa = &ccv_cnnp_pad_isa;
739	model_pad->super.input_size = 1;
740	model_pad->super.outputs = &model_pad->output;
741	model_pad->super.output_size = 1;
742	ccv_cnnp_model_copy_name(&model_pad->super, name);
743	model_pad->type = type;
744	memcpy(model_pad->begin, begin, sizeof(model_pad->begin));
745	memcpy(model_pad->end, end, sizeof(model_pad->end));
746	return (ccv_cnnp_model_t*)model_pad;
747}
748 
749static ccv_cnnp_model_t* _ccv_cnnp_pad_copy(const ccv_cnnp_model_t* const super, void* const context)
750{
751	const ccv_cnnp_model_pad_t* const self = (const ccv_cnnp_model_pad_t*)super;
752	return ccv_cnnp_pad(self->type, self->begin, self->end, self->super.name);
753}
754 
755typedef struct {
756	ccv_cnnp_model_t super;
757	ccv_nnc_tensor_symbol_t output;
758} ccv_cnnp_model_identity_t;
759 
760static void _ccv_cnnp_identity_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
761{
762	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 762, __extension__ __PRETTY_FUNCTION__); }));
763	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 763, __extension__ __PRETTY_FUNCTION__
); }));
764	PRINT(CCV_CLI_VERBOSE, "[cnnp_identity_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_identity_build] -\n"); fflush(stdout); } } while
 (0);
765	outputs[0] = inputs[0];
766}
767 
768static ccv_cnnp_model_t* _ccv_cnnp_identity_copy(const ccv_cnnp_model_t* const super, void* const context);
769 
770static const ccv_cnnp_model_vtab_t ccv_cnnp_identity_isa = {
771	.build = _ccv_cnnp_identity_build,
772	.copy = _ccv_cnnp_identity_copy,
773};
774 
775ccv_cnnp_model_t* ccv_cnnp_identity(const char* const name)
776{
777	ccv_cnnp_model_identity_t* const model_identity = (ccv_cnnp_model_identity_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_identity_t));
778	model_identity->super.isa = &ccv_cnnp_identity_isa;
779	model_identity->super.input_size = 1;
780	model_identity->super.outputs = &model_identity->output;
781	model_identity->super.output_size = 1;
782	ccv_cnnp_model_copy_name(&model_identity->super, name);
783	return (ccv_cnnp_model_t*)model_identity;
784}
785 
786static ccv_cnnp_model_t* _ccv_cnnp_identity_copy(const ccv_cnnp_model_t* const super, void* const context)
787{
788	const ccv_cnnp_model_identity_t* const self = (const ccv_cnnp_model_identity_t*)super;
789	return ccv_cnnp_identity(self->super.name);
790}
791 
792typedef struct {
793	ccv_cnnp_model_t super;
794	ccv_nnc_tensor_symbol_t output;
795	int index[CCV_NNC_MAX_DIM_ALLOC(12)];
796} ccv_cnnp_model_permute_t;
797 
798static void _ccv_cnnp_permute_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
799{
800	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 800, __extension__ __PRETTY_FUNCTION__); }));
801	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 801, __extension__ __PRETTY_FUNCTION__
); }));
802	ccv_cnnp_model_permute_t* const self = (ccv_cnnp_model_permute_t*)super;
803	PRINT(CCV_CLI_VERBOSE, "[cnnp_permute_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_permute_build] -\n"); fflush(stdout); } } while
 (0);
804	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
805	ccv_nnc_tensor_symbol_t to = ccv_nnc_tensor_symbol_alias_to(graph, inputs[0]);
806	const int nd = ccv_nnc_tensor_nd(params.dim);
807	int input_dim[CCV_NNC_MAX_DIM_ALLOC(12)];
808	memcpy(input_dim, params.dim, sizeof(params.dim));
809	int input_stride[CCV_NNC_MAX_DIM_ALLOC(12)] = {};
810	int output_stride[CCV_NNC_MAX_DIM_ALLOC(12)] = {};
811	if (to.d == CCV_NNC_NO_TENSOR_SYMBOL) // If it is not an alias. Find stride and permute.
812	{
813		ccv_nnc_tensor_get_stride(input_dim, input_stride);
814		int i;
815		for (i = 0; i < nd; i++)
816		{
817			const int idx = self->index[i];
818			assert(idx >= 0 && idx < nd)((void) sizeof ((idx >= 0 && idx < nd) ? 1 : 0)
, __extension__ ({ if (idx >= 0 && idx < nd) ; else
 __assert_fail ("idx >= 0 && idx < nd", "ccv_cnnp_model_addons.c"
, 818, __extension__ __PRETTY_FUNCTION__); }));
819			params.dim[i] = input_dim[idx];
820			output_stride[i] = input_stride[idx];
821		}
822		outputs[0] = ccv_nnc_tensor_symbol_alias_new(graph, inputs[0], ccv_nnc_no_ofs, output_stride, params, 0);
823	} else {
824		// if it is an alias, we can get the stride from it and use that.
825		int input_ofs[CCV_NNC_MAX_DIM_ALLOC(12)];
826		ccv_nnc_tensor_symbol_alias_params(graph, inputs[0], input_ofs, input_stride);
827		assert(input_stride[0] != 0)((void) sizeof ((input_stride[0] != 0) ? 1 : 0), __extension__
 ({ if (input_stride[0] != 0) ; else __assert_fail ("input_stride[0] != 0"
, "ccv_cnnp_model_addons.c", 827, __extension__ __PRETTY_FUNCTION__
); }));
828		int output_ofs[CCV_NNC_MAX_DIM_ALLOC(12)] = {};
829		int i;
830		for (i = 0; i < nd; i++)
831		{
832			const int idx = self->index[i];
833			assert(idx >= 0 && idx < nd)((void) sizeof ((idx >= 0 && idx < nd) ? 1 : 0)
, __extension__ ({ if (idx >= 0 && idx < nd) ; else
 __assert_fail ("idx >= 0 && idx < nd", "ccv_cnnp_model_addons.c"
, 833, __extension__ __PRETTY_FUNCTION__); }));
834			params.dim[i] = input_dim[idx];
835			output_stride[i] = input_stride[idx];
836			output_ofs[i] = input_ofs[idx];
837		}
838		outputs[0] = ccv_nnc_tensor_symbol_alias_new(graph, inputs[0], output_ofs, output_stride, params, 0);
839	}
840}
841 
842static ccv_cnnp_model_t* _ccv_cnnp_permute_copy(const ccv_cnnp_model_t* const super, void* const context);
843 
844static const ccv_cnnp_model_vtab_t ccv_cnnp_permute_isa = {
845	.build = _ccv_cnnp_permute_build,
846	.copy = _ccv_cnnp_permute_copy,
847};
848 
849ccv_cnnp_model_t* ccv_cnnp_permute(const int index[CCV_NNC_MAX_DIM_ALLOC(12)], const char* const name)
850{
851	ccv_cnnp_model_permute_t* const model_permute = (ccv_cnnp_model_permute_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_permute_t));
852	model_permute->super.isa = &ccv_cnnp_permute_isa;
853	model_permute->super.input_size = 1;
854	model_permute->super.outputs = &model_permute->output;
855	model_permute->super.output_size = 1;
856	ccv_cnnp_model_copy_name(&model_permute->super, name);
857	memcpy(model_permute->index, index, sizeof(model_permute->index));
858	return (ccv_cnnp_model_t*)model_permute;
859}
860 
861static ccv_cnnp_model_t* _ccv_cnnp_permute_copy(const ccv_cnnp_model_t* const super, void* const context)
862{
863	const ccv_cnnp_model_permute_t* const self = (const ccv_cnnp_model_permute_t*)super;
864	return ccv_cnnp_permute(self->index, self->super.name);
865}
866 
867typedef struct {
868	ccv_cnnp_model_t super;
869	int index;
870	ccv_nnc_tensor_symbol_t output;
871} ccv_cnnp_model_extract_t;
872 
873static void _ccv_cnnp_extract_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
874{
875	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 875, __extension__ __PRETTY_FUNCTION__
); }));
876	ccv_cnnp_model_extract_t* const self = (ccv_cnnp_model_extract_t*)super;
877	PRINT(CCV_CLI_VERBOSE, "[cnnp_extract_build] index: %d\n", self->index)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_extract_build] index: %d\n", self->index)
; fflush(stdout); } } while (0);
878	outputs[0] = inputs[self->index];
879}
880 
881static ccv_cnnp_model_t* _ccv_cnnp_extract_copy(const ccv_cnnp_model_t* const self, void* const context);
882 
883static const ccv_cnnp_model_vtab_t ccv_cnnp_extract_isa = {
884	.build = _ccv_cnnp_extract_build,
885	.copy = _ccv_cnnp_extract_copy,
886};
887 
888ccv_cnnp_model_t* ccv_cnnp_extract(const int index, const char* const name)
889{
890	ccv_cnnp_model_extract_t* const model_extract = (ccv_cnnp_model_extract_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_extract_t));
891	model_extract->index = index;
892	model_extract->super.isa = &ccv_cnnp_extract_isa;
893	model_extract->super.input_size = 0;
894	model_extract->super.outputs = &model_extract->output;
895	model_extract->super.output_size = 1;
896	ccv_cnnp_model_copy_name(&model_extract->super, name);
897	return (ccv_cnnp_model_t*)model_extract;
898}
899 
900static ccv_cnnp_model_t* _ccv_cnnp_extract_copy(const ccv_cnnp_model_t* const super, void* const context)
901{
902	ccv_cnnp_model_extract_t* const self = (ccv_cnnp_model_extract_t*)super;
903	return ccv_cnnp_extract(self->index, self->super.name);
904}
905 
906typedef struct {
907	ccv_cnnp_model_t super;
908	ccv_nnc_tensor_symbol_t output;
909} ccv_cnnp_model_flatten_t;
910 
911static void _ccv_cnnp_flatten_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
912{
913	PRINT(CCV_CLI_VERBOSE, "[cnnp_flatten_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_flatten_build] -\n"); fflush(stdout); } } while
 (0);
914	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 914, __extension__ __PRETTY_FUNCTION__); }));
915	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 915, __extension__ __PRETTY_FUNCTION__
); }));
916	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
917	ccv_nnc_tensor_param_t output_params = params;
918	memset(output_params.dim, 0, sizeof(output_params.dim));
919	output_params.dim[0] = ccv_nnc_tensor_get_n(params);
920	assert(output_params.dim[0] > 0)((void) sizeof ((output_params.dim[0] > 0) ? 1 : 0), __extension__
 ({ if (output_params.dim[0] > 0) ; else __assert_fail ("output_params.dim[0] > 0"
, "ccv_cnnp_model_addons.c", 920, __extension__ __PRETTY_FUNCTION__
); }));
921	output_params.dim[1] = ccv_nnc_tensor_count(params) / output_params.dim[0];
922	int stride[CCV_NNC_MAX_DIM_ALLOC(12)] = {};
923	ccv_nnc_tensor_get_stride(output_params.dim, stride);
924	outputs[0] = ccv_nnc_tensor_symbol_alias_new(graph, inputs[0], DIM_ALLOC()(int [(12)]){}, stride, output_params, 0);
925}
926 
927static ccv_cnnp_model_t* _ccv_cnnp_flatten_copy(const ccv_cnnp_model_t* const self, void* const context);
928 
929static const ccv_cnnp_model_vtab_t ccv_cnnp_flatten_isa = {
930	.build = _ccv_cnnp_flatten_build,
931	.copy = _ccv_cnnp_flatten_copy,
932};
933 
934ccv_cnnp_model_t* ccv_cnnp_flatten(const char* const name)
935{
936	ccv_cnnp_model_flatten_t* const model_flatten = (ccv_cnnp_model_flatten_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_flatten_t));
937	model_flatten->super.isa = &ccv_cnnp_flatten_isa;
938	model_flatten->super.input_size = 1;
939	model_flatten->super.outputs = &model_flatten->output;
940	model_flatten->super.output_size = 1;
941	ccv_cnnp_model_copy_name(&model_flatten->super, name);
942	return (ccv_cnnp_model_t*)model_flatten;
943}
944 
945static ccv_cnnp_model_t* _ccv_cnnp_flatten_copy(const ccv_cnnp_model_t* const self, void* const context)
946{
947	return ccv_cnnp_flatten(self->name);
948}
949 
950// MARK - Batch Norm Layer
951 
952typedef struct {
953	ccv_cnnp_model_t super;
954	ccv_nnc_tensor_symbol_t output;
955	ccv_nnc_tensor_symbol_t bias;
956	ccv_nnc_tensor_symbol_t scale;
957	ccv_nnc_graph_exec_symbol_t batch_norm;
958	ccv_nnc_cmd_param_t params;
959	ccv_array_t* zero_inits;
960	ccv_array_t* retainables;
961} ccv_cnnp_model_batch_norm_t;
962 
963static void _ccv_cnnp_batch_norm_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
964{
965	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 965, __extension__ __PRETTY_FUNCTION__); }));
966	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 966, __extension__ __PRETTY_FUNCTION__
); }));
967	ccv_cnnp_model_batch_norm_t* const self = (ccv_cnnp_model_batch_norm_t*)super;
968	PRINT(CCV_CLI_VERBOSE, "[cnnp_batch_norm_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_batch_norm_build] -\n"); fflush(stdout); } }
 while (0);
969	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
970	const int nd = ccv_nnc_tensor_nd(params.dim);
971	ccv_nnc_tensor_param_t bias_params = params;
972	memset(bias_params.dim, 0, sizeof(bias_params.dim));
973	// If the accuracy is not enough, bump it to 32-bit floating point.
974	if (bias_params.datatype != CCV_32F && bias_params.datatype != CCV_64F)
975		bias_params.datatype = CCV_32F;
976	bias_params.dim[0] = nd > 1 ? ccv_nnc_tensor_get_c(params) : params.dim[0];
977	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, params, 0);
978	// Both scale and bias are shared between if this model is reused.
979	if (!self->scale.graph)
980		self->scale = ccv_nnc_tensor_symbol_new(graph, bias_params, "scale");
981	if (!self->bias.graph)
982		self->bias = ccv_nnc_tensor_symbol_new(graph, bias_params, "bias");
983	const ccv_nnc_tensor_symbol_t mean = ccv_nnc_tensor_symbol_new(graph, bias_params, "mean");
984	const ccv_nnc_tensor_symbol_t var = ccv_nnc_tensor_symbol_new(graph, bias_params, "var");
985	// Otherwise, notice mean, var, saved_mean, saved_inv_std are not reused.
986	if (!self->zero_inits)
987		self->zero_inits = ccv_array_new(sizeof(ccv_nnc_tensor_symbol_t), 0, 0);
988	ccv_array_push(self->zero_inits, &mean);
989	ccv_array_push(self->zero_inits, &var);
990	const ccv_nnc_tensor_symbol_t out_mean = ccv_nnc_tensor_symbol_new(graph, bias_params, "out_mean");
991	const ccv_nnc_tensor_symbol_t out_var = ccv_nnc_tensor_symbol_new(graph, bias_params, "out_var");
992	if (!self->retainables)
993		self->retainables = ccv_array_new(sizeof(ccv_nnc_tensor_symbol_t), 0, 0);
994	ccv_array_push(self->retainables, &out_mean);
995	ccv_array_push(self->retainables, &out_var);
996	const ccv_nnc_tensor_symbol_t saved_mean = ccv_nnc_tensor_symbol_new(graph, bias_params, "saved_mean");
997	const ccv_nnc_tensor_symbol_t saved_inv_std = ccv_nnc_tensor_symbol_new(graph, bias_params, "saved_inv_std");
998	const int hw = ccv_nnc_tensor_hw(params, ccv_nnc_tensor_nd(params.dim), CCV_NNC_MAX_DIM(2));
999	ccv_nnc_cmd_param_t batch_norm = self->params;
1000	batch_norm.bnorm.count = hw >= 0 ? CCV_NNC_MAX_DIM(2) + 1 : 1;
1001	int i;
1002	batch_norm.bnorm.axis[0] = (params.format == CCV_TENSOR_FORMAT_CHWN) ? 3 : 0;
1003	if (hw >= 0)
1004		for (i = 0; i < CCV_NNC_MAX_DIM(2); i++)
1005			batch_norm.bnorm.axis[i + 1] = i + hw;
1006	self->params = batch_norm;
1007	self->batch_norm = ccv_nnc_graph_exec_symbol_new(graph, ccv_nnc_cmd(CCV_NNC_BATCH_NORM_FORWARD, 0, batch_norm, 0), TENSOR_SYMBOL_LIST(inputs[0], self->scale, self->bias, mean, var)(const ccv_nnc_tensor_symbol_t []){inputs[0], self->scale,
 self->bias, mean, var}, (1 +1 +1 +1 +1 +1 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output, out_mean, out_var, saved_mean, saved_inv_std)(const ccv_nnc_tensor_symbol_t []){output, out_mean, out_var,
 saved_mean, saved_inv_std}, (1 +1 +1 +1 +1 +1 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "batch_norm");
1008	outputs[0] = output;
1009}
1010 
1011static void _ccv_cnnp_batch_norm_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
1012{
1013	ccv_cnnp_model_batch_norm_t* const self = (ccv_cnnp_model_batch_norm_t*)super;
1014	if (self->scale.graph)
1015		initializer(context, CMD_RANDOM_UNIFORM_FORWARD(0, 1)ccv_nnc_cmd(CCV_NNC_RANDOM_UNIFORM_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={0, 1}}}, 0), ccv_nnc_no_hint, 0, 0, self->scale);
1016	if (self->bias.graph)
1017		initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, self->bias);
1018	int i;
1019	if (self->zero_inits)
1020		for (i = 0; i < self->zero_inits->rnum; i++)
1021			initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, *(ccv_nnc_tensor_symbol_t*)ccv_array_get(self->zero_inits, i)((void*)(((char*)((self->zero_inits)->data)) + (size_t)
(self->zero_inits)->rsize * (size_t)(i))));
1022}
1023 
1024static void _ccv_cnnp_batch_norm_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
1025{
1026	ccv_cnnp_model_batch_norm_t* const self = (ccv_cnnp_model_batch_norm_t*)super;
1027	if (self->scale.graph)
1028		add_to_array(parameters, self->scale, is_trainable);
1029	if (self->bias.graph)
1030		add_to_array(parameters, self->bias, is_trainable);
1031}
1032 
1033static void _ccv_cnnp_batch_norm_add_to_output(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const outputs)
1034{
1035	ccv_cnnp_model_batch_norm_t* const self = (ccv_cnnp_model_batch_norm_t*)super;
1036	int i;
1037	if (self->retainables)
1038		for (i = 0; i < self->retainables->rnum; i++)
1039		{
1040			const ccv_nnc_tensor_symbol_t symbol = *(ccv_nnc_tensor_symbol_t*)ccv_array_get(self->retainables, i)((void*)(((char*)((self->retainables)->data)) + (size_t
)(self->retainables)->rsize * (size_t)(i)));
1041			add_to_array(outputs, symbol, 0);
1042		}
1043}
1044 
1045static void _ccv_cnnp_batch_norm_set_is_test(ccv_cnnp_model_t* const super, const int is_test, const ccv_cnnp_cmd_updater_f updater, void* const context)
1046{
1047	ccv_cnnp_model_batch_norm_t* const self = (ccv_cnnp_model_batch_norm_t*)super;
1048	if (self->batch_norm.graph)
1049	{
1050		self->params.bnorm.is_test = is_test;
1051		updater(context, self->batch_norm, ccv_nnc_cmd(CCV_NNC_BATCH_NORM_FORWARD, 0, self->params, 0), ccv_nnc_no_hint);
1052	}
1053}
1054 
1055static void _ccv_cnnp_batch_norm_deinit(ccv_cnnp_model_t* const super)
1056{
1057	ccv_cnnp_model_batch_norm_t* const self = (ccv_cnnp_model_batch_norm_t*)super;
1058	if (self->zero_inits)
1059		ccv_array_free(self->zero_inits);
1060	if (self->retainables)
1061		ccv_array_free(self->retainables);
1062}
1063 
1064static ccv_cnnp_model_t* _ccv_cnnp_batch_norm_copy(const ccv_cnnp_model_t* const super, void* const context);
1065 
1066static const ccv_cnnp_model_vtab_t ccv_cnnp_batch_norm_isa = {
1067	.build = _ccv_cnnp_batch_norm_build,
1068	.init_states = _ccv_cnnp_batch_norm_init_states,
1069	.add_to_parameter = _ccv_cnnp_batch_norm_add_to_parameter,
1070	.add_to_output = _ccv_cnnp_batch_norm_add_to_output,
1071	.copy = _ccv_cnnp_batch_norm_copy,
1072	.set_is_test = _ccv_cnnp_batch_norm_set_is_test,
1073	.deinit = _ccv_cnnp_batch_norm_deinit,
1074};
1075 
1076ccv_cnnp_model_t* ccv_cnnp_batch_norm(const float momentum, const float epsilon, const int is_trainable, const char* const name)
1077{
1078	ccv_cnnp_model_batch_norm_t* const model_batch_norm = (ccv_cnnp_model_batch_norm_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_batch_norm_t));
1079	model_batch_norm->super.isa = &ccv_cnnp_batch_norm_isa;
1080	model_batch_norm->super.input_size = 1;
1081	model_batch_norm->super.outputs = &model_batch_norm->output;
1082	model_batch_norm->super.output_size = 1;
1083	model_batch_norm->super.is_trainable = is_trainable;
1084	ccv_cnnp_model_copy_name(&model_batch_norm->super, name);
1085	model_batch_norm->scale.d = CCV_NNC_NO_TENSOR_SYMBOL;
1086	model_batch_norm->scale.graph = 0;
1087	model_batch_norm->bias.d = CCV_NNC_NO_TENSOR_SYMBOL;
1088	model_batch_norm->bias.graph = 0;
1089	model_batch_norm->params.bnorm.momentum = momentum;
1090	model_batch_norm->params.bnorm.epsilon = epsilon;
1091	return (ccv_cnnp_model_t*)model_batch_norm;
1092}
1093 
1094static ccv_cnnp_model_t* _ccv_cnnp_batch_norm_copy(const ccv_cnnp_model_t* const super, void* const context)
1095{
1096	const ccv_cnnp_model_batch_norm_t* const self = (const ccv_cnnp_model_batch_norm_t*)super;
1097	return ccv_cnnp_batch_norm(self->params.bnorm.momentum, self->params.bnorm.epsilon, self->super.is_trainable, self->super.name);
1098}
1099 
1100// MARK - Convolution Layer
1101 
1102typedef struct {
1103	ccv_cnnp_model_t super;
1104	ccv_nnc_tensor_symbol_t output;
1105	ccv_nnc_tensor_symbol_t weights;
1106	ccv_nnc_tensor_symbol_t bias;
1107	int groups;
1108	int filters;
1109	int kdim[CCV_NNC_MAX_DIM_ALLOC(12)];
1110	int dilation[CCV_NNC_MAX_DIM_ALLOC(12)];
1111	int no_bias;
1112	int format;
1113	ccv_nnc_hint_t hint;
1114} ccv_cnnp_model_convolution_t;
1115 
1116static void _ccv_cnnp_convolution_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1117{
1118	ccv_cnnp_model_convolution_t* const self = (ccv_cnnp_model_convolution_t*)super;
1119	PRINT(CCV_CLI_VERBOSE, "[cnnp_convolution_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_convolution_build] -\n"); fflush(stdout); } }
 while (0);
1120	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1120, __extension__ __PRETTY_FUNCTION__); }));
1121	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1121, __extension__ __PRETTY_FUNCTION__
); }));
1122	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1123	int i;
1124	const int k_nd = ccv_nnc_tensor_nd(self->kdim);
1125	const int nd = k_nd + 2;
1126	ccv_nnc_tensor_param_t weights_params = params;
1127	if (self->format)
1128		weights_params.format = self->format;
1129	ccv_nnc_tensor_set_n(&weights_params, self->filters);
1130	const int a_nd = ccv_nnc_tensor_nd(params.dim);
1131	int c;
1132	switch (params.format)
1133	{
1134		case CCV_TENSOR_FORMAT_NHWC:
1135			c = params.dim[a_nd - 1];
1136			break;
1137		case CCV_TENSOR_FORMAT_NCHW:
1138			if (a_nd == k_nd + 1)
1139				c = params.dim[0];
1140			else
1141				c = params.dim[a_nd <= 1 ? 0 : 1];
1142			break;
1143		case CCV_TENSOR_FORMAT_CHWN:
1144			c = params.dim[0];
1145			break;
1146	}
1147	assert(c % self->groups == 0)((void) sizeof ((c % self->groups == 0) ? 1 : 0), __extension__
 ({ if (c % self->groups == 0) ; else __assert_fail ("c % self->groups == 0"
, "ccv_cnnp_model_addons.c", 1147, __extension__ __PRETTY_FUNCTION__
); }));
1148	ccv_nnc_tensor_set_c(&weights_params, nd, c / self->groups);
1149	int hw = -1;
1150	if (weights_params.format == CCV_TENSOR_FORMAT_NHWC || weights_params.format == CCV_TENSOR_FORMAT_CHWN)
1151		hw = 1;
1152	else if (weights_params.format == CCV_TENSOR_FORMAT_NCHW)
1153		hw = 2;
1154	assert(hw >= 0)((void) sizeof ((hw >= 0) ? 1 : 0), __extension__ ({ if (hw
 >= 0) ; else __assert_fail ("hw >= 0", "ccv_cnnp_model_addons.c"
, 1154, __extension__ __PRETTY_FUNCTION__); }));
1155	for (i = 0; i < k_nd; i++)
1156		weights_params.dim[i + hw] = self->kdim[i];
1157	if (!self->weights.graph)
1158		self->weights = ccv_nnc_tensor_symbol_new(graph, weights_params, "weights");
1159	assert(self->weights.graph == graph)((void) sizeof ((self->weights.graph == graph) ? 1 : 0), __extension__
 ({ if (self->weights.graph == graph) ; else __assert_fail
 ("self->weights.graph == graph", "ccv_cnnp_model_addons.c"
, 1159, __extension__ __PRETTY_FUNCTION__); }));
1160	ccv_nnc_tensor_param_t bias_params = params;
1161	if (self->format)
1162		bias_params.format = self->format;
1163	memset(bias_params.dim, 0, sizeof(bias_params.dim));
1164	bias_params.dim[0] = self->filters;
1165	ccv_nnc_cmd_t cmd = CMD_CONVOLUTION_FORWARD(self->groups, self->filters)ccv_nnc_cmd(CCV_NNC_CONVOLUTION_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={}},.convolution={.count=self->filters,.groups
=self->groups}}), 0);
1166	for (i = 0; i < k_nd; i++)
1167		cmd.info.size.dim[i] = self->kdim[i];
1168	cmd.info.size.dim[k_nd] = c;
1169	memcpy(cmd.info.convolution.dilation, self->dilation, sizeof(self->dilation));
1170	ccv_nnc_tensor_param_t output_params;
1171	// Dilate weight size based on the dilation factor.
1172	for (i = 0; i < k_nd; i++)
1173		weights_params.dim[i + hw] = (self->kdim[i] - 1) * ccv_max(self->dilation[i], 1)({ typeof (self->dilation[i]) _a = (self->dilation[i]);
 typeof (1) _b = (1); (_a > _b) ? _a : _b; }) + 1;
1174	ccv_nnc_hint_tensor_auto(cmd, (ccv_nnc_tensor_param_t []){
1175			params,
1176			weights_params,
1177			bias_params,
1178		}, 3, self->hint, &output_params, 1);
1179	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1180	ccv_nnc_graph_exec_symbol_t convolution;
1181	if (self->no_bias)
1182		convolution = ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0], self->weights)(const ccv_nnc_tensor_symbol_t []){inputs[0], self->weights
}, (1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "convolution");
1183	else {
1184		if (!self->bias.graph)
1185			self->bias = ccv_nnc_tensor_symbol_new(graph, bias_params, "bias");
1186		convolution = ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0], self->weights, self->bias)(const ccv_nnc_tensor_symbol_t []){inputs[0], self->weights
, self->bias}, (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "convolution");
1187	}
1188	ccv_nnc_graph_exec_symbol_set_hint(graph, convolution, self->hint);
1189	outputs[0] = output;
1190}
1191 
1192static void _ccv_cnnp_convolution_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
1193{
1194	ccv_cnnp_model_convolution_t* const self = (ccv_cnnp_model_convolution_t*)super;
1195	const ccv_nnc_tensor_param_t weight_params = ccv_nnc_tensor_symbol_params(graph, self->weights);
1196	const int n = ccv_max(ccv_nnc_tensor_get_n(weight_params), 1)({ typeof (ccv_nnc_tensor_get_n(weight_params)) _a = (ccv_nnc_tensor_get_n
(weight_params)); typeof (1) _b = (1); (_a > _b) ? _a : _b
; });
1197	const int count = ccv_nnc_tensor_count(weight_params);
1198	const float std = sqrtf(2) / sqrtf(count / n);
1199	const float bound = sqrtf(3) * std;
1200	initializer(context, CMD_RANDOM_UNIFORM_FORWARD(-bound, bound)ccv_nnc_cmd(CCV_NNC_RANDOM_UNIFORM_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={-bound, bound}}}, 0), ccv_nnc_no_hint, 0, 0, self->weights);
1201	if (self->bias.graph)
1202		initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, self->bias);
1203}
1204 
1205static void _ccv_cnnp_convolution_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
1206{
1207	ccv_cnnp_model_convolution_t* const self = (ccv_cnnp_model_convolution_t*)super;
1208	add_to_array(parameters, self->weights, is_trainable);
1209	if (self->bias.graph)
1210		add_to_array(parameters, self->bias, is_trainable);
1211}
1212 
1213static ccv_cnnp_model_t* _ccv_cnnp_convolution_copy(const ccv_cnnp_model_t* const super, void* const context);
1214 
1215static const ccv_cnnp_model_vtab_t ccv_cnnp_convolution_isa = {
1216	.build = _ccv_cnnp_convolution_build,
1217	.init_states = _ccv_cnnp_convolution_init_states,
1218	.add_to_parameter = _ccv_cnnp_convolution_add_to_parameter,
1219	.copy = _ccv_cnnp_convolution_copy,
1220};
1221 
1222ccv_cnnp_model_t* ccv_cnnp_convolution(const int groups, const int filters, const int kdim[CCV_NNC_MAX_DIM_ALLOC(12)], const int dilation[CCV_NNC_MAX_DIM_ALLOC(12)], const int no_bias, ccv_nnc_hint_t hint, const int format, const int is_trainable, const char* const name)
1223{
1224	ccv_cnnp_model_convolution_t* const model_convolution = (ccv_cnnp_model_convolution_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_convolution_t));
1225	model_convolution->super.isa = &ccv_cnnp_convolution_isa;
1226	model_convolution->super.input_size = 1;
1227	model_convolution->super.outputs = &model_convolution->output;
1228	model_convolution->super.output_size = 1;
1229	model_convolution->super.is_trainable = is_trainable;
1230	ccv_cnnp_model_copy_name(&model_convolution->super, name);
1231	model_convolution->weights.d = CCV_NNC_NO_TENSOR_SYMBOL;
1232	model_convolution->weights.graph = 0;
1233	model_convolution->bias.d = CCV_NNC_NO_TENSOR_SYMBOL;
1234	model_convolution->bias.graph = 0;
1235	model_convolution->groups = groups;
1236	model_convolution->filters = filters;
1237	memcpy(model_convolution->kdim, kdim, sizeof(model_convolution->kdim));
1238	memcpy(model_convolution->dilation, dilation, sizeof(model_convolution->dilation));
1239	model_convolution->no_bias = no_bias;
1240	model_convolution->hint = hint;
1241	model_convolution->format = format;
1242	return (ccv_cnnp_model_t*)model_convolution;
1243}
1244 
1245static ccv_cnnp_model_t* _ccv_cnnp_convolution_copy(const ccv_cnnp_model_t* const super, void* const context)
1246{
1247	ccv_cnnp_model_convolution_t* const self = (ccv_cnnp_model_convolution_t*)super;
1248	return ccv_cnnp_convolution(self->groups, self->filters, self->kdim, self->dilation, self->no_bias, self->hint, self->format, self->super.is_trainable, self->super.name);
1249}
1250 
1251// MARK - Convolution Transpose Layer
1252 
1253typedef struct {
1254	ccv_cnnp_model_t super;
1255	ccv_nnc_tensor_symbol_t output;
1256	ccv_nnc_tensor_symbol_t weights;
1257	ccv_nnc_tensor_symbol_t bias;
1258	int groups;
1259	int filters;
1260	int kdim[CCV_NNC_MAX_DIM_ALLOC(12)];
1261	int dilation[CCV_NNC_MAX_DIM_ALLOC(12)];
1262	int output_padding;
1263	int no_bias;
1264	int format;
1265	ccv_nnc_hint_t hint;
1266} ccv_cnnp_model_convolution_transpose_t;
1267 
1268static void _ccv_cnnp_convolution_transpose_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1269{
1270	ccv_cnnp_model_convolution_transpose_t* const self = (ccv_cnnp_model_convolution_transpose_t*)super;
1271	PRINT(CCV_CLI_VERBOSE, "[cnnp_convolution_transpose_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_convolution_transpose_build] -\n"); fflush(stdout
); } } while (0);
1272	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1272, __extension__ __PRETTY_FUNCTION__); }));
1273	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1273, __extension__ __PRETTY_FUNCTION__
); }));
1274	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1275	int i;
1276	const int nd = CCV_NNC_MAX_DIM(2) + 2;
1277	ccv_nnc_tensor_param_t weights_params = params;
1278	if (self->format)
1279		weights_params.format = self->format;
1280	const int c = ccv_nnc_tensor_get_c(params);
1281	ccv_nnc_tensor_set_n(&weights_params, c);
1282	assert(c % self->groups == 0)((void) sizeof ((c % self->groups == 0) ? 1 : 0), __extension__
 ({ if (c % self->groups == 0) ; else __assert_fail ("c % self->groups == 0"
, "ccv_cnnp_model_addons.c", 1282, __extension__ __PRETTY_FUNCTION__
); }));
1283	ccv_nnc_tensor_set_c(&weights_params, nd, self->filters / self->groups);
1284	const int hw = ccv_nnc_tensor_hw(weights_params, nd, CCV_NNC_MAX_DIM(2));
1285	assert(hw >= 0)((void) sizeof ((hw >= 0) ? 1 : 0), __extension__ ({ if (hw
 >= 0) ; else __assert_fail ("hw >= 0", "ccv_cnnp_model_addons.c"
, 1285, __extension__ __PRETTY_FUNCTION__); }));
1286	for (i = 0; i < CCV_NNC_MAX_DIM(2); i++)
1287		weights_params.dim[i + hw] = self->kdim[i];
1288	if (!self->weights.graph)
1289		self->weights = ccv_nnc_tensor_symbol_new(graph, weights_params, "weights");
1290	assert(self->weights.graph == graph)((void) sizeof ((self->weights.graph == graph) ? 1 : 0), __extension__
 ({ if (self->weights.graph == graph) ; else __assert_fail
 ("self->weights.graph == graph", "ccv_cnnp_model_addons.c"
, 1290, __extension__ __PRETTY_FUNCTION__); }));
1291	ccv_nnc_tensor_param_t bias_params = params;
1292	if (self->format)
1293		bias_params.format = self->format;
1294	memset(bias_params.dim, 0, sizeof(bias_params.dim));
1295	bias_params.dim[0] = self->filters;
1296	ccv_nnc_cmd_t cmd = CMD_CONVOLUTION_TRANSPOSE_FORWARD(self->groups, self->filters, self->output_padding)ccv_nnc_cmd(CCV_NNC_CONVOLUTION_TRANSPOSE_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={}},.convolution_transpose={.count=self->filters
,.groups=self->groups,.output_padding=self->output_padding
}}), 0);
1297	for (i = 0; i < CCV_NNC_MAX_DIM(2); i++)
1298		cmd.info.size.dim[i] = self->kdim[i];
1299	cmd.info.size.dim[CCV_NNC_MAX_DIM(2)] = c;
1300	memcpy(cmd.info.convolution_transpose.dilation, self->dilation, sizeof(self->dilation));
1301	ccv_nnc_tensor_param_t output_params;
1302	// Dilate weight size based on the dilation factor.
1303	for (i = 0; i < CCV_NNC_MAX_DIM(2); i++)
1304		weights_params.dim[i + hw] = (self->kdim[i] - 1) * ccv_max(self->dilation[i], 1)({ typeof (self->dilation[i]) _a = (self->dilation[i]);
 typeof (1) _b = (1); (_a > _b) ? _a : _b; }) + 1;
1305	ccv_nnc_hint_tensor_auto(cmd, (ccv_nnc_tensor_param_t []){
1306			params,
1307			weights_params,
1308			bias_params,
1309		}, 3, self->hint, &output_params, 1);
1310	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1311	ccv_nnc_graph_exec_symbol_t convolution_transpose;
1312	if (self->no_bias)
1313		convolution_transpose = ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0], self->weights)(const ccv_nnc_tensor_symbol_t []){inputs[0], self->weights
}, (1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "convolution_transpose");
1314	else {
1315		if (!self->bias.graph)
1316			self->bias = ccv_nnc_tensor_symbol_new(graph, bias_params, "bias");
1317		convolution_transpose = ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0], self->weights, self->bias)(const ccv_nnc_tensor_symbol_t []){inputs[0], self->weights
, self->bias}, (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "convolution_transpose");
1318	}
1319	ccv_nnc_graph_exec_symbol_set_hint(graph, convolution_transpose, self->hint);
1320	outputs[0] = output;
1321}
1322 
1323static void _ccv_cnnp_convolution_transpose_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
1324{
1325	ccv_cnnp_model_convolution_transpose_t* const self = (ccv_cnnp_model_convolution_transpose_t*)super;
1326	const ccv_nnc_tensor_param_t weight_params = ccv_nnc_tensor_symbol_params(graph, self->weights);
1327	const int n = ccv_max(ccv_nnc_tensor_get_n(weight_params), 1)({ typeof (ccv_nnc_tensor_get_n(weight_params)) _a = (ccv_nnc_tensor_get_n
(weight_params)); typeof (1) _b = (1); (_a > _b) ? _a : _b
; });
1328	const int count = ccv_nnc_tensor_count(weight_params);
1329	const float std = sqrtf(2) / sqrtf(count / n);
1330	const float bound = sqrtf(3) * std;
1331	initializer(context, CMD_RANDOM_UNIFORM_FORWARD(-bound, bound)ccv_nnc_cmd(CCV_NNC_RANDOM_UNIFORM_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={-bound, bound}}}, 0), ccv_nnc_no_hint, 0, 0, self->weights);
1332	if (self->bias.graph)
1333		initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, self->bias);
1334}
1335 
1336static void _ccv_cnnp_convolution_transpose_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
1337{
1338	ccv_cnnp_model_convolution_transpose_t* const self = (ccv_cnnp_model_convolution_transpose_t*)super;
1339	add_to_array(parameters, self->weights, is_trainable);
1340	if (self->bias.graph)
1341		add_to_array(parameters, self->bias, is_trainable);
1342}
1343 
1344static ccv_cnnp_model_t* _ccv_cnnp_convolution_transpose_copy(const ccv_cnnp_model_t* const super, void* const context);
1345 
1346static const ccv_cnnp_model_vtab_t ccv_cnnp_convolution_transpose_isa = {
1347	.build = _ccv_cnnp_convolution_transpose_build,
1348	.init_states = _ccv_cnnp_convolution_transpose_init_states,
1349	.add_to_parameter = _ccv_cnnp_convolution_transpose_add_to_parameter,
1350	.copy = _ccv_cnnp_convolution_transpose_copy,
1351};
1352 
1353ccv_cnnp_model_t* ccv_cnnp_convolution_transpose(const int groups, const int filters, const int kdim[CCV_NNC_MAX_DIM_ALLOC(12)], const int dilation[CCV_NNC_MAX_DIM_ALLOC(12)], const int output_padding, const int no_bias, ccv_nnc_hint_t hint, const int format, const int is_trainable, const char* const name)
1354{
1355	ccv_cnnp_model_convolution_transpose_t* const model_convolution_transpose = (ccv_cnnp_model_convolution_transpose_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_convolution_transpose_t));
1356	model_convolution_transpose->super.isa = &ccv_cnnp_convolution_transpose_isa;
1357	model_convolution_transpose->super.input_size = 1;
1358	model_convolution_transpose->super.outputs = &model_convolution_transpose->output;
1359	model_convolution_transpose->super.output_size = 1;
1360	model_convolution_transpose->super.is_trainable = is_trainable;
1361	ccv_cnnp_model_copy_name(&model_convolution_transpose->super, name);
1362	model_convolution_transpose->weights.d = CCV_NNC_NO_TENSOR_SYMBOL;
1363	model_convolution_transpose->weights.graph = 0;
1364	model_convolution_transpose->bias.d = CCV_NNC_NO_TENSOR_SYMBOL;
1365	model_convolution_transpose->bias.graph = 0;
1366	model_convolution_transpose->groups = groups;
1367	model_convolution_transpose->filters = filters;
1368	memcpy(model_convolution_transpose->kdim, kdim, sizeof(model_convolution_transpose->kdim));
1369	memcpy(model_convolution_transpose->dilation, dilation, sizeof(model_convolution_transpose->dilation));
1370	model_convolution_transpose->output_padding = output_padding;
1371	model_convolution_transpose->no_bias = no_bias;
1372	model_convolution_transpose->hint = hint;
1373	model_convolution_transpose->format = format;
1374	return (ccv_cnnp_model_t*)model_convolution_transpose;
1375}
1376 
1377static ccv_cnnp_model_t* _ccv_cnnp_convolution_transpose_copy(const ccv_cnnp_model_t* const super, void* const context)
1378{
1379	ccv_cnnp_model_convolution_transpose_t* const self = (ccv_cnnp_model_convolution_transpose_t*)super;
1380	return ccv_cnnp_convolution_transpose(self->groups, self->filters, self->kdim, self->dilation, self->output_padding, self->no_bias, self->hint, self->format, self->super.is_trainable, self->super.name);
1381}
1382 
1383// MARK - Dense Layer
1384 
1385typedef struct {
1386	ccv_cnnp_model_t super;
1387	ccv_nnc_tensor_symbol_t output;
1388	ccv_nnc_tensor_symbol_t weights;
1389	ccv_nnc_tensor_symbol_t bias;
1390	int count;
1391	int no_bias;
1392	int flags;
1393} ccv_cnnp_model_dense_t;
1394 
1395static void _ccv_cnnp_dense_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1396{
1397	ccv_cnnp_model_dense_t* const self = (ccv_cnnp_model_dense_t*)super;
1398	PRINT(CCV_CLI_VERBOSE, "[cnnp_dense_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_dense_build] -\n"); fflush(stdout); } } while
 (0);
1399	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1399, __extension__ __PRETTY_FUNCTION__); }));
1400	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1400, __extension__ __PRETTY_FUNCTION__
); }));
1401	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1402	ccv_nnc_tensor_param_t weights_params = params;
1403	memset(weights_params.dim, 0, sizeof(weights_params.dim));
1404	weights_params.dim[0] = self->count;
1405	weights_params.dim[1] = params.dim[ccv_nnc_tensor_nd(params.dim) - 1];
1406	if (!self->weights.graph)
1407		self->weights = ccv_nnc_tensor_symbol_new(graph, weights_params, "weights");
1408	assert(self->weights.graph == graph)((void) sizeof ((self->weights.graph == graph) ? 1 : 0), __extension__
 ({ if (self->weights.graph == graph) ; else __assert_fail
 ("self->weights.graph == graph", "ccv_cnnp_model_addons.c"
, 1408, __extension__ __PRETTY_FUNCTION__); }));
1409	const ccv_nnc_tensor_symbol_t weights = ccv_cnnp_model_get_symbol(super, self->weights);
1410	ccv_nnc_tensor_param_t bias_params = params;
1411	memset(bias_params.dim, 0, sizeof(bias_params.dim));
1412	bias_params.dim[0] = self->count;
1413	ccv_nnc_cmd_t cmd = {0};
1414	cmd.cmd = CCV_NNC_GEMM_FORWARD;
1415	cmd.info.blas.a[0] = 1;
1416	cmd.info.blas.a[1] = 1;
1417	cmd.info.blas.transpose_b[0] = 0;
1418	cmd.info.blas.transpose_b[1] = 1;
1419	cmd.info.blas.flags = self->flags;
1420	ccv_nnc_tensor_param_t output_params;
1421	ccv_nnc_hint_tensor_auto(cmd, (ccv_nnc_tensor_param_t []){
1422			params,
1423			weights_params,
1424			bias_params,
1425		}, 3, ccv_nnc_no_hint, &output_params, 1);
1426	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1427	if (self->no_bias)
1428		ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0], weights)(const ccv_nnc_tensor_symbol_t []){inputs[0], weights}, (1 +1
 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "dense");
1429	else {
1430		if (!self->bias.graph)
1431			self->bias = ccv_nnc_tensor_symbol_new(graph, bias_params, "bias");
1432		const ccv_nnc_tensor_symbol_t bias = ccv_cnnp_model_get_symbol(super, self->bias);
1433		ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0], weights, bias)(const ccv_nnc_tensor_symbol_t []){inputs[0], weights, bias},
 (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "dense");
1434	}
1435	outputs[0] = output;
1436}
1437 
1438static void _ccv_cnnp_dense_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
1439{
1440	ccv_cnnp_model_dense_t* const self = (ccv_cnnp_model_dense_t*)super;
1441	const ccv_nnc_tensor_param_t weight_params = ccv_nnc_tensor_symbol_params(graph, self->weights);
1442	const int c = weight_params.dim[1];
1443	const float std = sqrtf(2) / sqrtf(c);
1444	const float bound = sqrtf(3) * std;
1445	initializer(context, CMD_RANDOM_UNIFORM_FORWARD(-bound, bound)ccv_nnc_cmd(CCV_NNC_RANDOM_UNIFORM_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={-bound, bound}}}, 0), ccv_nnc_no_hint, 0, 0, self->weights);
1446	if (self->bias.graph)
1447		initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, self->bias);
1448}
1449 
1450static void _ccv_cnnp_dense_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
1451{
1452	ccv_cnnp_model_dense_t* const self = (ccv_cnnp_model_dense_t*)super;
1453	add_to_array(parameters, self->weights, is_trainable);
1454	if (self->bias.graph)
1455		add_to_array(parameters, self->bias, is_trainable);
1456}
1457 
1458static ccv_cnnp_model_t* _ccv_cnnp_dense_copy(const ccv_cnnp_model_t* const super, void* const context);
1459 
1460static const ccv_cnnp_model_vtab_t ccv_cnnp_dense_isa = {
1461	.build = _ccv_cnnp_dense_build,
1462	.init_states = _ccv_cnnp_dense_init_states,
1463	.add_to_parameter = _ccv_cnnp_dense_add_to_parameter,
1464	.copy = _ccv_cnnp_dense_copy,
1465};
1466 
1467ccv_cnnp_model_t* ccv_cnnp_dense(const int count, const int no_bias, const int flags, const int is_trainable, const char* const name)
1468{
1469	ccv_cnnp_model_dense_t* const model_dense = (ccv_cnnp_model_dense_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_dense_t));
1470	model_dense->super.isa = &ccv_cnnp_dense_isa;
1471	model_dense->super.input_size = 1;
1472	model_dense->super.outputs = &model_dense->output;
1473	model_dense->super.output_size = 1;
1474	model_dense->super.is_trainable = is_trainable;
1475	ccv_cnnp_model_copy_name(&model_dense->super, name);
1476	model_dense->weights.d = CCV_NNC_NO_TENSOR_SYMBOL;
1477	model_dense->weights.graph = 0;
1478	model_dense->bias.d = CCV_NNC_NO_TENSOR_SYMBOL;
1479	model_dense->bias.graph = 0;
1480	model_dense->count = count;
1481	model_dense->no_bias = no_bias;
1482	model_dense->flags = flags;
1483	return (ccv_cnnp_model_t*)model_dense;
1484}
1485 
1486static ccv_cnnp_model_t* _ccv_cnnp_dense_copy(const ccv_cnnp_model_t* const super, void* const context)
1487{
1488	const ccv_cnnp_model_dense_t* const self = (const ccv_cnnp_model_dense_t*)super;
1489	return ccv_cnnp_dense(self->count, self->no_bias, self->flags, self->super.is_trainable, self->super.name);
1490}
1491 
1492// MARK - Pool Layers
1493 
1494typedef struct {
1495	ccv_cnnp_model_t super;
1496	ccv_nnc_tensor_symbol_t output;
1497	int kdim[CCV_NNC_MAX_DIM_ALLOC(12)];
1498	ccv_nnc_hint_t hint;
1499} ccv_cnnp_model_pool_t;
1500 
1501static void _ccv_cnnp_max_pool_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1502{
1503	ccv_cnnp_model_pool_t* const self = (ccv_cnnp_model_pool_t*)super;
1504	PRINT(CCV_CLI_VERBOSE, "[cnnp_max_pool_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_max_pool_build] -\n"); fflush(stdout); } } while
 (0);
1505	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1505, __extension__ __PRETTY_FUNCTION__); }));
1506	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1506, __extension__ __PRETTY_FUNCTION__
); }));
1507	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1508	const int hw = ccv_nnc_tensor_hw(params, ccv_nnc_tensor_nd(params.dim), CCV_NNC_MAX_DIM(2));
1509	ccv_nnc_cmd_t cmd;
1510	if (hw >= 0 && self->kdim[0] == 0 && self->kdim[1] == 0)
1511		cmd = CMD_MAX_POOL_FORWARD(params.dim[hw], params.dim[hw + 1])ccv_nnc_cmd(CCV_NNC_MAX_POOL_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={params.dim[hw], params.dim[hw + 1],1}}}), 0);
1512	else
1513		cmd = CMD_MAX_POOL_FORWARD(self->kdim[0], self->kdim[1])ccv_nnc_cmd(CCV_NNC_MAX_POOL_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={self->kdim[0], self->kdim[1],1}}}), 0);
1514	ccv_nnc_tensor_param_t output_params;
1515	ccv_nnc_hint_tensor_auto(cmd, &params, 1, self->hint, &output_params, 1);
1516	const ccv_nnc_tensor_symbol_t pool_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1517	const ccv_nnc_graph_exec_symbol_t exec = ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(pool_output)(const ccv_nnc_tensor_symbol_t []){pool_output}, (1 +1 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "max_pool");
1518	ccv_nnc_graph_exec_symbol_set_hint(graph, exec, self->hint);
1519	outputs[0] = pool_output;
1520}
1521 
1522static ccv_cnnp_model_t* _ccv_cnnp_max_pool_copy(const ccv_cnnp_model_t* const super, void* const context);
1523 
1524static const ccv_cnnp_model_vtab_t ccv_cnnp_max_pool_isa = {
1525	.build = _ccv_cnnp_max_pool_build,
1526	.copy = _ccv_cnnp_max_pool_copy,
1527};
1528 
1529ccv_cnnp_model_t* ccv_cnnp_max_pool(const int kdim[CCV_NNC_MAX_DIM_ALLOC(12)], const ccv_nnc_hint_t hint, const char* const name)
1530{
1531	ccv_cnnp_model_pool_t* const model_pool = (ccv_cnnp_model_pool_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_pool_t));
1532	model_pool->super.isa = &ccv_cnnp_max_pool_isa;
1533	model_pool->super.input_size = 1;
1534	model_pool->super.outputs = &model_pool->output;
1535	model_pool->super.output_size = 1;
1536	ccv_cnnp_model_copy_name(&model_pool->super, name);
1537	memcpy(model_pool->kdim, kdim, sizeof(model_pool->kdim));
1538	model_pool->hint = hint;
1539	return (ccv_cnnp_model_t*)model_pool;
1540}
1541 
1542static ccv_cnnp_model_t* _ccv_cnnp_max_pool_copy(const ccv_cnnp_model_t* const super, void* const context)
1543{
1544	const ccv_cnnp_model_pool_t* const self = (const ccv_cnnp_model_pool_t*)super;
1545	return ccv_cnnp_max_pool(self->kdim, self->hint, self->super.name);
1546}
1547 
1548static void _ccv_cnnp_average_pool_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1549{
1550	ccv_cnnp_model_pool_t* const self = (ccv_cnnp_model_pool_t*)super;
1551	PRINT(CCV_CLI_VERBOSE, "[cnnp_average_pool_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_average_pool_build] -\n"); fflush(stdout); }
 } while (0);
1552	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1552, __extension__ __PRETTY_FUNCTION__); }));
1553	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1553, __extension__ __PRETTY_FUNCTION__
); }));
1554	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1555	const int hw = ccv_nnc_tensor_hw(params, ccv_nnc_tensor_nd(params.dim), CCV_NNC_MAX_DIM(2));
1556	ccv_nnc_cmd_t cmd;
1557	if (hw >= 0 && self->kdim[0] == 0 && self->kdim[1] == 0)
1558		cmd = CMD_AVERAGE_POOL_FORWARD(params.dim[hw], params.dim[hw + 1])ccv_nnc_cmd(CCV_NNC_AVERAGE_POOL_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={params.dim[hw], params.dim[hw + 1],1}}}), 0);
1559	else
1560		cmd = CMD_AVERAGE_POOL_FORWARD(self->kdim[0], self->kdim[1])ccv_nnc_cmd(CCV_NNC_AVERAGE_POOL_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={self->kdim[0], self->kdim[1],1}}}), 0);
1561	ccv_nnc_tensor_param_t output_params;
1562	ccv_nnc_hint_tensor_auto(cmd, &params, 1, self->hint, &output_params, 1);
1563	const ccv_nnc_tensor_symbol_t pool_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1564	const ccv_nnc_graph_exec_symbol_t exec = ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(pool_output)(const ccv_nnc_tensor_symbol_t []){pool_output}, (1 +1 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "average_pool");
1565	ccv_nnc_graph_exec_symbol_set_hint(graph, exec, self->hint);
1566	outputs[0] = pool_output;
1567}
1568 
1569static ccv_cnnp_model_t* _ccv_cnnp_average_pool_copy(const ccv_cnnp_model_t* const super, void* const context);
1570 
1571static const ccv_cnnp_model_vtab_t ccv_cnnp_average_pool_isa = {
1572	.build = _ccv_cnnp_average_pool_build,
1573	.copy = _ccv_cnnp_average_pool_copy,
1574};
1575 
1576ccv_cnnp_model_t* ccv_cnnp_average_pool(const int kdim[CCV_NNC_MAX_DIM_ALLOC(12)], const ccv_nnc_hint_t hint, const char* const name)
1577{
1578	ccv_cnnp_model_pool_t* const model_pool = (ccv_cnnp_model_pool_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_pool_t));
1579	model_pool->super.isa = &ccv_cnnp_average_pool_isa;
1580	model_pool->super.input_size = 1;
1581	model_pool->super.outputs = &model_pool->output;
1582	model_pool->super.output_size = 1;
1583	ccv_cnnp_model_copy_name(&model_pool->super, name);
1584	memcpy(model_pool->kdim, kdim, sizeof(model_pool->kdim));
1585	model_pool->hint = hint;
1586	return (ccv_cnnp_model_t*)model_pool;
1587}
1588 
1589static ccv_cnnp_model_t* _ccv_cnnp_average_pool_copy(const ccv_cnnp_model_t* const super, void* const context)
1590{
1591	const ccv_cnnp_model_pool_t* const self = (const ccv_cnnp_model_pool_t*)super;
1592	return ccv_cnnp_average_pool(self->kdim, self->hint, self->super.name);
1593}
1594 
1595// MARK - RELU Layer
1596 
1597typedef struct {
1598	ccv_cnnp_model_t super;
1599	ccv_nnc_tensor_symbol_t output;
1600} ccv_cnnp_model_relu_t;
1601 
1602static void _ccv_cnnp_relu_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1603{
1604	PRINT(CCV_CLI_VERBOSE, "[cnnp_relu_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_relu_build] -\n"); fflush(stdout); } } while
 (0);
1605	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1605, __extension__ __PRETTY_FUNCTION__); }));
1606	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1606, __extension__ __PRETTY_FUNCTION__
); }));
1607	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1608	ccv_nnc_tensor_param_t output_params;
1609	const ccv_nnc_cmd_t relu = CMD_RELU_FORWARD()ccv_nnc_cmd(CCV_NNC_RELU_FORWARD, 0, ccv_nnc_cmd_auto, 0);
1610	ccv_nnc_hint_tensor_auto(relu, (ccv_nnc_tensor_param_t []){
1611			params,
1612		}, 1, ccv_nnc_no_hint, &output_params, 1);
1613	const ccv_nnc_tensor_symbol_t relu_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1614	ccv_nnc_graph_exec_symbol_new(graph, relu, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(relu_output)(const ccv_nnc_tensor_symbol_t []){relu_output}, (1 +1 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "relu");
1615	outputs[0] = relu_output;
1616}
1617 
1618static ccv_cnnp_model_t* _ccv_cnnp_relu_copy(const ccv_cnnp_model_t* const self, void* const context);
1619 
1620static const ccv_cnnp_model_vtab_t ccv_cnnp_relu_isa = {
1621	.build = _ccv_cnnp_relu_build,
1622	.copy = _ccv_cnnp_relu_copy,
1623};
1624 
1625ccv_cnnp_model_t* ccv_cnnp_relu(const char* const name)
1626{
1627	ccv_cnnp_model_relu_t* const model_relu = (ccv_cnnp_model_relu_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_relu_t));
1628	model_relu->super.isa = &ccv_cnnp_relu_isa;
1629	model_relu->super.input_size = 1;
1630	model_relu->super.outputs = &model_relu->output;
1631	model_relu->super.output_size = 1;
1632	ccv_cnnp_model_copy_name(&model_relu->super, name);
1633	return (ccv_cnnp_model_t*)model_relu;
1634}
1635 
1636static ccv_cnnp_model_t* _ccv_cnnp_relu_copy(const ccv_cnnp_model_t* const self, void* const context)
1637{
1638	return ccv_cnnp_relu(self->name);
1639}
1640 
1641// MARK - Sigmoid Layer
1642 
1643typedef struct {
1644	ccv_cnnp_model_t super;
1645	ccv_nnc_tensor_symbol_t output;
1646} ccv_cnnp_model_sigmoid_t;
1647 
1648static void _ccv_cnnp_sigmoid_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1649{
1650	PRINT(CCV_CLI_VERBOSE, "[cnnp_sigmoid_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_sigmoid_build] -\n"); fflush(stdout); } } while
 (0);
1651	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1651, __extension__ __PRETTY_FUNCTION__); }));
1652	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1652, __extension__ __PRETTY_FUNCTION__
); }));
1653	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1654	ccv_nnc_tensor_param_t output_params;
1655	const ccv_nnc_cmd_t sigmoid = CMD_SIGMOID_FORWARD()ccv_nnc_cmd(CCV_NNC_SIGMOID_FORWARD, 0, ccv_nnc_cmd_auto, 0);
1656	ccv_nnc_hint_tensor_auto(sigmoid, (ccv_nnc_tensor_param_t []){
1657			params,
1658		}, 1, ccv_nnc_no_hint, &output_params, 1);
1659	const ccv_nnc_tensor_symbol_t sigmoid_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1660	ccv_nnc_graph_exec_symbol_new(graph, sigmoid, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(sigmoid_output)(const ccv_nnc_tensor_symbol_t []){sigmoid_output}, (1 +1 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1
), "sigmoid");
1661	outputs[0] = sigmoid_output;
1662}
1663 
1664static ccv_cnnp_model_t* _ccv_cnnp_sigmoid_copy(const ccv_cnnp_model_t* const self, void* const context);
1665 
1666static const ccv_cnnp_model_vtab_t ccv_cnnp_sigmoid_isa = {
1667	.build = _ccv_cnnp_sigmoid_build,
1668	.copy = _ccv_cnnp_sigmoid_copy,
1669};
1670 
1671ccv_cnnp_model_t* ccv_cnnp_sigmoid(const char* const name)
1672{
1673	ccv_cnnp_model_sigmoid_t* const model_sigmoid = (ccv_cnnp_model_sigmoid_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_sigmoid_t));
1674	model_sigmoid->super.isa = &ccv_cnnp_sigmoid_isa;
1675	model_sigmoid->super.input_size = 1;
1676	model_sigmoid->super.outputs = &model_sigmoid->output;
1677	model_sigmoid->super.output_size = 1;
1678	ccv_cnnp_model_copy_name(&model_sigmoid->super, name);
1679	return (ccv_cnnp_model_t*)model_sigmoid;
1680}
1681 
1682static ccv_cnnp_model_t* _ccv_cnnp_sigmoid_copy(const ccv_cnnp_model_t* const self, void* const context)
1683{
1684	return ccv_cnnp_sigmoid(self->name);
1685}
1686 
1687// MARK - Tanh Layer
1688 
1689typedef struct {
1690	ccv_cnnp_model_t super;
1691	ccv_nnc_tensor_symbol_t output;
1692} ccv_cnnp_model_tanh_t;
1693 
1694static void _ccv_cnnp_tanh_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1695{
1696	PRINT(CCV_CLI_VERBOSE, "[cnnp_tanh_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_tanh_build] -\n"); fflush(stdout); } } while
 (0);
1697	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1697, __extension__ __PRETTY_FUNCTION__); }));
1698	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1698, __extension__ __PRETTY_FUNCTION__
); }));
1699	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1700	ccv_nnc_tensor_param_t output_params;
1701	const ccv_nnc_cmd_t tanh = CMD_TANH_FORWARD()ccv_nnc_cmd(CCV_NNC_TANH_FORWARD, 0, ccv_nnc_cmd_auto, 0);
1702	ccv_nnc_hint_tensor_auto(tanh, (ccv_nnc_tensor_param_t []){
1703			params,
1704		}, 1, ccv_nnc_no_hint, &output_params, 1);
1705	const ccv_nnc_tensor_symbol_t tanh_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1706	ccv_nnc_graph_exec_symbol_new(graph, tanh, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(tanh_output)(const ccv_nnc_tensor_symbol_t []){tanh_output}, (1 +1 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "tanh");
1707	outputs[0] = tanh_output;
1708}
1709 
1710static ccv_cnnp_model_t* _ccv_cnnp_tanh_copy(const ccv_cnnp_model_t* const self, void* const context);
1711 
1712static const ccv_cnnp_model_vtab_t ccv_cnnp_tanh_isa = {
1713	.build = _ccv_cnnp_tanh_build,
1714	.copy = _ccv_cnnp_tanh_copy,
1715};
1716 
1717ccv_cnnp_model_t* ccv_cnnp_tanh(const char* const name)
1718{
1719	ccv_cnnp_model_tanh_t* const model_tanh = (ccv_cnnp_model_tanh_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_tanh_t));
1720	model_tanh->super.isa = &ccv_cnnp_tanh_isa;
1721	model_tanh->super.input_size = 1;
1722	model_tanh->super.outputs = &model_tanh->output;
1723	model_tanh->super.output_size = 1;
1724	ccv_cnnp_model_copy_name(&model_tanh->super, name);
1725	return (ccv_cnnp_model_t*)model_tanh;
1726}
1727 
1728static ccv_cnnp_model_t* _ccv_cnnp_tanh_copy(const ccv_cnnp_model_t* const self, void* const context)
1729{
1730	return ccv_cnnp_tanh(self->name);
1731}
1732 
1733// MARK - Swish Layer
1734 
1735typedef struct {
1736	ccv_cnnp_model_t super;
1737	ccv_nnc_tensor_symbol_t output;
1738	float beta;
1739} ccv_cnnp_model_swish_t;
1740 
1741static void _ccv_cnnp_swish_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1742{
1743	PRINT(CCV_CLI_VERBOSE, "[cnnp_swish_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_swish_build] -\n"); fflush(stdout); } } while
 (0);
1744	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1744, __extension__ __PRETTY_FUNCTION__); }));
1745	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1745, __extension__ __PRETTY_FUNCTION__
); }));
1746	ccv_cnnp_model_swish_t* const self = (ccv_cnnp_model_swish_t*)super;
1747	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1748	ccv_nnc_tensor_param_t output_params;
1749	const ccv_nnc_cmd_t swish = CMD_SWISH_FORWARD(self->beta)ccv_nnc_cmd(CCV_NNC_SWISH_FORWARD, 0, ((ccv_nnc_cmd_param_t){
.size={.dim={1,1,1}},.swish={.beta=self->beta}}), 0);
1750	ccv_nnc_hint_tensor_auto(swish, (ccv_nnc_tensor_param_t []){
1751			params,
1752		}, 1, ccv_nnc_no_hint, &output_params, 1);
1753	const ccv_nnc_tensor_symbol_t swish_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1754	ccv_nnc_graph_exec_symbol_new(graph, swish, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(swish_output)(const ccv_nnc_tensor_symbol_t []){swish_output}, (1 +1 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "swish");
1755	outputs[0] = swish_output;
1756}
1757 
1758static ccv_cnnp_model_t* _ccv_cnnp_swish_copy(const ccv_cnnp_model_t* const self, void* const context);
1759 
1760static const ccv_cnnp_model_vtab_t ccv_cnnp_swish_isa = {
1761	.build = _ccv_cnnp_swish_build,
1762	.copy = _ccv_cnnp_swish_copy,
1763};
1764 
1765ccv_cnnp_model_t* ccv_cnnp_swish(const float beta, const char* const name)
1766{
1767	ccv_cnnp_model_swish_t* const model_swish = (ccv_cnnp_model_swish_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_swish_t));
1768	model_swish->super.isa = &ccv_cnnp_swish_isa;
1769	model_swish->super.input_size = 1;
1770	model_swish->super.outputs = &model_swish->output;
1771	model_swish->super.output_size = 1;
1772	model_swish->beta = beta;
1773	ccv_cnnp_model_copy_name(&model_swish->super, name);
1774	return (ccv_cnnp_model_t*)model_swish;
1775}
1776 
1777static ccv_cnnp_model_t* _ccv_cnnp_swish_copy(const ccv_cnnp_model_t* const self, void* const context)
1778{
1779	const ccv_cnnp_model_swish_t* const swish = (const ccv_cnnp_model_swish_t*)self;
1780	return ccv_cnnp_swish(swish->beta, self->name);
1781}
1782 
1783// MARK - GELU Layer
1784 
1785typedef struct {
1786	ccv_cnnp_model_t super;
1787	ccv_nnc_tensor_symbol_t output;
1788	int tanh;
1789} ccv_cnnp_model_gelu_t;
1790 
1791static void _ccv_cnnp_gelu_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1792{
1793	PRINT(CCV_CLI_VERBOSE, "[cnnp_gelu_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_gelu_build] -\n"); fflush(stdout); } } while
 (0);
1794	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1794, __extension__ __PRETTY_FUNCTION__); }));
1795	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1795, __extension__ __PRETTY_FUNCTION__
); }));
1796	ccv_cnnp_model_gelu_t* const self = (ccv_cnnp_model_gelu_t*)super;
1797	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1798	ccv_nnc_tensor_param_t output_params;
1799	const ccv_nnc_cmd_t gelu = CMD_GELU_FORWARD(self->tanh)ccv_nnc_cmd(CCV_NNC_GELU_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.gelu={.tanh=self->tanh}}, 0);
1800	ccv_nnc_hint_tensor_auto(gelu, (ccv_nnc_tensor_param_t []){
1801			params,
1802		}, 1, ccv_nnc_no_hint, &output_params, 1);
1803	const ccv_nnc_tensor_symbol_t gelu_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1804	ccv_nnc_graph_exec_symbol_new(graph, gelu, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(gelu_output)(const ccv_nnc_tensor_symbol_t []){gelu_output}, (1 +1 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "gelu");
1805	outputs[0] = gelu_output;
1806}
1807 
1808static ccv_cnnp_model_t* _ccv_cnnp_gelu_copy(const ccv_cnnp_model_t* const self, void* const context);
1809 
1810static const ccv_cnnp_model_vtab_t ccv_cnnp_gelu_isa = {
1811	.build = _ccv_cnnp_gelu_build,
1812	.copy = _ccv_cnnp_gelu_copy,
1813};
1814 
1815ccv_cnnp_model_t* ccv_cnnp_gelu(const int tanh, const char* const name)
1816{
1817	ccv_cnnp_model_gelu_t* const model_gelu = (ccv_cnnp_model_gelu_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_gelu_t));
1818	model_gelu->super.isa = &ccv_cnnp_gelu_isa;
1819	model_gelu->super.input_size = 1;
1820	model_gelu->super.outputs = &model_gelu->output;
1821	model_gelu->super.output_size = 1;
1822	model_gelu->tanh = tanh;
1823	ccv_cnnp_model_copy_name(&model_gelu->super, name);
1824	return (ccv_cnnp_model_t*)model_gelu;
1825}
1826 
1827static ccv_cnnp_model_t* _ccv_cnnp_gelu_copy(const ccv_cnnp_model_t* const super, void* const context)
1828{
1829	ccv_cnnp_model_gelu_t* const self = (ccv_cnnp_model_gelu_t*)super;
1830	return ccv_cnnp_gelu(self->tanh, self->super.name);
1831}
1832 
1833// MARK - Leaky ReLU Layer
1834 
1835typedef struct {
1836	ccv_cnnp_model_t super;
1837	ccv_nnc_tensor_symbol_t output;
1838	float negative_slope;
1839} ccv_cnnp_model_leaky_relu_t;
1840 
1841static void _ccv_cnnp_leaky_relu_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1842{
1843	PRINT(CCV_CLI_VERBOSE, "[cnnp_leaky_relu_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_leaky_relu_build] -\n"); fflush(stdout); } }
 while (0);
1844	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1844, __extension__ __PRETTY_FUNCTION__); }));
1845	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1845, __extension__ __PRETTY_FUNCTION__
); }));
1846	ccv_cnnp_model_leaky_relu_t* const self = (ccv_cnnp_model_leaky_relu_t*)super;
1847	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1848	ccv_nnc_tensor_param_t output_params;
1849	const ccv_nnc_cmd_t leaky_relu = CMD_LEAKY_RELU_FORWARD(self->negative_slope)ccv_nnc_cmd(CCV_NNC_LEAKY_RELU_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.leaky_relu={.negative_slope=self->
negative_slope}}, 0);
1850	ccv_nnc_hint_tensor_auto(leaky_relu, (ccv_nnc_tensor_param_t []){
1851			params,
1852		}, 1, ccv_nnc_no_hint, &output_params, 1);
1853	const ccv_nnc_tensor_symbol_t leaky_relu_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1854	ccv_nnc_graph_exec_symbol_new(graph, leaky_relu, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(leaky_relu_output)(const ccv_nnc_tensor_symbol_t []){leaky_relu_output}, (1 +1 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 -1), "leaky_relu");
1855	outputs[0] = leaky_relu_output;
1856}
1857 
1858static ccv_cnnp_model_t* _ccv_cnnp_leaky_relu_copy(const ccv_cnnp_model_t* const self, void* const context);
1859 
1860static const ccv_cnnp_model_vtab_t ccv_cnnp_leaky_relu_isa = {
1861	.build = _ccv_cnnp_leaky_relu_build,
1862	.copy = _ccv_cnnp_leaky_relu_copy,
1863};
1864 
1865ccv_cnnp_model_t* ccv_cnnp_leaky_relu(const float negative_slope, const char* const name)
1866{
1867	ccv_cnnp_model_leaky_relu_t* const model_leaky_relu = (ccv_cnnp_model_leaky_relu_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_leaky_relu_t));
1868	model_leaky_relu->super.isa = &ccv_cnnp_leaky_relu_isa;
1869	model_leaky_relu->super.input_size = 1;
1870	model_leaky_relu->super.outputs = &model_leaky_relu->output;
1871	model_leaky_relu->super.output_size = 1;
1872	model_leaky_relu->negative_slope = negative_slope;
1873	ccv_cnnp_model_copy_name(&model_leaky_relu->super, name);
1874	return (ccv_cnnp_model_t*)model_leaky_relu;
1875}
1876 
1877static ccv_cnnp_model_t* _ccv_cnnp_leaky_relu_copy(const ccv_cnnp_model_t* const super, void* const context)
1878{
1879	ccv_cnnp_model_leaky_relu_t* const self = (ccv_cnnp_model_leaky_relu_t*)super;
1880	return ccv_cnnp_leaky_relu(self->negative_slope, self->super.name);
1881}
1882 
1883// MARK - Softmax Layer
1884 
1885typedef struct {
1886	ccv_cnnp_model_t super;
1887	ccv_nnc_tensor_symbol_t output;
1888} ccv_cnnp_model_softmax_t;
1889 
1890static void _ccv_cnnp_softmax_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1891{
1892	PRINT(CCV_CLI_VERBOSE, "[cnnp_softmax_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_softmax_build] -\n"); fflush(stdout); } } while
 (0);
1893	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 1893, __extension__ __PRETTY_FUNCTION__); }));
1894	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1894, __extension__ __PRETTY_FUNCTION__
); }));
1895	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
1896	ccv_nnc_tensor_param_t output_params;
1897	const ccv_nnc_cmd_t softmax = CMD_SOFTMAX_FORWARD()ccv_nnc_cmd(CCV_NNC_SOFTMAX_FORWARD, 0, ccv_nnc_cmd_auto, 0);
1898	ccv_nnc_hint_tensor_auto(softmax, (ccv_nnc_tensor_param_t []){
1899			params,
1900		}, 1, ccv_nnc_no_hint, &output_params, 1);
1901	const ccv_nnc_tensor_symbol_t softmax_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1902	ccv_nnc_graph_exec_symbol_new(graph, softmax, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(softmax_output)(const ccv_nnc_tensor_symbol_t []){softmax_output}, (1 +1 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1
), "softmax");
1903	outputs[0] = softmax_output;
1904}
1905 
1906static ccv_cnnp_model_t* _ccv_cnnp_softmax_copy(const ccv_cnnp_model_t* const self, void* const context);
1907 
1908static const ccv_cnnp_model_vtab_t ccv_cnnp_softmax_isa = {
1909	.build = _ccv_cnnp_softmax_build,
1910	.copy = _ccv_cnnp_softmax_copy,
1911};
1912 
1913ccv_cnnp_model_t* ccv_cnnp_softmax(const char* const name)
1914{
1915	ccv_cnnp_model_softmax_t* const model_softmax = (ccv_cnnp_model_softmax_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_softmax_t));
1916	model_softmax->super.isa = &ccv_cnnp_softmax_isa;
1917	model_softmax->super.input_size = 1;
1918	model_softmax->super.outputs = &model_softmax->output;
1919	model_softmax->super.output_size = 1;
1920	ccv_cnnp_model_copy_name(&model_softmax->super, name);
1921	return (ccv_cnnp_model_t*)model_softmax;
1922}
1923 
1924static ccv_cnnp_model_t* _ccv_cnnp_softmax_copy(const ccv_cnnp_model_t* const self, void* const context)
1925{
1926	return ccv_cnnp_softmax(self->name);
1927}
1928 
1929// MARK - Add Layer
1930 
1931typedef struct {
1932	ccv_cnnp_model_t super;
1933	float p;
1934	float q;
1935	ccv_nnc_tensor_symbol_t output;
1936} ccv_cnnp_model_add_t;
1937 
1938static void _ccv_cnnp_add_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1939{
1940	PRINT(CCV_CLI_VERBOSE, "[cnnp_add_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_add_build] -\n"); fflush(stdout); } } while (
0);
1941	const ccv_cnnp_model_add_t* const self = (const ccv_cnnp_model_add_t*)super;
1942	assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 1942, __extension__ __PRETTY_FUNCTION__); }));
1943	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1943, __extension__ __PRETTY_FUNCTION__
); }));
1944	ccv_nnc_tensor_param_t input_params[2];
1945	int i;
1946	for (i = 0; i < 2; i++)
1947		input_params[i] = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
1948	ccv_nnc_tensor_param_t output_params;
1949	const ccv_nnc_cmd_t add = CMD_ADD_FORWARD(self->p, self->q)ccv_nnc_cmd(CCV_NNC_ADD_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={self->p, self->q}}}, 0);
1950	ccv_nnc_hint_tensor_auto(add, input_params, 2, ccv_nnc_no_hint, &output_params, 1);
1951	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
1952	ccv_nnc_graph_exec_symbol_new(graph, add, inputs, input_size, outputs, output_size, "add");
1953}
1954 
1955static ccv_cnnp_model_t* _ccv_cnnp_add_copy(const ccv_cnnp_model_t* const self, void* const context);
1956 
1957static const ccv_cnnp_model_vtab_t ccv_cnnp_add_isa = {
1958	.build = _ccv_cnnp_add_build,
1959	.copy = _ccv_cnnp_add_copy,
1960};
1961 
1962ccv_cnnp_model_t* ccv_cnnp_add(const float p, const float q, const char* const name)
1963{
1964	ccv_cnnp_model_add_t* const model_add = (ccv_cnnp_model_add_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_add_t));
1965	model_add->super.isa = &ccv_cnnp_add_isa;
1966	model_add->super.input_size = 2;
1967	model_add->super.outputs = &model_add->output;
1968	model_add->super.output_size = 1;
1969	model_add->p = p;
1970	model_add->q = q;
1971	ccv_cnnp_model_copy_name(&model_add->super, name);
1972	return (ccv_cnnp_model_t*)model_add;
1973}
1974 
1975static ccv_cnnp_model_t* _ccv_cnnp_add_copy(const ccv_cnnp_model_t* const super, void* const context)
1976{
1977	const ccv_cnnp_model_add_t* const self = (const ccv_cnnp_model_add_t*)super;
1978	return ccv_cnnp_add(self->p, self->q, self->super.name);
1979}
1980 
1981// MARK - Mul Layer
1982 
1983typedef struct {
1984	ccv_cnnp_model_t super;
1985	ccv_nnc_tensor_symbol_t output;
1986	float p;
1987} ccv_cnnp_model_mul_t;
1988 
1989static void _ccv_cnnp_mul_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
1990{
1991	PRINT(CCV_CLI_VERBOSE, "[cnnp_mul_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_mul_build] -\n"); fflush(stdout); } } while (
0);
1992	const ccv_cnnp_model_mul_t* const self = (const ccv_cnnp_model_mul_t*)super;
1993	assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 1993, __extension__ __PRETTY_FUNCTION__); }));
1994	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 1994, __extension__ __PRETTY_FUNCTION__
); }));
1995	ccv_nnc_tensor_param_t input_params[2];
1996	int i;
1997	for (i = 0; i < 2; i++)
1998		input_params[i] = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
1999	ccv_nnc_tensor_param_t output_params;
2000	const ccv_nnc_cmd_t mul = CMD_MUL_FORWARD(self->p)ccv_nnc_cmd(CCV_NNC_MUL_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={self->p,}}}, 0);
2001	ccv_nnc_hint_tensor_auto(mul, input_params, 2, ccv_nnc_no_hint, &output_params, 1);
2002	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2003	ccv_nnc_graph_exec_symbol_new(graph, mul, inputs, input_size, outputs, output_size, "mul");
2004}
2005 
2006static ccv_cnnp_model_t* _ccv_cnnp_mul_copy(const ccv_cnnp_model_t* const self, void* const context);
2007 
2008static const ccv_cnnp_model_vtab_t ccv_cnnp_mul_isa = {
2009	.build = _ccv_cnnp_mul_build,
2010	.copy = _ccv_cnnp_mul_copy,
2011};
2012 
2013ccv_cnnp_model_t* ccv_cnnp_mul(const float p, const char* const name)
2014{
2015	ccv_cnnp_model_mul_t* const model_mul = (ccv_cnnp_model_mul_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_mul_t));
2016	model_mul->super.isa = &ccv_cnnp_mul_isa;
2017	model_mul->super.input_size = 2;
2018	model_mul->super.outputs = &model_mul->output;
2019	model_mul->super.output_size = 1;
2020	model_mul->p = p;
2021	ccv_cnnp_model_copy_name(&model_mul->super, name);
2022	return (ccv_cnnp_model_t*)model_mul;
2023}
2024 
2025static ccv_cnnp_model_t* _ccv_cnnp_mul_copy(const ccv_cnnp_model_t* const super, void* const context)
2026{
2027	const ccv_cnnp_model_mul_t* const self = (const ccv_cnnp_model_mul_t*)super;
2028	return ccv_cnnp_mul(self->p, self->super.name);
2029}
2030 
2031// MARK - Scalar Mul Layer
2032 
2033typedef struct {
2034	ccv_cnnp_model_t super;
2035	ccv_nnc_tensor_symbol_t output;
2036	float a;
2037} ccv_cnnp_model_scalar_mul_t;
2038 
2039static void _ccv_cnnp_scalar_mul_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2040{
2041	PRINT(CCV_CLI_VERBOSE, "[cnnp_scalar_mul_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_scalar_mul_build] -\n"); fflush(stdout); } }
 while (0);
2042	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2042, __extension__ __PRETTY_FUNCTION__); }));
2043	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2043, __extension__ __PRETTY_FUNCTION__
); }));
2044	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2045	ccv_nnc_tensor_param_t output_params;
2046	ccv_cnnp_model_scalar_mul_t* const self = (ccv_cnnp_model_scalar_mul_t*)super;
2047	const ccv_nnc_cmd_t scalar_mul = CMD_SCALAR_MUL_FORWARD(self->a)ccv_nnc_cmd(CCV_NNC_SCALAR_MUL_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={self->a,}}}, 0);
2048	ccv_nnc_hint_tensor_auto(scalar_mul, (ccv_nnc_tensor_param_t []){
2049			params,
2050		}, 1, ccv_nnc_no_hint, &output_params, 1);
2051	const ccv_nnc_tensor_symbol_t scalar_mul_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2052	ccv_nnc_graph_exec_symbol_new(graph, scalar_mul, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(scalar_mul_output)(const ccv_nnc_tensor_symbol_t []){scalar_mul_output}, (1 +1 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 -1), "scalar_mul");
2053	outputs[0] = scalar_mul_output;
2054}
2055 
2056static ccv_cnnp_model_t* _ccv_cnnp_scalar_mul_copy(const ccv_cnnp_model_t* const super, void* const context);
2057 
2058static const ccv_cnnp_model_vtab_t ccv_cnnp_scalar_mul_isa = {
2059	.build = _ccv_cnnp_scalar_mul_build,
2060	.copy = _ccv_cnnp_scalar_mul_copy,
2061};
2062 
2063ccv_cnnp_model_t* ccv_cnnp_scalar_mul(const float a, const char* const name)
2064{
2065	ccv_cnnp_model_scalar_mul_t* const model_scalar_mul = (ccv_cnnp_model_scalar_mul_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_scalar_mul_t));
2066	model_scalar_mul->super.isa = &ccv_cnnp_scalar_mul_isa;
2067	model_scalar_mul->super.input_size = 1;
2068	model_scalar_mul->super.outputs = &model_scalar_mul->output;
2069	model_scalar_mul->super.output_size = 1;
2070	model_scalar_mul->a = a;
2071	ccv_cnnp_model_copy_name(&model_scalar_mul->super, name);
2072	return (ccv_cnnp_model_t*)model_scalar_mul;
2073}
2074 
2075static ccv_cnnp_model_t* _ccv_cnnp_scalar_mul_copy(const ccv_cnnp_model_t* const super, void* const context)
2076{
2077	const ccv_cnnp_model_scalar_mul_t* const self = (const ccv_cnnp_model_scalar_mul_t*)super;
2078	return ccv_cnnp_scalar_mul(self->a, self->super.name);
2079}
2080 
2081// MARK - Div Layer
2082 
2083typedef struct {
2084	ccv_cnnp_model_t super;
2085	ccv_nnc_tensor_symbol_t output;
2086	int reciprocal;
2087} ccv_cnnp_model_div_t;
2088 
2089static void _ccv_cnnp_div_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2090{
2091	const ccv_cnnp_model_div_t* const self = (const ccv_cnnp_model_div_t*)super;
2092	PRINT(CCV_CLI_VERBOSE, "[cnnp_div_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_div_build] -\n"); fflush(stdout); } } while (
0);
2093	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2093, __extension__ __PRETTY_FUNCTION__
); }));
2094	ccv_nnc_tensor_param_t input_params[2];
2095	int i;
2096	ccv_nnc_tensor_param_t output_params;
2097	const ccv_nnc_cmd_t div = CMD_EWDIV_FORWARD()ccv_nnc_cmd(CCV_NNC_EWDIV_FORWARD, 0, ccv_nnc_cmd_auto, 0);
2098	if (self->reciprocal)
2099	{
2100		assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2100, __extension__ __PRETTY_FUNCTION__); }));
2101		input_params[0] = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2102		input_params[1] = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2103		ccv_nnc_hint_tensor_auto(div, input_params, 2, ccv_nnc_no_hint, &output_params, 1);
2104		outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2105		ccv_nnc_graph_exec_symbol_new(graph, div, TENSOR_SYMBOL_LIST(NO_TENSOR_SYMBOL, inputs[0])(const ccv_nnc_tensor_symbol_t []){(const ccv_nnc_tensor_symbol_t
){.d = CCV_NNC_NO_TENSOR_SYMBOL}, inputs[0]}, (1 +1 +1 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), outputs, output_size, "div");
2106	} else {
2107		assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 2107, __extension__ __PRETTY_FUNCTION__); }));
2108		for (i = 0; i < 2; i++)
2109			input_params[i] = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
2110		ccv_nnc_hint_tensor_auto(div, input_params, input_size, ccv_nnc_no_hint, &output_params, 1);
2111		outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2112		ccv_nnc_graph_exec_symbol_new(graph, div, inputs, input_size, outputs, output_size, "div");
2113	}
2114}
2115 
2116static ccv_cnnp_model_t* _ccv_cnnp_div_copy(const ccv_cnnp_model_t* const self, void* const context);
2117 
2118static const ccv_cnnp_model_vtab_t ccv_cnnp_div_isa = {
2119	.build = _ccv_cnnp_div_build,
2120	.copy = _ccv_cnnp_div_copy,
2121};
2122 
2123ccv_cnnp_model_t* ccv_cnnp_div(const int reciprocal, const char* const name)
2124{
2125	ccv_cnnp_model_div_t* const model_div = (ccv_cnnp_model_div_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_div_t));
2126	model_div->super.isa = &ccv_cnnp_div_isa;
2127	model_div->super.input_size = reciprocal ? 1 : 2;
2128	model_div->super.outputs = &model_div->output;
2129	model_div->super.output_size = 1;
2130	model_div->reciprocal = reciprocal;
2131	ccv_cnnp_model_copy_name(&model_div->super, name);
2132	return (ccv_cnnp_model_t*)model_div;
2133}
2134 
2135static ccv_cnnp_model_t* _ccv_cnnp_div_copy(const ccv_cnnp_model_t* const super, void* const context)
2136{
2137	const ccv_cnnp_model_div_t* const self = (const ccv_cnnp_model_div_t*)super;
2138	return ccv_cnnp_div(self->reciprocal, self->super.name);
2139}
2140 
2141// MARK - Sqrt Layer
2142 
2143typedef struct {
2144	ccv_cnnp_model_t super;
2145	ccv_nnc_tensor_symbol_t output;
2146} ccv_cnnp_model_sqrt_t;
2147 
2148static void _ccv_cnnp_sqrt_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2149{
2150	PRINT(CCV_CLI_VERBOSE, "[cnnp_sqrt_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_sqrt_build] -\n"); fflush(stdout); } } while
 (0);
2151	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2151, __extension__ __PRETTY_FUNCTION__
); }));
2152	ccv_nnc_tensor_param_t input_params[1];
2153	ccv_nnc_tensor_param_t output_params;
2154	const ccv_nnc_cmd_t sqrt = CMD_EWSQRT_FORWARD()ccv_nnc_cmd(CCV_NNC_EWSQRT_FORWARD, 0, ccv_nnc_cmd_auto, 0);
2155	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2155, __extension__ __PRETTY_FUNCTION__); }));
2156	input_params[0] = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2157	ccv_nnc_hint_tensor_auto(sqrt, input_params, 1, ccv_nnc_no_hint, &output_params, 1);
2158	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2159	ccv_nnc_graph_exec_symbol_new(graph, sqrt, inputs, 1, outputs, output_size, "sqrt");
2160}
2161 
2162static ccv_cnnp_model_t* _ccv_cnnp_sqrt_copy(const ccv_cnnp_model_t* const self, void* const context);
2163 
2164static const ccv_cnnp_model_vtab_t ccv_cnnp_sqrt_isa = {
2165	.build = _ccv_cnnp_sqrt_build,
2166	.copy = _ccv_cnnp_sqrt_copy,
2167};
2168 
2169ccv_cnnp_model_t* ccv_cnnp_sqrt(const char* const name)
2170{
2171	ccv_cnnp_model_sqrt_t* const model_sqrt = (ccv_cnnp_model_sqrt_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_sqrt_t));
2172	model_sqrt->super.isa = &ccv_cnnp_sqrt_isa;
2173	model_sqrt->super.input_size = 1;
2174	model_sqrt->super.outputs = &model_sqrt->output;
2175	model_sqrt->super.output_size = 1;
2176	ccv_cnnp_model_copy_name(&model_sqrt->super, name);
2177	return (ccv_cnnp_model_t*)model_sqrt;
2178}
2179 
2180static ccv_cnnp_model_t* _ccv_cnnp_sqrt_copy(const ccv_cnnp_model_t* const super, void* const context)
2181{
2182	const ccv_cnnp_model_sqrt_t* const self = (const ccv_cnnp_model_sqrt_t*)super;
2183	return ccv_cnnp_sqrt(self->super.name);
2184}
2185 
2186// MARK - Log Layer
2187 
2188typedef struct {
2189	ccv_cnnp_model_t super;
2190	ccv_nnc_tensor_symbol_t output;
2191} ccv_cnnp_model_log_t;
2192 
2193static void _ccv_cnnp_log_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2194{
2195	PRINT(CCV_CLI_VERBOSE, "[cnnp_log_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_log_build] -\n"); fflush(stdout); } } while (
0);
2196	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2196, __extension__ __PRETTY_FUNCTION__
); }));
2197	ccv_nnc_tensor_param_t input_params[1];
2198	ccv_nnc_tensor_param_t output_params;
2199	const ccv_nnc_cmd_t log = CMD_EWLOG_FORWARD()ccv_nnc_cmd(CCV_NNC_EWLOG_FORWARD, 0, ccv_nnc_cmd_auto, 0);
2200	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2200, __extension__ __PRETTY_FUNCTION__); }));
2201	input_params[0] = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2202	ccv_nnc_hint_tensor_auto(log, input_params, 1, ccv_nnc_no_hint, &output_params, 1);
2203	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2204	ccv_nnc_graph_exec_symbol_new(graph, log, inputs, 1, outputs, output_size, "log");
2205}
2206 
2207static ccv_cnnp_model_t* _ccv_cnnp_log_copy(const ccv_cnnp_model_t* const self, void* const context);
2208 
2209static const ccv_cnnp_model_vtab_t ccv_cnnp_log_isa = {
2210	.build = _ccv_cnnp_log_build,
2211	.copy = _ccv_cnnp_log_copy,
2212};
2213 
2214ccv_cnnp_model_t* ccv_cnnp_log(const char* const name)
2215{
2216	ccv_cnnp_model_log_t* const model_log = (ccv_cnnp_model_log_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_log_t));
2217	model_log->super.isa = &ccv_cnnp_log_isa;
2218	model_log->super.input_size = 1;
2219	model_log->super.outputs = &model_log->output;
2220	model_log->super.output_size = 1;
2221	ccv_cnnp_model_copy_name(&model_log->super, name);
2222	return (ccv_cnnp_model_t*)model_log;
2223}
2224 
2225static ccv_cnnp_model_t* _ccv_cnnp_log_copy(const ccv_cnnp_model_t* const super, void* const context)
2226{
2227	return ccv_cnnp_log(super->name);
2228}
2229 
2230// MARK - Pow Layer
2231 
2232typedef struct {
2233	ccv_cnnp_model_t super;
2234	ccv_nnc_tensor_symbol_t output;
2235	ccv_nnc_cmd_param_t params;
2236} ccv_cnnp_model_pow_t;
2237 
2238static void _ccv_cnnp_pow_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2239{
2240	ccv_cnnp_model_pow_t* const self = (ccv_cnnp_model_pow_t*)super;
2241	PRINT(CCV_CLI_VERBOSE, "[cnnp_pow_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_pow_build] -\n"); fflush(stdout); } } while (
0);
2242	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2242, __extension__ __PRETTY_FUNCTION__); }));
2243	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2243, __extension__ __PRETTY_FUNCTION__
); }));
2244	ccv_nnc_tensor_param_t input_params[1];
2245	input_params[0] = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2246	ccv_nnc_tensor_param_t output_params;
2247	const ccv_nnc_cmd_t pow = ccv_nnc_cmd(CCV_NNC_EWPOW_FORWARD, 0, self->params, 0);
2248	ccv_nnc_hint_tensor_auto(pow, input_params, 1, ccv_nnc_no_hint, &output_params, 1);
2249	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2250	ccv_nnc_graph_exec_symbol_new(graph, pow, inputs, input_size, outputs, output_size, "pow");
2251}
2252 
2253static ccv_cnnp_model_t* _ccv_cnnp_pow_copy(const ccv_cnnp_model_t* const self, void* const context);
2254 
2255static const ccv_cnnp_model_vtab_t ccv_cnnp_pow_isa = {
2256	.build = _ccv_cnnp_pow_build,
2257	.copy = _ccv_cnnp_pow_copy,
2258};
2259 
2260ccv_cnnp_model_t* ccv_cnnp_pow(const float exponent, const char* const name)
2261{
2262	ccv_cnnp_model_pow_t* const model_pow = (ccv_cnnp_model_pow_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_pow_t));
2263	model_pow->super.isa = &ccv_cnnp_pow_isa;
2264	model_pow->super.input_size = 1;
2265	model_pow->super.outputs = &model_pow->output;
2266	model_pow->super.output_size = 1;
2267	model_pow->params = (ccv_nnc_cmd_param_t){
2268		.size = {
2269			.dim = { 1, 1, 1 }
2270		},
2271		.pow = {
2272			.exponent = exponent,
2273		},
2274	};
2275	ccv_cnnp_model_copy_name(&model_pow->super, name);
2276	return (ccv_cnnp_model_t*)model_pow;
2277}
2278 
2279static ccv_cnnp_model_t* _ccv_cnnp_pow_copy(const ccv_cnnp_model_t* const super, void* const context)
2280{
2281	const ccv_cnnp_model_pow_t* const self = (const ccv_cnnp_model_pow_t*)super;
2282	return ccv_cnnp_pow(self->params.pow.exponent, super->name);
2283}
2284 
2285// MARK - Sin Layer
2286 
2287typedef struct {
2288	ccv_cnnp_model_t super;
2289	ccv_nnc_tensor_symbol_t output;
2290} ccv_cnnp_model_sin_t;
2291 
2292static void _ccv_cnnp_sin_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2293{
2294	PRINT(CCV_CLI_VERBOSE, "[cnnp_sin_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_sin_build] -\n"); fflush(stdout); } } while (
0);
2295	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2295, __extension__ __PRETTY_FUNCTION__
); }));
2296	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2296, __extension__ __PRETTY_FUNCTION__); }));
2297	ccv_nnc_tensor_param_t input_params[1];
2298	ccv_nnc_tensor_param_t output_params;
2299	const ccv_nnc_cmd_t sin = CMD_EWSIN_FORWARD()ccv_nnc_cmd(CCV_NNC_EWSIN_FORWARD, 0, ccv_nnc_cmd_auto, 0);
2300	input_params[0] = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2301	ccv_nnc_hint_tensor_auto(sin, input_params, 1, ccv_nnc_no_hint, &output_params, 1);
2302	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2303	ccv_nnc_graph_exec_symbol_new(graph, sin, inputs, 1, outputs, output_size, "sin");
2304}
2305 
2306static ccv_cnnp_model_t* _ccv_cnnp_sin_copy(const ccv_cnnp_model_t* const self, void* const context);
2307 
2308static const ccv_cnnp_model_vtab_t ccv_cnnp_sin_isa = {
2309	.build = _ccv_cnnp_sin_build,
2310	.copy = _ccv_cnnp_sin_copy,
2311};
2312 
2313ccv_cnnp_model_t* ccv_cnnp_sin(const char* const name)
2314{
2315	ccv_cnnp_model_sin_t* const model_sin = (ccv_cnnp_model_sin_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_sin_t));
2316	model_sin->super.isa = &ccv_cnnp_sin_isa;
2317	model_sin->super.input_size = 1;
2318	model_sin->super.outputs = &model_sin->output;
2319	model_sin->super.output_size = 1;
2320	ccv_cnnp_model_copy_name(&model_sin->super, name);
2321	return (ccv_cnnp_model_t*)model_sin;
2322}
2323 
2324static ccv_cnnp_model_t* _ccv_cnnp_sin_copy(const ccv_cnnp_model_t* const super, void* const context)
2325{
2326	return ccv_cnnp_sin(super->name);
2327}
2328 
2329// MARK - Cos Layer
2330 
2331typedef struct {
2332	ccv_cnnp_model_t super;
2333	ccv_nnc_tensor_symbol_t output;
2334} ccv_cnnp_model_cos_t;
2335 
2336static void _ccv_cnnp_cos_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2337{
2338	PRINT(CCV_CLI_VERBOSE, "[cnnp_cos_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_cos_build] -\n"); fflush(stdout); } } while (
0);
2339	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2339, __extension__ __PRETTY_FUNCTION__
); }));
2340	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2340, __extension__ __PRETTY_FUNCTION__); }));
2341	ccv_nnc_tensor_param_t input_params[1];
2342	ccv_nnc_tensor_param_t output_params;
2343	const ccv_nnc_cmd_t cos = CMD_EWCOS_FORWARD()ccv_nnc_cmd(CCV_NNC_EWCOS_FORWARD, 0, ccv_nnc_cmd_auto, 0);
2344	input_params[0] = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2345	ccv_nnc_hint_tensor_auto(cos, input_params, 1, ccv_nnc_no_hint, &output_params, 1);
2346	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2347	ccv_nnc_graph_exec_symbol_new(graph, cos, inputs, 1, outputs, output_size, "cos");
2348}
2349 
2350static ccv_cnnp_model_t* _ccv_cnnp_cos_copy(const ccv_cnnp_model_t* const self, void* const context);
2351 
2352static const ccv_cnnp_model_vtab_t ccv_cnnp_cos_isa = {
2353	.build = _ccv_cnnp_cos_build,
2354	.copy = _ccv_cnnp_cos_copy,
2355};
2356 
2357ccv_cnnp_model_t* ccv_cnnp_cos(const char* const name)
2358{
2359	ccv_cnnp_model_cos_t* const model_cos = (ccv_cnnp_model_cos_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_cos_t));
2360	model_cos->super.isa = &ccv_cnnp_cos_isa;
2361	model_cos->super.input_size = 1;
2362	model_cos->super.outputs = &model_cos->output;
2363	model_cos->super.output_size = 1;
2364	ccv_cnnp_model_copy_name(&model_cos->super, name);
2365	return (ccv_cnnp_model_t*)model_cos;
2366}
2367 
2368static ccv_cnnp_model_t* _ccv_cnnp_cos_copy(const ccv_cnnp_model_t* const super, void* const context)
2369{
2370	return ccv_cnnp_cos(super->name);
2371}
2372 
2373// MARK - Rotate Half Layer
2374 
2375typedef struct {
2376	ccv_cnnp_model_t super;
2377	ccv_nnc_tensor_symbol_t output;
2378} ccv_cnnp_model_rotate_half_t;
2379 
2380static void _ccv_cnnp_rotate_half_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2381{
2382	PRINT(CCV_CLI_VERBOSE, "[cnnp_rotate_half_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_rotate_half_build] -\n"); fflush(stdout); } }
 while (0);
2383	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2383, __extension__ __PRETTY_FUNCTION__); }));
2384	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2384, __extension__ __PRETTY_FUNCTION__
); }));
2385	ccv_nnc_tensor_param_t input_params[1];
2386	ccv_nnc_tensor_param_t output_params;
2387	const ccv_nnc_cmd_t rotate_half = CMD_ROTATE_HALF_FORWARD()ccv_nnc_cmd(CCV_NNC_ROTATE_HALF_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}}}, 0);
2388	input_params[0] = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2389	ccv_nnc_hint_tensor_auto(rotate_half, input_params, 1, ccv_nnc_no_hint, &output_params, 1);
2390	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2391	ccv_nnc_graph_exec_symbol_new(graph, rotate_half, inputs, 1, outputs, output_size, "rotate_half");
2392}
2393 
2394static ccv_cnnp_model_t* _ccv_cnnp_rotate_half_copy(const ccv_cnnp_model_t* const self, void* const context);
2395 
2396static const ccv_cnnp_model_vtab_t ccv_cnnp_rotate_half_isa = {
2397	.build = _ccv_cnnp_rotate_half_build,
2398	.copy = _ccv_cnnp_rotate_half_copy,
2399};
2400 
2401ccv_cnnp_model_t* ccv_cnnp_rotate_half(const char* const name)
2402{
2403	ccv_cnnp_model_rotate_half_t* const model_rotate_half = (ccv_cnnp_model_rotate_half_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_rotate_half_t));
2404	model_rotate_half->super.isa = &ccv_cnnp_rotate_half_isa;
2405	model_rotate_half->super.input_size = 1;
2406	model_rotate_half->super.outputs = &model_rotate_half->output;
2407	model_rotate_half->super.output_size = 1;
2408	ccv_cnnp_model_copy_name(&model_rotate_half->super, name);
2409	return (ccv_cnnp_model_t*)model_rotate_half;
2410}
2411 
2412static ccv_cnnp_model_t* _ccv_cnnp_rotate_half_copy(const ccv_cnnp_model_t* const super, void* const context)
2413{
2414	return ccv_cnnp_rotate_half(super->name);
2415}
2416 
2417// MARK - Cmul Layer
2418 
2419typedef struct {
2420	ccv_cnnp_model_t super;
2421	ccv_nnc_tensor_symbol_t output;
2422} ccv_cnnp_model_cmul_t;
2423 
2424static void _ccv_cnnp_cmul_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2425{
2426	PRINT(CCV_CLI_VERBOSE, "[cnnp_cmul_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_cmul_build] -\n"); fflush(stdout); } } while
 (0);
2427	assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 2427, __extension__ __PRETTY_FUNCTION__); }));
2428	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2428, __extension__ __PRETTY_FUNCTION__
); }));
2429	ccv_nnc_tensor_param_t input_params[2];
2430	int i;
2431	for (i = 0; i < 2; i++)
2432		input_params[i] = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
2433	ccv_nnc_tensor_param_t output_params;
2434	const ccv_nnc_cmd_t mul = CMD_CMUL_FORWARD()ccv_nnc_cmd(CCV_NNC_CMUL_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}}}, 0);
2435	ccv_nnc_hint_tensor_auto(mul, input_params, 2, ccv_nnc_no_hint, &output_params, 1);
2436	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2437	ccv_nnc_graph_exec_symbol_new(graph, mul, inputs, input_size, outputs, output_size, "cmul");
2438}
2439 
2440static ccv_cnnp_model_t* _ccv_cnnp_cmul_copy(const ccv_cnnp_model_t* const self, void* const context);
2441 
2442static const ccv_cnnp_model_vtab_t ccv_cnnp_cmul_isa = {
2443	.build = _ccv_cnnp_cmul_build,
2444	.copy = _ccv_cnnp_cmul_copy,
2445};
2446 
2447ccv_cnnp_model_t* ccv_cnnp_cmul(const char* const name)
2448{
2449	ccv_cnnp_model_cmul_t* const model_cmul = (ccv_cnnp_model_cmul_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_cmul_t));
2450	model_cmul->super.isa = &ccv_cnnp_cmul_isa;
2451	model_cmul->super.input_size = 2;
2452	model_cmul->super.outputs = &model_cmul->output;
2453	model_cmul->super.output_size = 1;
2454	ccv_cnnp_model_copy_name(&model_cmul->super, name);
2455	return (ccv_cnnp_model_t*)model_cmul;
2456}
2457 
2458static ccv_cnnp_model_t* _ccv_cnnp_cmul_copy(const ccv_cnnp_model_t* const super, void* const context)
2459{
2460	return ccv_cnnp_cmul(super->name);
2461}
2462 
2463// MARK - Transpose Layer
2464 
2465typedef struct {
2466	ccv_cnnp_model_t super;
2467	ccv_nnc_tensor_symbol_t output;
2468	int transpose[2];
2469} ccv_cnnp_model_transpose_t;
2470 
2471static void _ccv_cnnp_transpose_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2472{
2473	ccv_cnnp_model_transpose_t* const self = (ccv_cnnp_model_transpose_t*)super;
2474	PRINT(CCV_CLI_VERBOSE, "[cnnp_transpose_build] (%d, %d)\n", self->transpose[0], self->transpose[1])do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_transpose_build] (%d, %d)\n", self->transpose
[0], self->transpose[1]); fflush(stdout); } } while (0);
2475	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2475, __extension__ __PRETTY_FUNCTION__); }));
2476	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2476, __extension__ __PRETTY_FUNCTION__
); }));
2477	if (self->transpose[0] == self->transpose[1])
2478	{
2479		outputs[0] = inputs[0];
2480		return;
2481	}
2482	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2483	ccv_nnc_tensor_param_t output_params;
2484	const ccv_nnc_cmd_t transpose = CMD_TRANSPOSE_FORWARD(self->transpose[0], self->transpose[1])ccv_nnc_cmd(CCV_NNC_TRANSPOSE_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.transpose={.axis={self->transpose[
0], self->transpose[1]}}}), 0);
2485	ccv_nnc_hint_tensor_auto(transpose, (ccv_nnc_tensor_param_t []){
2486			params,
2487		}, 1, ccv_nnc_no_hint, &output_params, 1);
2488	const ccv_nnc_tensor_symbol_t transpose_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2489	ccv_nnc_graph_exec_symbol_new(graph, transpose, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(transpose_output)(const ccv_nnc_tensor_symbol_t []){transpose_output}, (1 +1 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 -1), "transpose");
2490	outputs[0] = transpose_output;
2491}
2492 
2493static ccv_cnnp_model_t* _ccv_cnnp_transpose_copy(const ccv_cnnp_model_t* const super, void* const context);
2494 
2495static const ccv_cnnp_model_vtab_t ccv_cnnp_transpose_isa = {
2496	.build = _ccv_cnnp_transpose_build,
2497	.copy = _ccv_cnnp_transpose_copy,
2498};
2499 
2500ccv_cnnp_model_t* ccv_cnnp_transpose(const int axis_a, const int axis_b, const char* const name)
2501{
2502	ccv_cnnp_model_transpose_t* const model_transpose = (ccv_cnnp_model_transpose_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_transpose_t));
2503	model_transpose->super.isa = &ccv_cnnp_transpose_isa;
2504	model_transpose->super.input_size = 1;
2505	model_transpose->super.outputs = &model_transpose->output;
2506	model_transpose->super.output_size = 1;
2507	model_transpose->transpose[0] = axis_a;
2508	model_transpose->transpose[1] = axis_b;
2509	ccv_cnnp_model_copy_name(&model_transpose->super, name);
2510	return (ccv_cnnp_model_t*)model_transpose;
2511}
2512 
2513static ccv_cnnp_model_t* _ccv_cnnp_transpose_copy(const ccv_cnnp_model_t* const super, void* const context)
2514{
2515	const ccv_cnnp_model_transpose_t* const self = (const ccv_cnnp_model_transpose_t*)super;
2516	return ccv_cnnp_transpose(self->transpose[0], self->transpose[1], self->super.name);
2517}
2518 
2519// MARK - Layer Norm Layer
2520 
2521typedef struct {
2522	ccv_cnnp_model_t super;
2523	ccv_nnc_tensor_symbol_t output;
2524	ccv_nnc_tensor_symbol_t bias;
2525	ccv_nnc_tensor_symbol_t scale;
2526	ccv_nnc_cmd_param_t params;
2527} ccv_cnnp_model_layer_norm_t;
2528 
2529static void _ccv_cnnp_layer_norm_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2530{
2531	PRINT(CCV_CLI_VERBOSE, "[cnnp_layer_norm_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_layer_norm_build] -\n"); fflush(stdout); } }
 while (0);
2532	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2532, __extension__ __PRETTY_FUNCTION__); }));
2533	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2533, __extension__ __PRETTY_FUNCTION__
); }));
2534	ccv_cnnp_model_layer_norm_t* const self = (ccv_cnnp_model_layer_norm_t*)super;
2535	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2536	ccv_nnc_tensor_param_t bias_params = params;
2537	const int nd = ccv_nnc_tensor_nd(params.dim);
2538	int i;
2539	for (i = 0; i < nd; i++)
2540		bias_params.dim[i] = 1;
2541	for (i = 0; i < self->params.lnorm.count; i++)
2542		bias_params.dim[self->params.lnorm.axis[i]] = params.dim[self->params.lnorm.axis[i]];
2543	if (self->params.lnorm.elementwise_affine)
2544	{
2545		// Both scale and bias are shared between if this model is reused.
2546		if (!self->scale.graph)
2547			self->scale = ccv_nnc_tensor_symbol_new(graph, bias_params, "scale");
2548		if (!self->bias.graph)
2549			self->bias = ccv_nnc_tensor_symbol_new(graph, bias_params, "bias");
2550	}
2551	const ccv_nnc_cmd_t layer_norm = ccv_nnc_cmd(CCV_NNC_LAYER_NORM_FORWARD, 0, self->params, 0);
2552	ccv_nnc_tensor_param_t output_params[3];
2553	if (self->params.lnorm.elementwise_affine)
2554		ccv_nnc_hint_tensor_auto(layer_norm, (ccv_nnc_tensor_param_t []){
2555				params,
2556				bias_params,
2557				bias_params,
2558			}, 3, ccv_nnc_no_hint, output_params, 3);
2559	else
2560		ccv_nnc_hint_tensor_auto(layer_norm, (ccv_nnc_tensor_param_t []){
2561				params,
2562			}, 1, ccv_nnc_no_hint, output_params, 3);
2563	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params[0], 0);
2564	const ccv_nnc_tensor_symbol_t saved_mean = ccv_nnc_tensor_symbol_new(graph, output_params[1], "saved_mean");
2565	const ccv_nnc_tensor_symbol_t saved_inv_std = ccv_nnc_tensor_symbol_new(graph, output_params[2], "saved_inv_std");
2566	if (self->params.lnorm.elementwise_affine)
2567		ccv_nnc_graph_exec_symbol_new(graph, layer_norm, TENSOR_SYMBOL_LIST(inputs[0], self->scale, self->bias)(const ccv_nnc_tensor_symbol_t []){inputs[0], self->scale,
 self->bias}, (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output, saved_mean, saved_inv_std)(const ccv_nnc_tensor_symbol_t []){output, saved_mean, saved_inv_std
}, (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 -1), "layer_norm");
2568	else
2569		ccv_nnc_graph_exec_symbol_new(graph, layer_norm, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output, saved_mean, saved_inv_std)(const ccv_nnc_tensor_symbol_t []){output, saved_mean, saved_inv_std
}, (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 -1), "layer_norm");
2570	outputs[0] = output;
2571}
2572 
2573static void _ccv_cnnp_layer_norm_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
2574{
2575	ccv_cnnp_model_layer_norm_t* const self = (ccv_cnnp_model_layer_norm_t*)super;
2576	if (self->scale.graph)
2577		initializer(context, CMD_SET_FORWARD(1)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={1,}}}, 0), ccv_nnc_no_hint, 0, 0, self->scale);
2578	if (self->bias.graph)
2579		initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, self->bias);
2580}
2581 
2582static void _ccv_cnnp_layer_norm_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
2583{
2584	ccv_cnnp_model_layer_norm_t* const self = (ccv_cnnp_model_layer_norm_t*)super;
2585	if (self->scale.graph)
2586		add_to_array(parameters, self->scale, is_trainable);
2587	if (self->bias.graph)
2588		add_to_array(parameters, self->bias, is_trainable);
2589}
2590 
2591static ccv_cnnp_model_t* _ccv_cnnp_layer_norm_copy(const ccv_cnnp_model_t* const super, void* const context);
2592 
2593static const ccv_cnnp_model_vtab_t ccv_cnnp_layer_norm_isa = {
2594	.build = _ccv_cnnp_layer_norm_build,
2595	.init_states = _ccv_cnnp_layer_norm_init_states,
2596	.add_to_parameter = _ccv_cnnp_layer_norm_add_to_parameter,
2597	.copy = _ccv_cnnp_layer_norm_copy,
2598};
2599 
2600ccv_cnnp_model_t* ccv_cnnp_layer_norm(const float epsilon, const int axis[CCV_NNC_MAX_DIM_ALLOC(12)], const int axis_count, const int elementwise_affine, const int is_trainable, const char* const name)
2601{
2602	ccv_cnnp_model_layer_norm_t* const model_layer_norm = (ccv_cnnp_model_layer_norm_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_layer_norm_t));
2603	model_layer_norm->super.isa = &ccv_cnnp_layer_norm_isa;
2604	model_layer_norm->super.input_size = 1;
2605	model_layer_norm->super.outputs = &model_layer_norm->output;
2606	model_layer_norm->super.output_size = 1;
2607	model_layer_norm->super.is_trainable = is_trainable;
2608	ccv_cnnp_model_copy_name(&model_layer_norm->super, name);
2609	model_layer_norm->scale.d = CCV_NNC_NO_TENSOR_SYMBOL;
2610	model_layer_norm->scale.graph = 0;
2611	model_layer_norm->bias.d = CCV_NNC_NO_TENSOR_SYMBOL;
2612	model_layer_norm->bias.graph = 0;
2613	model_layer_norm->params.lnorm.epsilon = epsilon;
2614	model_layer_norm->params.lnorm.count = axis_count;
2615	model_layer_norm->params.lnorm.elementwise_affine = elementwise_affine;
2616	memcpy(model_layer_norm->params.lnorm.axis, axis, sizeof(int) * axis_count);
2617	return (ccv_cnnp_model_t*)model_layer_norm;
2618}
2619 
2620static ccv_cnnp_model_t* _ccv_cnnp_layer_norm_copy(const ccv_cnnp_model_t* const super, void* const context)
2621{
2622	const ccv_cnnp_model_layer_norm_t* const self = (const ccv_cnnp_model_layer_norm_t*)super;
2623	return ccv_cnnp_layer_norm(self->params.lnorm.epsilon, self->params.lnorm.axis, self->params.lnorm.count, self->params.lnorm.elementwise_affine, self->super.is_trainable, self->super.name);
2624}
2625 
2626// MARK - Group Norm Layer
2627 
2628typedef struct {
2629	ccv_cnnp_model_t super;
2630	ccv_nnc_tensor_symbol_t output;
2631	ccv_nnc_tensor_symbol_t bias;
2632	ccv_nnc_tensor_symbol_t scale;
2633	ccv_nnc_cmd_param_t params;
2634} ccv_cnnp_model_group_norm_t;
2635 
2636static void _ccv_cnnp_group_norm_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2637{
2638	PRINT(CCV_CLI_VERBOSE, "[cnnp_group_norm_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_group_norm_build] -\n"); fflush(stdout); } }
 while (0);
2639	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2639, __extension__ __PRETTY_FUNCTION__); }));
2640	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2640, __extension__ __PRETTY_FUNCTION__
); }));
2641	ccv_cnnp_model_group_norm_t* const self = (ccv_cnnp_model_group_norm_t*)super;
2642	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2643	ccv_nnc_tensor_param_t bias_params = params;
2644	const int nd = ccv_nnc_tensor_nd(params.dim);
2645	int i;
2646	for (i = 0; i < nd; i++)
2647		bias_params.dim[i] = 1;
2648	bias_params.dim[self->params.gnorm.group_axis] = params.dim[self->params.gnorm.group_axis];
2649	if (self->params.gnorm.elementwise_affine)
2650	{
2651		// Both scale and bias are shared between if this model is reused.
2652		if (!self->scale.graph)
2653			self->scale = ccv_nnc_tensor_symbol_new(graph, bias_params, "scale");
2654		if (!self->bias.graph)
2655			self->bias = ccv_nnc_tensor_symbol_new(graph, bias_params, "bias");
2656	}
2657	const ccv_nnc_cmd_t group_norm = ccv_nnc_cmd(CCV_NNC_GROUP_NORM_FORWARD, 0, self->params, 0);
2658	ccv_nnc_tensor_param_t output_params[3];
2659	if (self->params.gnorm.elementwise_affine)
2660		ccv_nnc_hint_tensor_auto(group_norm, (ccv_nnc_tensor_param_t []){
2661				params,
2662				bias_params,
2663				bias_params,
2664			}, 3, ccv_nnc_no_hint, output_params, 3);
2665	else
2666		ccv_nnc_hint_tensor_auto(group_norm, (ccv_nnc_tensor_param_t []){
2667				params,
2668			}, 1, ccv_nnc_no_hint, output_params, 3);
2669	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params[0], 0);
2670	const ccv_nnc_tensor_symbol_t saved_mean = ccv_nnc_tensor_symbol_new(graph, output_params[1], "saved_mean");
2671	const ccv_nnc_tensor_symbol_t saved_inv_std = ccv_nnc_tensor_symbol_new(graph, output_params[2], "saved_inv_std");
2672	if (self->params.gnorm.elementwise_affine)
2673		ccv_nnc_graph_exec_symbol_new(graph, group_norm, TENSOR_SYMBOL_LIST(inputs[0], self->scale, self->bias)(const ccv_nnc_tensor_symbol_t []){inputs[0], self->scale,
 self->bias}, (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output, saved_mean, saved_inv_std)(const ccv_nnc_tensor_symbol_t []){output, saved_mean, saved_inv_std
}, (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 -1), "group_norm");
2674	else
2675		ccv_nnc_graph_exec_symbol_new(graph, group_norm, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output, saved_mean, saved_inv_std)(const ccv_nnc_tensor_symbol_t []){output, saved_mean, saved_inv_std
}, (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 -1), "group_norm");
2676	outputs[0] = output;
2677}
2678 
2679static void _ccv_cnnp_group_norm_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
2680{
2681	ccv_cnnp_model_group_norm_t* const self = (ccv_cnnp_model_group_norm_t*)super;
2682	if (self->scale.graph)
2683		initializer(context, CMD_SET_FORWARD(1)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={1,}}}, 0), ccv_nnc_no_hint, 0, 0, self->scale);
2684	if (self->bias.graph)
2685		initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, self->bias);
2686}
2687 
2688static void _ccv_cnnp_group_norm_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
2689{
2690	ccv_cnnp_model_group_norm_t* const self = (ccv_cnnp_model_group_norm_t*)super;
2691	if (self->scale.graph)
2692		add_to_array(parameters, self->scale, is_trainable);
2693	if (self->bias.graph)
2694		add_to_array(parameters, self->bias, is_trainable);
2695}
2696 
2697static ccv_cnnp_model_t* _ccv_cnnp_group_norm_copy(const ccv_cnnp_model_t* const super, void* const context);
2698 
2699static const ccv_cnnp_model_vtab_t ccv_cnnp_group_norm_isa = {
2700	.build = _ccv_cnnp_group_norm_build,
2701	.init_states = _ccv_cnnp_group_norm_init_states,
2702	.add_to_parameter = _ccv_cnnp_group_norm_add_to_parameter,
2703	.copy = _ccv_cnnp_group_norm_copy,
2704};
2705 
2706ccv_cnnp_model_t* ccv_cnnp_group_norm(const int group_axis, const int groups, const float epsilon, const int reduce_axis[CCV_NNC_MAX_DIM_ALLOC(12)], const int axis_count, const int elementwise_affine, const int is_trainable, const char* const name)
2707{
2708	ccv_cnnp_model_group_norm_t* const model_group_norm = (ccv_cnnp_model_group_norm_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_group_norm_t));
2709	model_group_norm->super.isa = &ccv_cnnp_group_norm_isa;
2710	model_group_norm->super.input_size = 1;
2711	model_group_norm->super.outputs = &model_group_norm->output;
2712	model_group_norm->super.output_size = 1;
2713	model_group_norm->super.is_trainable = is_trainable;
2714	ccv_cnnp_model_copy_name(&model_group_norm->super, name);
2715	model_group_norm->scale.d = CCV_NNC_NO_TENSOR_SYMBOL;
2716	model_group_norm->scale.graph = 0;
2717	model_group_norm->bias.d = CCV_NNC_NO_TENSOR_SYMBOL;
2718	model_group_norm->bias.graph = 0;
2719	model_group_norm->params.gnorm.group_axis = group_axis;
2720	model_group_norm->params.gnorm.groups = groups;
2721	model_group_norm->params.gnorm.epsilon = epsilon;
2722	model_group_norm->params.gnorm.reduce_count = axis_count;
2723	model_group_norm->params.gnorm.elementwise_affine = elementwise_affine;
2724	memcpy(model_group_norm->params.gnorm.reduce_axis, reduce_axis, sizeof(int) * axis_count);
2725	return (ccv_cnnp_model_t*)model_group_norm;
2726}
2727 
2728static ccv_cnnp_model_t* _ccv_cnnp_group_norm_copy(const ccv_cnnp_model_t* const super, void* const context)
2729{
2730	const ccv_cnnp_model_group_norm_t* const self = (const ccv_cnnp_model_group_norm_t*)super;
2731	return ccv_cnnp_group_norm(self->params.gnorm.group_axis, self->params.gnorm.groups, self->params.gnorm.epsilon, self->params.gnorm.reduce_axis, self->params.gnorm.reduce_count, self->params.gnorm.elementwise_affine, self->super.is_trainable, self->super.name);
2732}
2733 
2734// MARK - RMSNorm Layer
2735 
2736typedef struct {
2737	ccv_cnnp_model_t super;
2738	ccv_nnc_tensor_symbol_t output;
2739	ccv_nnc_tensor_symbol_t scale;
2740	ccv_nnc_cmd_param_t params;
2741} ccv_cnnp_model_rmsnorm_t;
2742 
2743static void _ccv_cnnp_rmsnorm_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2744{
2745	PRINT(CCV_CLI_VERBOSE, "[cnnp_rmsnorm_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_rmsnorm_build] -\n"); fflush(stdout); } } while
 (0);
2746	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2746, __extension__ __PRETTY_FUNCTION__); }));
2747	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2747, __extension__ __PRETTY_FUNCTION__
); }));
2748	ccv_cnnp_model_rmsnorm_t* const self = (ccv_cnnp_model_rmsnorm_t*)super;
2749	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2750	ccv_nnc_tensor_param_t scale_params = params;
2751	const int nd = ccv_nnc_tensor_nd(params.dim);
2752	int i;
2753	for (i = 0; i < nd; i++)
2754		scale_params.dim[i] = 1;
2755	for (i = 0; i < self->params.rmsnorm.count; i++)
2756		scale_params.dim[self->params.rmsnorm.axis[i]] = params.dim[self->params.rmsnorm.axis[i]];
2757	// Both scale and bias are shared between if this model is reused.
2758	if (self->params.rmsnorm.elementwise_affine)
2759	{
2760		if (!self->scale.graph)
2761			self->scale = ccv_nnc_tensor_symbol_new(graph, scale_params, "scale");
2762	}
2763	const ccv_nnc_cmd_t rmsnorm = ccv_nnc_cmd(CCV_NNC_RMSNORM_FORWARD, 0, self->params, 0);
2764	ccv_nnc_tensor_param_t output_params[2];
2765	if (self->params.rmsnorm.elementwise_affine)
2766		ccv_nnc_hint_tensor_auto(rmsnorm, (ccv_nnc_tensor_param_t []){
2767				params,
2768				scale_params,
2769			}, 2, ccv_nnc_no_hint, output_params, 2);
2770	else
2771		ccv_nnc_hint_tensor_auto(rmsnorm, (ccv_nnc_tensor_param_t []){
2772				params,
2773			}, 1, ccv_nnc_no_hint, output_params, 2);
2774	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params[0], 0);
2775	const ccv_nnc_tensor_symbol_t saved_inv_std = ccv_nnc_tensor_symbol_new(graph, output_params[1], "saved_inv_std");
2776	if (self->params.rmsnorm.elementwise_affine)
2777		ccv_nnc_graph_exec_symbol_new(graph, rmsnorm, TENSOR_SYMBOL_LIST(inputs[0], self->scale)(const ccv_nnc_tensor_symbol_t []){inputs[0], self->scale}
, (1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output, saved_inv_std)(const ccv_nnc_tensor_symbol_t []){output, saved_inv_std}, (1
 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 -1), "rmsnorm");
2778	else
2779		ccv_nnc_graph_exec_symbol_new(graph, rmsnorm, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output, saved_inv_std)(const ccv_nnc_tensor_symbol_t []){output, saved_inv_std}, (1
 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 -1), "rmsnorm");
2780	outputs[0] = output;
2781}
2782 
2783static void _ccv_cnnp_rmsnorm_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
2784{
2785	ccv_cnnp_model_rmsnorm_t* const self = (ccv_cnnp_model_rmsnorm_t*)super;
2786	if (self->scale.graph)
2787		initializer(context, CMD_SET_FORWARD(1)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={1,}}}, 0), ccv_nnc_no_hint, 0, 0, self->scale);
2788}
2789 
2790static void _ccv_cnnp_rmsnorm_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
2791{
2792	ccv_cnnp_model_rmsnorm_t* const self = (ccv_cnnp_model_rmsnorm_t*)super;
2793	if (self->scale.graph)
2794		add_to_array(parameters, self->scale, is_trainable);
2795}
2796 
2797static ccv_cnnp_model_t* _ccv_cnnp_rmsnorm_copy(const ccv_cnnp_model_t* const super, void* const context);
2798 
2799static const ccv_cnnp_model_vtab_t ccv_cnnp_rmsnorm_isa = {
2800	.build = _ccv_cnnp_rmsnorm_build,
2801	.init_states = _ccv_cnnp_rmsnorm_init_states,
2802	.add_to_parameter = _ccv_cnnp_rmsnorm_add_to_parameter,
2803	.copy = _ccv_cnnp_rmsnorm_copy,
2804};
2805 
2806ccv_cnnp_model_t* ccv_cnnp_rmsnorm(const float epsilon, const int axis[CCV_NNC_MAX_DIM_ALLOC(12)], const int axis_count, const int elementwise_affine, const int is_trainable, const char* const name)
2807{
2808	ccv_cnnp_model_rmsnorm_t* const model_rmsnorm = (ccv_cnnp_model_rmsnorm_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_rmsnorm_t));
2809	model_rmsnorm->super.isa = &ccv_cnnp_rmsnorm_isa;
2810	model_rmsnorm->super.input_size = 1;
2811	model_rmsnorm->super.outputs = &model_rmsnorm->output;
2812	model_rmsnorm->super.output_size = 1;
2813	model_rmsnorm->super.is_trainable = is_trainable;
2814	ccv_cnnp_model_copy_name(&model_rmsnorm->super, name);
2815	model_rmsnorm->scale.d = CCV_NNC_NO_TENSOR_SYMBOL;
2816	model_rmsnorm->scale.graph = 0;
2817	model_rmsnorm->params.rmsnorm.epsilon = epsilon;
2818	model_rmsnorm->params.rmsnorm.count = axis_count;
2819	model_rmsnorm->params.rmsnorm.elementwise_affine = elementwise_affine;
2820	memcpy(model_rmsnorm->params.lnorm.axis, axis, sizeof(int) * axis_count);
2821	return (ccv_cnnp_model_t*)model_rmsnorm;
2822}
2823 
2824static ccv_cnnp_model_t* _ccv_cnnp_rmsnorm_copy(const ccv_cnnp_model_t* const super, void* const context)
2825{
2826	const ccv_cnnp_model_rmsnorm_t* const self = (const ccv_cnnp_model_rmsnorm_t*)super;
2827	return ccv_cnnp_rmsnorm(self->params.rmsnorm.epsilon, self->params.rmsnorm.axis, self->params.rmsnorm.count, self->params.rmsnorm.elementwise_affine, self->super.is_trainable, self->super.name);
2828}
2829 
2830// MARK - Batched Matrix Mul Layer
2831 
2832typedef struct {
2833	ccv_cnnp_model_t super;
2834	ccv_nnc_tensor_symbol_t output;
2835	int transpose_a[2];
2836	int transpose_b[2];
2837	int flags;
2838} ccv_cnnp_model_matmul_t;
2839 
2840static void _ccv_cnnp_matmul_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2841{
2842	PRINT(CCV_CLI_VERBOSE, "[cnnp_matmul_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_matmul_build] -\n"); fflush(stdout); } } while
 (0);
2843	assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 2843, __extension__ __PRETTY_FUNCTION__); }));
2844	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2844, __extension__ __PRETTY_FUNCTION__
); }));
2845	ccv_cnnp_model_matmul_t* const self = (ccv_cnnp_model_matmul_t*)super;
2846	ccv_nnc_tensor_param_t a_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2847	ccv_nnc_tensor_param_t b_params = ccv_nnc_tensor_symbol_params(graph, inputs[1]);
2848	ccv_nnc_tensor_param_t output_params;
2849	ccv_nnc_cmd_t matmul = CMD_GEMM_FORWARD(self->transpose_a, self->transpose_b)ccv_nnc_cmd(CCV_NNC_GEMM_FORWARD, 0, ((ccv_nnc_cmd_param_t){.
size={.dim={1,1,1}},.blas={.a={1,1},.transpose_a={self->transpose_a
[0],self->transpose_a[1]},.transpose_b={self->transpose_b
[0],self->transpose_b[1]},}}), 0);
2850	matmul.info.blas.flags = self->flags;
2851	ccv_nnc_hint_tensor_auto(matmul, (ccv_nnc_tensor_param_t []){
2852			a_params,
2853			b_params,
2854		}, 2, ccv_nnc_no_hint, &output_params, 1);
2855	const ccv_nnc_tensor_symbol_t matmul_output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
2856	ccv_nnc_graph_exec_symbol_new(graph, matmul, inputs, input_size, TENSOR_SYMBOL_LIST(matmul_output)(const ccv_nnc_tensor_symbol_t []){matmul_output}, (1 +1 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1
), "matmul");
2857	outputs[0] = matmul_output;
2858}
2859 
2860static ccv_cnnp_model_t* _ccv_cnnp_matmul_copy(const ccv_cnnp_model_t* const super, void* const context);
2861 
2862static const ccv_cnnp_model_vtab_t ccv_cnnp_matmul_isa = {
2863	.build = _ccv_cnnp_matmul_build,
2864	.copy = _ccv_cnnp_matmul_copy,
2865};
2866 
2867ccv_cnnp_model_t* ccv_cnnp_matmul(const int transpose_a[2], const int transpose_b[2], const int flags, const char* const name)
2868{
2869	ccv_cnnp_model_matmul_t* const model_matmul = (ccv_cnnp_model_matmul_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_matmul_t));
2870	model_matmul->super.isa = &ccv_cnnp_matmul_isa;
2871	model_matmul->super.input_size = 2;
2872	model_matmul->super.outputs = &model_matmul->output;
2873	model_matmul->super.output_size = 1;
2874	model_matmul->transpose_a[0] = transpose_a[0];
2875	model_matmul->transpose_a[1] = transpose_a[1];
2876	model_matmul->transpose_b[0] = transpose_b[0];
2877	model_matmul->transpose_b[1] = transpose_b[1];
2878	model_matmul->flags = flags;
2879	ccv_cnnp_model_copy_name(&model_matmul->super, name);
2880	return (ccv_cnnp_model_t*)model_matmul;
2881}
2882 
2883static ccv_cnnp_model_t* _ccv_cnnp_matmul_copy(const ccv_cnnp_model_t* const super, void* const context)
2884{
2885	const ccv_cnnp_model_matmul_t* const self = (const ccv_cnnp_model_matmul_t*)super;
2886	return ccv_cnnp_matmul(self->transpose_a, self->transpose_b, self->flags, self->super.name);
2887}
2888 
2889// MARK - Dropout Layer
2890 
2891typedef struct {
2892	ccv_cnnp_model_t super;
2893	ccv_nnc_tensor_symbol_t output;
2894	ccv_nnc_graph_exec_symbol_t dropout;
2895	float p;
2896	int entirety;
2897} ccv_cnnp_model_dropout_t;
2898 
2899static void _ccv_cnnp_dropout_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2900{
2901	PRINT(CCV_CLI_VERBOSE, "[cnnp_dropout_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_dropout_build] -\n"); fflush(stdout); } } while
 (0);
2902	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 2902, __extension__ __PRETTY_FUNCTION__); }));
2903	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2903, __extension__ __PRETTY_FUNCTION__
); }));
2904	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2905	ccv_nnc_tensor_param_t output_params[2];
2906	ccv_cnnp_model_dropout_t* const self = (ccv_cnnp_model_dropout_t*)super;
2907	const ccv_nnc_cmd_t dropout = CMD_DROPOUT_FORWARD(self->p, self->entirety)ccv_nnc_cmd(CCV_NNC_DROPOUT_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.dropout={.p=self->p,.entirety=self
->entirety}}), 0);
2908	ccv_nnc_hint_tensor_auto(dropout, (ccv_nnc_tensor_param_t []){
2909			params,
2910		}, 1, ccv_nnc_no_hint, output_params, 2);
2911	const ccv_nnc_tensor_symbol_t dropout_output = ccv_nnc_tensor_symbol_new(graph, output_params[0], 0);
2912	const ccv_nnc_tensor_symbol_t mask = ccv_nnc_tensor_symbol_new(graph, output_params[1], "mask");
2913	self->dropout = ccv_nnc_graph_exec_symbol_new(graph, dropout, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(dropout_output, mask)(const ccv_nnc_tensor_symbol_t []){dropout_output, mask}, (1 +
1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 -1), "dropout");
2914	outputs[0] = dropout_output;
2915}
2916 
2917static void _ccv_cnnp_dropout_set_is_test(ccv_cnnp_model_t* const super, const int is_test, const ccv_cnnp_cmd_updater_f updater, void* const context)
2918{
2919	ccv_cnnp_model_dropout_t* const self = (ccv_cnnp_model_dropout_t*)super;
2920	if (self->dropout.graph)
2921	{
2922		if (is_test)
2923			// During test, the dropout is not applied. Data transfer is perfect because if these are the same tensor, it will skip.
2924			updater(context, self->dropout, CMD_DATA_TRANSFER_FORWARD()ccv_nnc_cmd(CCV_NNC_DATA_TRANSFER_FORWARD, 0, ccv_nnc_cmd_auto
, 0), ccv_nnc_no_hint);
2925		else
2926			updater(context, self->dropout, CMD_DROPOUT_FORWARD(self->p, self->entirety)ccv_nnc_cmd(CCV_NNC_DROPOUT_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.dropout={.p=self->p,.entirety=self
->entirety}}), 0), ccv_nnc_no_hint);
2927	}
2928}
2929 
2930static ccv_cnnp_model_t* _ccv_cnnp_dropout_copy(const ccv_cnnp_model_t* const super, void* const context);
2931 
2932static const ccv_cnnp_model_vtab_t ccv_cnnp_dropout_isa = {
2933	.build = _ccv_cnnp_dropout_build,
2934	.set_is_test = _ccv_cnnp_dropout_set_is_test,
2935	.copy = _ccv_cnnp_dropout_copy,
2936};
2937 
2938ccv_cnnp_model_t* ccv_cnnp_dropout(const float p, const int entirety, const char* const name)
2939{
2940	ccv_cnnp_model_dropout_t* const model_dropout = (ccv_cnnp_model_dropout_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_dropout_t));
2941	model_dropout->super.isa = &ccv_cnnp_dropout_isa;
2942	model_dropout->super.input_size = 1;
2943	model_dropout->super.outputs = &model_dropout->output;
2944	model_dropout->super.output_size = 1;
2945	model_dropout->p = p;
2946	model_dropout->entirety = entirety;
2947	ccv_cnnp_model_copy_name(&model_dropout->super, name);
2948	return (ccv_cnnp_model_t*)model_dropout;
2949}
2950 
2951static ccv_cnnp_model_t* _ccv_cnnp_dropout_copy(const ccv_cnnp_model_t* const super, void* const context)
2952{
2953	const ccv_cnnp_model_dropout_t* const self = (const ccv_cnnp_model_dropout_t*)super;
2954	return ccv_cnnp_dropout(self->p, self->entirety, self->super.name);
2955}
2956 
2957// MARK - Masked Fill Layer
2958 
2959typedef struct {
2960	ccv_cnnp_model_t super;
2961	ccv_nnc_tensor_symbol_t output;
2962	float eq;
2963	float fill;
2964} ccv_cnnp_model_masked_fill_t;
2965 
2966static void _ccv_cnnp_masked_fill_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
2967{
2968	PRINT(CCV_CLI_VERBOSE, "[cnnp_masked_fill_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_masked_fill_build] -\n"); fflush(stdout); } }
 while (0);
2969	assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 2969, __extension__ __PRETTY_FUNCTION__); }));
2970	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 2970, __extension__ __PRETTY_FUNCTION__
); }));
2971	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
2972	ccv_cnnp_model_masked_fill_t* const self = (ccv_cnnp_model_masked_fill_t*)super;
2973	const ccv_nnc_tensor_symbol_t masked_fill_output = ccv_nnc_tensor_symbol_new(graph, params, 0);
2974	ccv_nnc_graph_exec_symbol_new(graph, CMD_MASKED_FILL_FORWARD(self->eq, self->fill)ccv_nnc_cmd(CCV_NNC_MASKED_FILL_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={self->eq, self->fill}
}}, 0), TENSOR_SYMBOL_LIST(inputs[0], inputs[1])(const ccv_nnc_tensor_symbol_t []){inputs[0], inputs[1]}, (1 +
1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 -1), TENSOR_SYMBOL_LIST(masked_fill_output)(const ccv_nnc_tensor_symbol_t []){masked_fill_output}, (1 +1
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 -1), "masked_fill");
2975	outputs[0] = masked_fill_output;
2976}
2977 
2978static ccv_cnnp_model_t* _ccv_cnnp_masked_fill_copy(const ccv_cnnp_model_t* const super, void* const context);
2979 
2980static const ccv_cnnp_model_vtab_t ccv_cnnp_masked_fill_isa = {
2981	.build = _ccv_cnnp_masked_fill_build,
2982	.copy = _ccv_cnnp_masked_fill_copy,
2983};
2984 
2985ccv_cnnp_model_t* ccv_cnnp_masked_fill(const float eq, const float fill, const char* const name)
2986{
2987	ccv_cnnp_model_masked_fill_t* const model_masked_fill = (ccv_cnnp_model_masked_fill_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_masked_fill_t));
2988	model_masked_fill->super.isa = &ccv_cnnp_masked_fill_isa;
2989	model_masked_fill->super.input_size = 2;
2990	model_masked_fill->super.outputs = &model_masked_fill->output;
2991	model_masked_fill->super.output_size = 1;
2992	model_masked_fill->eq = eq;
2993	model_masked_fill->fill = fill;
2994	ccv_cnnp_model_copy_name(&model_masked_fill->super, name);
2995	return (ccv_cnnp_model_t*)model_masked_fill;
2996}
2997 
2998static ccv_cnnp_model_t* _ccv_cnnp_masked_fill_copy(const ccv_cnnp_model_t* const super, void* const context)
2999{
3000	const ccv_cnnp_model_masked_fill_t* const self = (const ccv_cnnp_model_masked_fill_t*)super;
3001	return ccv_cnnp_masked_fill(self->eq, self->fill, self->super.name);
3002}
3003 
3004// MARK - Index Select Layer
3005 
3006typedef struct {
3007	ccv_cnnp_model_t super;
3008	ccv_nnc_tensor_symbol_t output;
3009} ccv_cnnp_model_index_select_t;
3010 
3011static void _ccv_cnnp_index_select_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3012{
3013	PRINT(CCV_CLI_VERBOSE, "[cnnp_index_select_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_index_select_build] -\n"); fflush(stdout); }
 } while (0);
3014	assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 3014, __extension__ __PRETTY_FUNCTION__); }));
3015	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3015, __extension__ __PRETTY_FUNCTION__
); }));
3016	const ccv_nnc_tensor_param_t vocab_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3017	const ccv_nnc_tensor_param_t index_params = ccv_nnc_tensor_symbol_params(graph, inputs[1]);
3018	ccv_nnc_tensor_param_t output_params;
3019	const ccv_nnc_cmd_t index_select = CMD_INDEX_SELECT_FORWARD()ccv_nnc_cmd(CCV_NNC_INDEX_SELECT_FORWARD, 0, ccv_nnc_cmd_auto
, 0);
3020	ccv_nnc_hint_tensor_auto(index_select, (ccv_nnc_tensor_param_t []){
3021			vocab_params,
3022			index_params,
3023		}, 2, ccv_nnc_no_hint, &output_params, 1);
3024	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3025	ccv_nnc_graph_exec_symbol_new(graph, index_select, TENSOR_SYMBOL_LIST(inputs[0], inputs[1])(const ccv_nnc_tensor_symbol_t []){inputs[0], inputs[1]}, (1 +
1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "index_select");
3026	outputs[0] = output;
3027}
3028 
3029static ccv_cnnp_model_t* _ccv_cnnp_index_select_copy(const ccv_cnnp_model_t* const super, void* const context);
3030 
3031static const ccv_cnnp_model_vtab_t ccv_cnnp_index_select_isa = {
3032	.build = _ccv_cnnp_index_select_build,
3033	.copy = _ccv_cnnp_index_select_copy,
3034};
3035 
3036ccv_cnnp_model_t* ccv_cnnp_index_select(const char* const name)
3037{
3038	ccv_cnnp_model_index_select_t* const model_index_select = (ccv_cnnp_model_index_select_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_index_select_t));
3039	model_index_select->super.isa = &ccv_cnnp_index_select_isa;
3040	model_index_select->super.input_size = 2;
3041	model_index_select->super.outputs = &model_index_select->output;
3042	model_index_select->super.output_size = 1;
3043	ccv_cnnp_model_copy_name(&model_index_select->super, name);
3044	return (ccv_cnnp_model_t*)model_index_select;
3045}
3046 
3047static ccv_cnnp_model_t* _ccv_cnnp_index_select_copy(const ccv_cnnp_model_t* const super, void* const context)
3048{
3049	ccv_cnnp_model_index_select_t* const self = (ccv_cnnp_model_index_select_t*)super;
3050	return ccv_cnnp_index_select(self->super.name);
3051}
3052 
3053// MARK - Embedding Layer
3054 
3055typedef struct {
3056	ccv_cnnp_model_t super;
3057	ccv_nnc_tensor_symbol_t output;
3058	ccv_nnc_tensor_symbol_t vocab;
3059	int datatype;
3060	int vocab_size;
3061	int embed_size;
3062} ccv_cnnp_model_embedding_t;
3063 
3064static void _ccv_cnnp_embedding_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3065{
3066	ccv_cnnp_model_embedding_t* const self = (ccv_cnnp_model_embedding_t*)super;
3067	PRINT(CCV_CLI_VERBOSE, "[cnnp_embedding_build] vocab_size: %d, embed_size: %d\n", self->vocab_size, self->embed_size)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_embedding_build] vocab_size: %d, embed_size: %d\n"
, self->vocab_size, self->embed_size); fflush(stdout); }
 } while (0);
3068	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 3068, __extension__ __PRETTY_FUNCTION__); }));
3069	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3069, __extension__ __PRETTY_FUNCTION__
); }));
3070	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3071	ccv_nnc_tensor_param_t vocab_params = params;
3072	memset(vocab_params.dim, 0, sizeof(vocab_params.dim));
3073	vocab_params.datatype = self->datatype;
3074	vocab_params.dim[0] = self->vocab_size;
3075	vocab_params.dim[1] = self->embed_size;
3076	if (!self->vocab.graph)
3077		self->vocab = ccv_nnc_tensor_symbol_new(graph, vocab_params, "vocab");
3078	assert(self->vocab.graph == graph)((void) sizeof ((self->vocab.graph == graph) ? 1 : 0), __extension__
 ({ if (self->vocab.graph == graph) ; else __assert_fail (
"self->vocab.graph == graph", "ccv_cnnp_model_addons.c", 3078
, __extension__ __PRETTY_FUNCTION__); }));
3079	ccv_nnc_tensor_param_t output_params;
3080	const ccv_nnc_cmd_t embedding = CMD_INDEX_SELECT_FORWARD()ccv_nnc_cmd(CCV_NNC_INDEX_SELECT_FORWARD, 0, ccv_nnc_cmd_auto
, 0);
3081	ccv_nnc_hint_tensor_auto(embedding, (ccv_nnc_tensor_param_t []){
3082			vocab_params,
3083			params,
3084		}, 2, ccv_nnc_no_hint, &output_params, 1);
3085	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3086	ccv_nnc_graph_exec_symbol_new(graph, embedding, TENSOR_SYMBOL_LIST(self->vocab, inputs[0])(const ccv_nnc_tensor_symbol_t []){self->vocab, inputs[0]}
, (1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "embedding");
3087	outputs[0] = output;
3088}
3089 
3090static void _ccv_cnnp_embedding_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
3091{
3092	ccv_cnnp_model_embedding_t* const self = (ccv_cnnp_model_embedding_t*)super;
3093	const float std = sqrtf(2) / sqrtf(self->vocab_size + self->embed_size);
3094	const float bound = sqrtf(3) * std;
3095	initializer(context, CMD_RANDOM_UNIFORM_FORWARD(-bound, bound)ccv_nnc_cmd(CCV_NNC_RANDOM_UNIFORM_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={-bound, bound}}}, 0), ccv_nnc_no_hint, 0, 0, self->vocab);
3096}
3097 
3098static void _ccv_cnnp_embedding_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
3099{
3100	ccv_cnnp_model_embedding_t* const self = (ccv_cnnp_model_embedding_t*)super;
3101	add_to_array(parameters, self->vocab, is_trainable);
3102}
3103 
3104static ccv_cnnp_model_t* _ccv_cnnp_embedding_copy(const ccv_cnnp_model_t* const super, void* const context);
3105 
3106static const ccv_cnnp_model_vtab_t ccv_cnnp_embedding_isa = {
3107	.build = _ccv_cnnp_embedding_build,
3108	.init_states = _ccv_cnnp_embedding_init_states,
3109	.add_to_parameter = _ccv_cnnp_embedding_add_to_parameter,
3110	.copy = _ccv_cnnp_embedding_copy,
3111};
3112 
3113ccv_cnnp_model_t* ccv_cnnp_embedding(const int datatype, const int vocab_size, const int embed_size, const int is_trainable, const char* const name)
3114{
3115	ccv_cnnp_model_embedding_t* const model_embedding = (ccv_cnnp_model_embedding_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_embedding_t));
3116	model_embedding->super.isa = &ccv_cnnp_embedding_isa;
3117	model_embedding->super.input_size = 1;
3118	model_embedding->super.outputs = &model_embedding->output;
3119	model_embedding->super.output_size = 1;
3120	model_embedding->super.is_trainable = is_trainable;
3121	ccv_cnnp_model_copy_name(&model_embedding->super, name);
3122	model_embedding->vocab.d = CCV_NNC_NO_TENSOR_SYMBOL;
3123	model_embedding->vocab.graph = 0;
3124	assert(datatype == CCV_32F || datatype == CCV_16F || datatype == CCV_16BF)((void) sizeof ((datatype == CCV_32F || datatype == CCV_16F ||
 datatype == CCV_16BF) ? 1 : 0), __extension__ ({ if (datatype
 == CCV_32F || datatype == CCV_16F || datatype == CCV_16BF) ;
 else __assert_fail ("datatype == CCV_32F || datatype == CCV_16F || datatype == CCV_16BF"
, "ccv_cnnp_model_addons.c", 3124, __extension__ __PRETTY_FUNCTION__
); }));
3125	model_embedding->datatype = datatype;
3126	assert(vocab_size > 0)((void) sizeof ((vocab_size > 0) ? 1 : 0), __extension__ (
{ if (vocab_size > 0) ; else __assert_fail ("vocab_size > 0"
, "ccv_cnnp_model_addons.c", 3126, __extension__ __PRETTY_FUNCTION__
); }));
3127	model_embedding->vocab_size = vocab_size;
3128	assert(embed_size > 0)((void) sizeof ((embed_size > 0) ? 1 : 0), __extension__ (
{ if (embed_size > 0) ; else __assert_fail ("embed_size > 0"
, "ccv_cnnp_model_addons.c", 3128, __extension__ __PRETTY_FUNCTION__
); }));
3129	model_embedding->embed_size = embed_size;
3130	return (ccv_cnnp_model_t*)model_embedding;
3131}
3132 
3133static ccv_cnnp_model_t* _ccv_cnnp_embedding_copy(const ccv_cnnp_model_t* const super, void* const context)
3134{
3135	ccv_cnnp_model_embedding_t* const self = (ccv_cnnp_model_embedding_t*)super;
3136	return ccv_cnnp_embedding(self->datatype, self->vocab_size, self->embed_size, self->super.is_trainable, self->super.name);
3137}
3138 
3139// MARK - Pool Layers
3140 
3141typedef struct {
3142	ccv_cnnp_model_t super;
3143	ccv_nnc_tensor_symbol_t output;
3144	int type;
3145	float width_scale;
3146	float height_scale;
3147	int align_corners;
3148} ccv_cnnp_model_upsample_t;
3149 
3150static void _ccv_cnnp_upsample_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3151{
3152	PRINT(CCV_CLI_VERBOSE, "[cnnp_upsample_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_upsample_build] -\n"); fflush(stdout); } } while
 (0);
3153	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 3153, __extension__ __PRETTY_FUNCTION__); }));
3154	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3154, __extension__ __PRETTY_FUNCTION__
); }));
3155	ccv_cnnp_model_upsample_t* const self = (ccv_cnnp_model_upsample_t*)super;
3156	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3157	ccv_nnc_cmd_t cmd = CMD_UPSAMPLE_FORWARD(self->type, self->width_scale, self->height_scale, self->align_corners)ccv_nnc_cmd(CCV_NNC_UPSAMPLE_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.upsample={.type=self->type,.width_scale
=self->width_scale,.height_scale=self->height_scale,.align_corners
=self->align_corners}}), 0);
3158	ccv_nnc_tensor_param_t output_params;
3159	ccv_nnc_hint_tensor_auto(cmd, &params, 1, ccv_nnc_no_hint, &output_params, 1);
3160	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3161	ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0])(const ccv_nnc_tensor_symbol_t []){inputs[0]}, (1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "upsample");
3162	outputs[0] = output;
3163}
3164 
3165static ccv_cnnp_model_t* _ccv_cnnp_upsample_copy(const ccv_cnnp_model_t* const super, void* const context);
3166 
3167static const ccv_cnnp_model_vtab_t ccv_cnnp_upsample_isa = {
3168	.build = _ccv_cnnp_upsample_build,
3169	.copy = _ccv_cnnp_upsample_copy,
3170};
3171 
3172ccv_cnnp_model_t* ccv_cnnp_upsample(const int type, const float width_scale, const float height_scale, const int align_corners, const char* const name)
3173{
3174	ccv_cnnp_model_upsample_t* const model_upsample = (ccv_cnnp_model_upsample_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_upsample_t));
3175	model_upsample->super.isa = &ccv_cnnp_upsample_isa;
3176	model_upsample->super.input_size = 1;
3177	model_upsample->super.outputs = &model_upsample->output;
3178	model_upsample->super.output_size = 1;
3179	ccv_cnnp_model_copy_name(&model_upsample->super, name);
3180	assert(type == CCV_NNC_UPSAMPLE_NEAREST || type == CCV_NNC_UPSAMPLE_BILINEAR)((void) sizeof ((type == CCV_NNC_UPSAMPLE_NEAREST || type == CCV_NNC_UPSAMPLE_BILINEAR
) ? 1 : 0), __extension__ ({ if (type == CCV_NNC_UPSAMPLE_NEAREST
 || type == CCV_NNC_UPSAMPLE_BILINEAR) ; else __assert_fail (
"type == CCV_NNC_UPSAMPLE_NEAREST || type == CCV_NNC_UPSAMPLE_BILINEAR"
, "ccv_cnnp_model_addons.c", 3180, __extension__ __PRETTY_FUNCTION__
); }));
3181	model_upsample->type = type;
3182	model_upsample->width_scale = width_scale;
3183	model_upsample->height_scale = height_scale;
3184	model_upsample->align_corners = align_corners;
3185	return (ccv_cnnp_model_t*)model_upsample;
3186}
3187 
3188static ccv_cnnp_model_t* _ccv_cnnp_upsample_copy(const ccv_cnnp_model_t* const super, void* const context)
3189{
3190	const ccv_cnnp_model_upsample_t* const self = (const ccv_cnnp_model_upsample_t*)super;
3191	return ccv_cnnp_upsample(self->type, self->width_scale, self->height_scale, self->align_corners, self->super.name);
3192}
3193 
3194// MARK - Reduce Sum Layer
3195 
3196typedef struct {
3197	ccv_cnnp_model_t super;
3198	int axis[CCV_NNC_MAX_DIM_ALLOC(12)];
3199	int count;
3200	ccv_nnc_tensor_symbol_t output;
3201} ccv_cnnp_model_reduce_sum_t;
3202 
3203static void _ccv_cnnp_reduce_sum_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3204{
3205	PRINT(CCV_CLI_VERBOSE, "[cnnp_reduce_sum_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_reduce_sum_build] -\n"); fflush(stdout); } }
 while (0);
3206	const ccv_cnnp_model_reduce_sum_t* const self = (const ccv_cnnp_model_reduce_sum_t*)super;
3207	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 3207, __extension__ __PRETTY_FUNCTION__); }));
3208	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3208, __extension__ __PRETTY_FUNCTION__
); }));
3209	ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3210	ccv_nnc_tensor_param_t output_params;
3211	ccv_nnc_cmd_t reduce_sum = CMD_REDUCE_SUM_FORWARD()ccv_nnc_cmd(CCV_NNC_REDUCE_SUM_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.reduce={.count=(1 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1),.axis={}}}
), 0);
3212	int i;
3213	for (i = 0; i < self->count; i++)
3214		reduce_sum.info.reduce.axis[i] = self->axis[i];
3215	reduce_sum.info.reduce.count = self->count;
3216	ccv_nnc_hint_tensor_auto(reduce_sum, &input_params, 1, ccv_nnc_no_hint, &output_params, 1);
3217	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3218	ccv_nnc_graph_exec_symbol_new(graph, reduce_sum, inputs, input_size, outputs, output_size, "reduce_sum");
3219}
3220 
3221static ccv_cnnp_model_t* _ccv_cnnp_reduce_sum_copy(const ccv_cnnp_model_t* const self, void* const context);
3222 
3223static const ccv_cnnp_model_vtab_t ccv_cnnp_reduce_sum_isa = {
3224	.build = _ccv_cnnp_reduce_sum_build,
3225	.copy = _ccv_cnnp_reduce_sum_copy,
3226};
3227 
3228ccv_cnnp_model_t* ccv_cnnp_reduce_sum(const int* const axis, const int axis_count, const char* const name)
3229{
3230	ccv_cnnp_model_reduce_sum_t* const model_reduce_sum = (ccv_cnnp_model_reduce_sum_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_reduce_sum_t));
3231	model_reduce_sum->super.isa = &ccv_cnnp_reduce_sum_isa;
3232	model_reduce_sum->super.input_size = 1;
3233	model_reduce_sum->super.outputs = &model_reduce_sum->output;
3234	model_reduce_sum->super.output_size = 1;
3235	ccv_cnnp_model_copy_name(&model_reduce_sum->super, name);
3236	assert(axis_count <= CCV_NNC_MAX_DIM_ALLOC)((void) sizeof ((axis_count <= (12)) ? 1 : 0), __extension__
 ({ if (axis_count <= (12)) ; else __assert_fail ("axis_count <= CCV_NNC_MAX_DIM_ALLOC"
, "ccv_cnnp_model_addons.c", 3236, __extension__ __PRETTY_FUNCTION__
); }));
3237	int i;
3238	for (i = 0; i < axis_count; i++)
3239		model_reduce_sum->axis[i] = axis[i];
3240	model_reduce_sum->count = axis_count;
3241	return (ccv_cnnp_model_t*)model_reduce_sum;
3242}
3243 
3244static ccv_cnnp_model_t* _ccv_cnnp_reduce_sum_copy(const ccv_cnnp_model_t* const super, void* const context)
3245{
3246	const ccv_cnnp_model_reduce_sum_t* const self = (const ccv_cnnp_model_reduce_sum_t*)super;
3247	return ccv_cnnp_reduce_sum(self->axis, self->count, self->super.name);
3248}
3249 
3250// MARK - Reduce Mean Layer
3251 
3252typedef struct {
3253	ccv_cnnp_model_t super;
3254	int axis[CCV_NNC_MAX_DIM_ALLOC(12)];
3255	int count;
3256	ccv_nnc_tensor_symbol_t output;
3257} ccv_cnnp_model_reduce_mean_t;
3258 
3259static void _ccv_cnnp_reduce_mean_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3260{
3261	PRINT(CCV_CLI_VERBOSE, "[cnnp_reduce_mean_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_reduce_mean_build] -\n"); fflush(stdout); } }
 while (0);
3262	const ccv_cnnp_model_reduce_mean_t* const self = (const ccv_cnnp_model_reduce_mean_t*)super;
3263	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 3263, __extension__ __PRETTY_FUNCTION__); }));
3264	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3264, __extension__ __PRETTY_FUNCTION__
); }));
3265	ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3266	ccv_nnc_tensor_param_t output_params;
3267	ccv_nnc_cmd_t reduce_mean = CMD_REDUCE_MEAN_FORWARD()ccv_nnc_cmd(CCV_NNC_REDUCE_MEAN_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.reduce={.count=(1 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1),.axis={}}}
), 0);
3268	int i;
3269	for (i = 0; i < self->count; i++)
3270		reduce_mean.info.reduce.axis[i] = self->axis[i];
3271	reduce_mean.info.reduce.count = self->count;
3272	ccv_nnc_hint_tensor_auto(reduce_mean, &input_params, 1, ccv_nnc_no_hint, &output_params, 1);
3273	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3274	ccv_nnc_graph_exec_symbol_new(graph, reduce_mean, inputs, input_size, outputs, output_size, "reduce_mean");
3275}
3276 
3277static ccv_cnnp_model_t* _ccv_cnnp_reduce_mean_copy(const ccv_cnnp_model_t* const self, void* const context);
3278 
3279static const ccv_cnnp_model_vtab_t ccv_cnnp_reduce_mean_isa = {
3280	.build = _ccv_cnnp_reduce_mean_build,
3281	.copy = _ccv_cnnp_reduce_mean_copy,
3282};
3283 
3284ccv_cnnp_model_t* ccv_cnnp_reduce_mean(const int* const axis, const int axis_count, const char* const name)
3285{
3286	ccv_cnnp_model_reduce_mean_t* const model_reduce_mean = (ccv_cnnp_model_reduce_mean_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_reduce_mean_t));
3287	model_reduce_mean->super.isa = &ccv_cnnp_reduce_mean_isa;
3288	model_reduce_mean->super.input_size = 1;
3289	model_reduce_mean->super.outputs = &model_reduce_mean->output;
3290	model_reduce_mean->super.output_size = 1;
3291	ccv_cnnp_model_copy_name(&model_reduce_mean->super, name);
3292	assert(axis_count <= CCV_NNC_MAX_DIM_ALLOC)((void) sizeof ((axis_count <= (12)) ? 1 : 0), __extension__
 ({ if (axis_count <= (12)) ; else __assert_fail ("axis_count <= CCV_NNC_MAX_DIM_ALLOC"
, "ccv_cnnp_model_addons.c", 3292, __extension__ __PRETTY_FUNCTION__
); }));
3293	int i;
3294	for (i = 0; i < axis_count; i++)
3295		model_reduce_mean->axis[i] = axis[i];
3296	model_reduce_mean->count = axis_count;
3297	return (ccv_cnnp_model_t*)model_reduce_mean;
3298}
3299 
3300static ccv_cnnp_model_t* _ccv_cnnp_reduce_mean_copy(const ccv_cnnp_model_t* const super, void* const context)
3301{
3302	const ccv_cnnp_model_reduce_mean_t* const self = (const ccv_cnnp_model_reduce_mean_t*)super;
3303	return ccv_cnnp_reduce_mean(self->axis, self->count, self->super.name);
3304}
3305 
3306// MARK - Reduce Max Layer
3307 
3308typedef struct {
3309	ccv_cnnp_model_t super;
3310	int axis[CCV_NNC_MAX_DIM_ALLOC(12)];
3311	int count;
3312	ccv_nnc_tensor_symbol_t output;
3313} ccv_cnnp_model_reduce_max_t;
3314 
3315static void _ccv_cnnp_reduce_max_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3316{
3317	PRINT(CCV_CLI_VERBOSE, "[cnnp_reduce_max_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_reduce_max_build] -\n"); fflush(stdout); } }
 while (0);
3318	const ccv_cnnp_model_reduce_max_t* const self = (const ccv_cnnp_model_reduce_max_t*)super;
3319	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 3319, __extension__ __PRETTY_FUNCTION__); }));
3320	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3320, __extension__ __PRETTY_FUNCTION__
); }));
3321	ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3322	ccv_nnc_tensor_param_t output_params;
3323	ccv_nnc_cmd_t reduce_max = CMD_REDUCE_MAX_FORWARD()ccv_nnc_cmd(CCV_NNC_REDUCE_MAX_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.reduce={.count=(1 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1),.axis={}}}
), 0);
3324	int i;
3325	for (i = 0; i < self->count; i++)
3326		reduce_max.info.reduce.axis[i] = self->axis[i];
3327	reduce_max.info.reduce.count = self->count;
3328	ccv_nnc_hint_tensor_auto(reduce_max, &input_params, 1, ccv_nnc_no_hint, &output_params, 1);
3329	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3330	ccv_nnc_graph_exec_symbol_new(graph, reduce_max, inputs, input_size, outputs, output_size, "reduce_max");
3331}
3332 
3333static ccv_cnnp_model_t* _ccv_cnnp_reduce_max_copy(const ccv_cnnp_model_t* const self, void* const context);
3334 
3335static const ccv_cnnp_model_vtab_t ccv_cnnp_reduce_max_isa = {
3336	.build = _ccv_cnnp_reduce_max_build,
3337	.copy = _ccv_cnnp_reduce_max_copy,
3338};
3339 
3340ccv_cnnp_model_t* ccv_cnnp_reduce_max(const int* const axis, const int axis_count, const char* const name)
3341{
3342	ccv_cnnp_model_reduce_max_t* const model_reduce_max = (ccv_cnnp_model_reduce_max_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_reduce_max_t));
3343	model_reduce_max->super.isa = &ccv_cnnp_reduce_max_isa;
3344	model_reduce_max->super.input_size = 1;
3345	model_reduce_max->super.outputs = &model_reduce_max->output;
3346	model_reduce_max->super.output_size = 1;
3347	ccv_cnnp_model_copy_name(&model_reduce_max->super, name);
3348	assert(axis_count <= CCV_NNC_MAX_DIM_ALLOC)((void) sizeof ((axis_count <= (12)) ? 1 : 0), __extension__
 ({ if (axis_count <= (12)) ; else __assert_fail ("axis_count <= CCV_NNC_MAX_DIM_ALLOC"
, "ccv_cnnp_model_addons.c", 3348, __extension__ __PRETTY_FUNCTION__
); }));
3349	int i;
3350	for (i = 0; i < axis_count; i++)
3351		model_reduce_max->axis[i] = axis[i];
3352	model_reduce_max->count = axis_count;
3353	return (ccv_cnnp_model_t*)model_reduce_max;
3354}
3355 
3356static ccv_cnnp_model_t* _ccv_cnnp_reduce_max_copy(const ccv_cnnp_model_t* const super, void* const context)
3357{
3358	const ccv_cnnp_model_reduce_max_t* const self = (const ccv_cnnp_model_reduce_max_t*)super;
3359	return ccv_cnnp_reduce_max(self->axis, self->count, self->super.name);
3360}
3361 
3362// MARK - Reduce Min Layer
3363 
3364typedef struct {
3365	ccv_cnnp_model_t super;
3366	int axis[CCV_NNC_MAX_DIM_ALLOC(12)];
3367	int count;
3368	ccv_nnc_tensor_symbol_t output;
3369} ccv_cnnp_model_reduce_min_t;
3370 
3371static void _ccv_cnnp_reduce_min_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3372{
3373	PRINT(CCV_CLI_VERBOSE, "[cnnp_reduce_min_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_reduce_min_build] -\n"); fflush(stdout); } }
 while (0);
3374	const ccv_cnnp_model_reduce_min_t* const self = (const ccv_cnnp_model_reduce_min_t*)super;
3375	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 3375, __extension__ __PRETTY_FUNCTION__); }));
3376	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3376, __extension__ __PRETTY_FUNCTION__
); }));
3377	ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3378	ccv_nnc_tensor_param_t output_params;
3379	ccv_nnc_cmd_t reduce_min = CMD_REDUCE_MIN_FORWARD()ccv_nnc_cmd(CCV_NNC_REDUCE_MIN_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.reduce={.count=(1 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1),.axis={}}}
), 0);
3380	int i;
3381	for (i = 0; i < self->count; i++)
3382		reduce_min.info.reduce.axis[i] = self->axis[i];
3383	reduce_min.info.reduce.count = self->count;
3384	ccv_nnc_hint_tensor_auto(reduce_min, &input_params, 1, ccv_nnc_no_hint, &output_params, 1);
3385	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3386	ccv_nnc_graph_exec_symbol_new(graph, reduce_min, inputs, input_size, outputs, output_size, "reduce_min");
3387}
3388 
3389static ccv_cnnp_model_t* _ccv_cnnp_reduce_min_copy(const ccv_cnnp_model_t* const self, void* const context);
3390 
3391static const ccv_cnnp_model_vtab_t ccv_cnnp_reduce_min_isa = {
3392	.build = _ccv_cnnp_reduce_min_build,
3393	.copy = _ccv_cnnp_reduce_min_copy,
3394};
3395 
3396ccv_cnnp_model_t* ccv_cnnp_reduce_min(const int* const axis, const int axis_count, const char* const name)
3397{
3398	ccv_cnnp_model_reduce_min_t* const model_reduce_min = (ccv_cnnp_model_reduce_min_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_reduce_min_t));
3399	model_reduce_min->super.isa = &ccv_cnnp_reduce_min_isa;
3400	model_reduce_min->super.input_size = 1;
3401	model_reduce_min->super.outputs = &model_reduce_min->output;
3402	model_reduce_min->super.output_size = 1;
3403	ccv_cnnp_model_copy_name(&model_reduce_min->super, name);
3404	assert(axis_count <= CCV_NNC_MAX_DIM_ALLOC)((void) sizeof ((axis_count <= (12)) ? 1 : 0), __extension__
 ({ if (axis_count <= (12)) ; else __assert_fail ("axis_count <= CCV_NNC_MAX_DIM_ALLOC"
, "ccv_cnnp_model_addons.c", 3404, __extension__ __PRETTY_FUNCTION__
); }));
3405	int i;
3406	for (i = 0; i < axis_count; i++)
3407		model_reduce_min->axis[i] = axis[i];
3408	model_reduce_min->count = axis_count;
3409	return (ccv_cnnp_model_t*)model_reduce_min;
3410}
3411 
3412static ccv_cnnp_model_t* _ccv_cnnp_reduce_min_copy(const ccv_cnnp_model_t* const super, void* const context)
3413{
3414	const ccv_cnnp_model_reduce_min_t* const self = (const ccv_cnnp_model_reduce_min_t*)super;
3415	return ccv_cnnp_reduce_min(self->axis, self->count, self->super.name);
3416}
3417 
3418// MARK - Reduce Norm2 Layer
3419 
3420typedef struct {
3421	ccv_cnnp_model_t super;
3422	int axis[CCV_NNC_MAX_DIM_ALLOC(12)];
3423	int count;
3424	ccv_nnc_tensor_symbol_t output;
3425} ccv_cnnp_model_reduce_norm2_t;
3426 
3427static void _ccv_cnnp_reduce_norm2_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3428{
3429	const ccv_cnnp_model_reduce_norm2_t* const self = (const ccv_cnnp_model_reduce_norm2_t*)super;
3430	PRINT(CCV_CLI_VERBOSE, "[cnnp_reduce_norm2_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_reduce_norm2_build] -\n"); fflush(stdout); }
 } while (0);
3431	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 3431, __extension__ __PRETTY_FUNCTION__); }));
3432	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3432, __extension__ __PRETTY_FUNCTION__
); }));
3433	ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3434	ccv_nnc_tensor_param_t output_params;
3435	ccv_nnc_cmd_t reduce_norm2 = CMD_REDUCE_NORM2_FORWARD()ccv_nnc_cmd(CCV_NNC_REDUCE_NORM2_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.reduce={.count=(1 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1),.axis={}}}
), 0);
3436	int i;
3437	for (i = 0; i < self->count; i++)
3438		reduce_norm2.info.reduce.axis[i] = self->axis[i];
3439	reduce_norm2.info.reduce.count = self->count;
3440	ccv_nnc_hint_tensor_auto(reduce_norm2, &input_params, 1, ccv_nnc_no_hint, &output_params, 1);
3441	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3442	ccv_nnc_graph_exec_symbol_new(graph, reduce_norm2, inputs, input_size, outputs, output_size, "reduce_norm2");
3443}
3444 
3445static ccv_cnnp_model_t* _ccv_cnnp_reduce_norm2_copy(const ccv_cnnp_model_t* const self, void* const context);
3446 
3447static const ccv_cnnp_model_vtab_t ccv_cnnp_reduce_norm2_isa = {
3448	.build = _ccv_cnnp_reduce_norm2_build,
3449	.copy = _ccv_cnnp_reduce_norm2_copy,
3450};
3451 
3452ccv_cnnp_model_t* ccv_cnnp_reduce_norm2(const int* const axis, const int axis_count, const char* const name)
3453{
3454	ccv_cnnp_model_reduce_norm2_t* const model_reduce_norm2 = (ccv_cnnp_model_reduce_norm2_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_reduce_norm2_t));
3455	model_reduce_norm2->super.isa = &ccv_cnnp_reduce_norm2_isa;
3456	model_reduce_norm2->super.input_size = 1;
3457	model_reduce_norm2->super.outputs = &model_reduce_norm2->output;
3458	model_reduce_norm2->super.output_size = 1;
3459	ccv_cnnp_model_copy_name(&model_reduce_norm2->super, name);
3460	assert(axis_count <= CCV_NNC_MAX_DIM_ALLOC)((void) sizeof ((axis_count <= (12)) ? 1 : 0), __extension__
 ({ if (axis_count <= (12)) ; else __assert_fail ("axis_count <= CCV_NNC_MAX_DIM_ALLOC"
, "ccv_cnnp_model_addons.c", 3460, __extension__ __PRETTY_FUNCTION__
); }));
3461	int i;
3462	for (i = 0; i < axis_count; i++)
3463		model_reduce_norm2->axis[i] = axis[i];
3464	model_reduce_norm2->count = axis_count;
3465	return (ccv_cnnp_model_t*)model_reduce_norm2;
3466}
3467 
3468static ccv_cnnp_model_t* _ccv_cnnp_reduce_norm2_copy(const ccv_cnnp_model_t* const super, void* const context)
3469{
3470	const ccv_cnnp_model_reduce_norm2_t* const self = (const ccv_cnnp_model_reduce_norm2_t*)super;
3471	return ccv_cnnp_reduce_norm2(self->axis, self->count, self->super.name);
3472}
3473 
3474// MARK - Argmax Layer
3475 
3476typedef struct {
3477	ccv_cnnp_model_t super;
3478	int axis;
3479	ccv_nnc_tensor_symbol_t output;
3480} ccv_cnnp_model_argmax_t;
3481 
3482static void _ccv_cnnp_argmax_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3483{
3484	const ccv_cnnp_model_argmax_t* const self = (const ccv_cnnp_model_argmax_t*)super;
3485	PRINT(CCV_CLI_VERBOSE, "[cnnp_argmax_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_argmax_build] -\n"); fflush(stdout); } } while
 (0);
3486	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 3486, __extension__ __PRETTY_FUNCTION__); }));
3487	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3487, __extension__ __PRETTY_FUNCTION__
); }));
3488	ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3489	ccv_nnc_tensor_param_t output_params;
3490	ccv_nnc_cmd_t argmax = CMD_ARGMAX_FORWARD()ccv_nnc_cmd(CCV_NNC_ARGMAX_FORWARD, 0, ((ccv_nnc_cmd_param_t)
{.size={.dim={1,1,1}},.reduce={.count=(1 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1),.axis={}}})
, 0);
3491	argmax.info.reduce.axis[0] = self->axis;
3492	argmax.info.reduce.count = 1;
3493	ccv_nnc_hint_tensor_auto(argmax, &input_params, 1, ccv_nnc_no_hint, &output_params, 1);
3494	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3495	ccv_nnc_graph_exec_symbol_new(graph, argmax, inputs, input_size, outputs, output_size, "argmax");
3496}
3497 
3498static ccv_cnnp_model_t* _ccv_cnnp_argmax_copy(const ccv_cnnp_model_t* const self, void* const context);
3499 
3500static const ccv_cnnp_model_vtab_t ccv_cnnp_argmax_isa = {
3501	.build = _ccv_cnnp_argmax_build,
3502	.copy = _ccv_cnnp_argmax_copy,
3503};
3504 
3505ccv_cnnp_model_t* ccv_cnnp_argmax(const int axis, const char* const name)
3506{
3507	ccv_cnnp_model_argmax_t* const model_argmax = (ccv_cnnp_model_argmax_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_argmax_t));
3508	model_argmax->super.isa = &ccv_cnnp_argmax_isa;
3509	model_argmax->super.input_size = 1;
3510	model_argmax->super.outputs = &model_argmax->output;
3511	model_argmax->super.output_size = 1;
3512	ccv_cnnp_model_copy_name(&model_argmax->super, name);
3513	model_argmax->axis = axis;
3514	return (ccv_cnnp_model_t*)model_argmax;
3515}
3516 
3517static ccv_cnnp_model_t* _ccv_cnnp_argmax_copy(const ccv_cnnp_model_t* const super, void* const context)
3518{
3519	const ccv_cnnp_model_argmax_t* const self = (const ccv_cnnp_model_argmax_t*)super;
3520	return ccv_cnnp_argmax(self->axis, self->super.name);
3521}
3522 
3523// MARK - Argmin Layer
3524 
3525typedef struct {
3526	ccv_cnnp_model_t super;
3527	int axis;
3528	ccv_nnc_tensor_symbol_t output;
3529} ccv_cnnp_model_argmin_t;
3530 
3531static void _ccv_cnnp_argmin_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3532{
3533	const ccv_cnnp_model_argmin_t* const self = (const ccv_cnnp_model_argmin_t*)super;
3534	PRINT(CCV_CLI_VERBOSE, "[cnnp_argmin_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_argmin_build] -\n"); fflush(stdout); } } while
 (0);
3535	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 3535, __extension__ __PRETTY_FUNCTION__); }));
3536	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3536, __extension__ __PRETTY_FUNCTION__
); }));
3537	ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3538	ccv_nnc_tensor_param_t output_params;
3539	ccv_nnc_cmd_t argmin = CMD_ARGMIN_FORWARD()ccv_nnc_cmd(CCV_NNC_ARGMIN_FORWARD, 0, ((ccv_nnc_cmd_param_t)
{.size={.dim={1,1,1}},.reduce={.count=(1 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1),.axis={}}})
, 0);
3540	argmin.info.reduce.axis[0] = self->axis;
3541	argmin.info.reduce.count = 1;
3542	ccv_nnc_hint_tensor_auto(argmin, &input_params, 1, ccv_nnc_no_hint, &output_params, 1);
3543	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3544	ccv_nnc_graph_exec_symbol_new(graph, argmin, inputs, input_size, outputs, output_size, "argmin");
3545}
3546 
3547static ccv_cnnp_model_t* _ccv_cnnp_argmin_copy(const ccv_cnnp_model_t* const self, void* const context);
3548 
3549static const ccv_cnnp_model_vtab_t ccv_cnnp_argmin_isa = {
3550	.build = _ccv_cnnp_argmin_build,
3551	.copy = _ccv_cnnp_argmin_copy,
3552};
3553 
3554ccv_cnnp_model_t* ccv_cnnp_argmin(const int axis, const char* const name)
3555{
3556	ccv_cnnp_model_argmin_t* const model_argmin = (ccv_cnnp_model_argmin_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_argmin_t));
3557	model_argmin->super.isa = &ccv_cnnp_argmin_isa;
3558	model_argmin->super.input_size = 1;
3559	model_argmin->super.outputs = &model_argmin->output;
3560	model_argmin->super.output_size = 1;
3561	ccv_cnnp_model_copy_name(&model_argmin->super, name);
3562	model_argmin->axis = axis;
3563	return (ccv_cnnp_model_t*)model_argmin;
3564}
3565 
3566static ccv_cnnp_model_t* _ccv_cnnp_argmin_copy(const ccv_cnnp_model_t* const super, void* const context)
3567{
3568	const ccv_cnnp_model_argmin_t* const self = (const ccv_cnnp_model_argmin_t*)super;
3569	return ccv_cnnp_argmin(self->axis, self->super.name);
3570}
3571 
3572// MARK - Min Layer
3573 
3574typedef struct {
3575	ccv_cnnp_model_t super;
3576	ccv_nnc_tensor_symbol_t output;
3577} ccv_cnnp_model_min_t;
3578 
3579static void _ccv_cnnp_min_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3580{
3581	PRINT(CCV_CLI_VERBOSE, "[cnnp_min_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_min_build] -\n"); fflush(stdout); } } while (
0);
3582	assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 3582, __extension__ __PRETTY_FUNCTION__); }));
3583	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3583, __extension__ __PRETTY_FUNCTION__
); }));
3584	ccv_nnc_tensor_param_t input_params[2];
3585	int i;
3586	for (i = 0; i < 2; i++)
3587		input_params[i] = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
3588	ccv_nnc_tensor_param_t output_params;
3589	const ccv_nnc_cmd_t min = CMD_MIN_FORWARD()ccv_nnc_cmd(CCV_NNC_MIN_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}}}, 0);
3590	ccv_nnc_hint_tensor_auto(min, input_params, 2, ccv_nnc_no_hint, &output_params, 1);
3591	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3592	ccv_nnc_graph_exec_symbol_new(graph, min, inputs, input_size, outputs, output_size, "min");
3593}
3594 
3595static ccv_cnnp_model_t* _ccv_cnnp_min_copy(const ccv_cnnp_model_t* const self, void* const context);
3596 
3597static const ccv_cnnp_model_vtab_t ccv_cnnp_min_isa = {
3598	.build = _ccv_cnnp_min_build,
3599	.copy = _ccv_cnnp_min_copy,
3600};
3601 
3602ccv_cnnp_model_t* ccv_cnnp_min(const char* const name)
3603{
3604	ccv_cnnp_model_min_t* const model_min = (ccv_cnnp_model_min_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_min_t));
3605	model_min->super.isa = &ccv_cnnp_min_isa;
3606	model_min->super.input_size = 2;
3607	model_min->super.outputs = &model_min->output;
3608	model_min->super.output_size = 1;
3609	ccv_cnnp_model_copy_name(&model_min->super, name);
3610	return (ccv_cnnp_model_t*)model_min;
3611}
3612 
3613static ccv_cnnp_model_t* _ccv_cnnp_min_copy(const ccv_cnnp_model_t* const super, void* const context)
3614{
3615	const ccv_cnnp_model_min_t* const self = (const ccv_cnnp_model_min_t*)super;
3616	return ccv_cnnp_min(self->super.name);
3617}
3618 
3619// MARK - Max Layer
3620 
3621typedef struct {
3622	ccv_cnnp_model_t super;
3623	ccv_nnc_tensor_symbol_t output;
3624} ccv_cnnp_model_max_t;
3625 
3626static void _ccv_cnnp_max_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3627{
3628	PRINT(CCV_CLI_VERBOSE, "[cnnp_max_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_max_build] -\n"); fflush(stdout); } } while (
0);
3629	assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 3629, __extension__ __PRETTY_FUNCTION__); }));
3630	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3630, __extension__ __PRETTY_FUNCTION__
); }));
3631	ccv_nnc_tensor_param_t input_params[2];
3632	int i;
3633	for (i = 0; i < 2; i++)
3634		input_params[i] = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
3635	ccv_nnc_tensor_param_t output_params;
3636	const ccv_nnc_cmd_t max = CMD_MAX_FORWARD()ccv_nnc_cmd(CCV_NNC_MAX_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}}}, 0);
3637	ccv_nnc_hint_tensor_auto(max, input_params, 2, ccv_nnc_no_hint, &output_params, 1);
3638	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
3639	ccv_nnc_graph_exec_symbol_new(graph, max, inputs, input_size, outputs, output_size, "max");
3640}
3641 
3642static ccv_cnnp_model_t* _ccv_cnnp_max_copy(const ccv_cnnp_model_t* const self, void* const context);
3643 
3644static const ccv_cnnp_model_vtab_t ccv_cnnp_max_isa = {
3645	.build = _ccv_cnnp_max_build,
3646	.copy = _ccv_cnnp_max_copy,
3647};
3648 
3649ccv_cnnp_model_t* ccv_cnnp_max(const char* const name)
3650{
3651	ccv_cnnp_model_max_t* const model_max = (ccv_cnnp_model_max_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_max_t));
3652	model_max->super.isa = &ccv_cnnp_max_isa;
3653	model_max->super.input_size = 2;
3654	model_max->super.outputs = &model_max->output;
3655	model_max->super.output_size = 1;
3656	ccv_cnnp_model_copy_name(&model_max->super, name);
3657	return (ccv_cnnp_model_t*)model_max;
3658}
3659 
3660static ccv_cnnp_model_t* _ccv_cnnp_max_copy(const ccv_cnnp_model_t* const super, void* const context)
3661{
3662	const ccv_cnnp_model_max_t* const self = (const ccv_cnnp_model_max_t*)super;
3663	return ccv_cnnp_max(self->super.name);
3664}
3665 
3666// MARK - LSTM Layer
3667 
3668typedef struct {
3669	ccv_cnnp_model_t super;
3670	int masked;
3671	ccv_nnc_tensor_symbol_t output;
3672	ccv_nnc_tensor_symbol_t weights;
3673	ccv_nnc_tensor_symbol_t reserves;
3674	ccv_nnc_cmd_param_t params;
3675	ccv_nnc_graph_exec_symbol_t lstm;
3676} ccv_cnnp_model_lstm_t;
3677 
3678static int _ccv_cnnp_lstm_weight_dim(int bidirectional, int num_layers, int input_size, int hidden_size, int proj_size, int bias)
3679{
3680	const int D = !!bidirectional + 1;
3681	if (hidden_size == proj_size)
3682		return (num_layers * (bias ? 8 : 0) + (num_layers - 1) * (hidden_size * 4 * D + hidden_size * 4) + input_size * 4 + hidden_size * 4) * D;
3683	else
3684		return (num_layers * (bias ? 8 : 0) + (num_layers - 1) * (proj_size * 4 * D + proj_size * 4) + (proj_size * 4 + input_size * 4) + num_layers * proj_size) * D;
3685}
3686 
3687static void _ccv_cnnp_lstm_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3688{
3689	ccv_cnnp_model_lstm_t* const self = (ccv_cnnp_model_lstm_t*)super;
3690	PRINT(CCV_CLI_VERBOSE, "[cnnp_lstm_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_lstm_build] -\n"); fflush(stdout); } } while
 (0);
3691	assert(input_size == self->super.input_size)((void) sizeof ((input_size == self->super.input_size) ? 1
 : 0), __extension__ ({ if (input_size == self->super.input_size
) ; else __assert_fail ("input_size == self->super.input_size"
, "ccv_cnnp_model_addons.c", 3691, __extension__ __PRETTY_FUNCTION__
); }));
3692	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3692, __extension__ __PRETTY_FUNCTION__
); }));
3693	const int proj_size = self->params.rnn.proj_size == 0 ? self->params.rnn.hidden_size : self->params.rnn.proj_size;
3694	ccv_nnc_tensor_param_t input_params[5];
3695	input_params[0]= ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3696	if (input_size == 2)
3697		input_params[1] = ccv_nnc_tensor_symbol_params(graph, inputs[1]);
3698	input_params[4] = input_params[0];
3699	memset(input_params[4].dim, 0, sizeof(input_params[4].dim));
3700	const int x_nd = ccv_nnc_tensor_nd(input_params[0].dim);
3701	const int feature_count = input_params[0].dim[x_nd - 1];
3702	input_params[4].dim[0] = _ccv_cnnp_lstm_weight_dim(self->params.rnn.bidirectional, self->params.rnn.num_layers, feature_count, self->params.rnn.hidden_size, proj_size, self->params.rnn.bias);
3703	input_params[4].dim[1] = self->params.rnn.hidden_size;
3704	const ccv_nnc_cmd_t lstm = ccv_nnc_cmd(CCV_NNC_LSTM_FORWARD, 0, self->params, 0);
3705	ccv_nnc_tensor_param_t output_params[4];
3706	ccv_nnc_hint_tensor_auto(lstm, input_params, 5, ccv_nnc_no_hint, output_params, 4);
3707	outputs[0] = ccv_nnc_tensor_symbol_new(graph, output_params[0], 0);
3708	if (!self->weights.graph)
3709		self->weights = ccv_nnc_tensor_symbol_new(graph, input_params[4], "weights");
3710	if (!self->reserves.graph)
3711		self->reserves = ccv_nnc_tensor_symbol_new(graph, output_params[3], "reserves");
3712	const ccv_nnc_tensor_symbol_t mask = input_size == 2 ? inputs[1] : NO_TENSOR_SYMBOL(const ccv_nnc_tensor_symbol_t){.d = CCV_NNC_NO_TENSOR_SYMBOL
};
3713	self->lstm = ccv_nnc_graph_exec_symbol_new(graph, lstm, TENSOR_SYMBOL_LIST(inputs[0], mask, NO_TENSOR_SYMBOL, NO_TENSOR_SYMBOL, self->weights)(const ccv_nnc_tensor_symbol_t []){inputs[0], mask, (const ccv_nnc_tensor_symbol_t
){.d = CCV_NNC_NO_TENSOR_SYMBOL}, (const ccv_nnc_tensor_symbol_t
){.d = CCV_NNC_NO_TENSOR_SYMBOL}, self->weights}, (1 +1 +1
 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -
1), TENSOR_SYMBOL_LIST(outputs[0], NO_TENSOR_SYMBOL, NO_TENSOR_SYMBOL, self->reserves)(const ccv_nnc_tensor_symbol_t []){outputs[0], (const ccv_nnc_tensor_symbol_t
){.d = CCV_NNC_NO_TENSOR_SYMBOL}, (const ccv_nnc_tensor_symbol_t
){.d = CCV_NNC_NO_TENSOR_SYMBOL}, self->reserves}, (1 +1 +
1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 -1), "lstm");
3714}
3715 
3716static void _ccv_cnnp_lstm_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
3717{
3718	ccv_cnnp_model_lstm_t* const self = (ccv_cnnp_model_lstm_t*)super;
3719	if (self->weights.graph)
3720	{
3721		const float stdv = 1.0 / sqrt(self->params.rnn.hidden_size);
3722		initializer(context, CMD_RANDOM_UNIFORM_FORWARD(-stdv, stdv)ccv_nnc_cmd(CCV_NNC_RANDOM_UNIFORM_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={-stdv, stdv}}}, 0), ccv_nnc_no_hint, 0, 0, self->weights);
3723	}
3724}
3725 
3726static void _ccv_cnnp_lstm_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
3727{
3728	ccv_cnnp_model_lstm_t* const self = (ccv_cnnp_model_lstm_t*)super;
3729	if (self->weights.graph)
3730		add_to_array(parameters, self->weights, is_trainable);
3731}
3732 
3733static void _ccv_cnnp_lstm_set_is_test(ccv_cnnp_model_t* const super, const int is_test, const ccv_cnnp_cmd_updater_f updater, void* const context)
3734{
3735	ccv_cnnp_model_lstm_t* const self = (ccv_cnnp_model_lstm_t*)super;
3736	if (self->lstm.graph)
3737	{
3738		self->params.rnn.is_test = is_test;
3739		updater(context, self->lstm, ccv_nnc_cmd(CCV_NNC_LSTM_FORWARD, 0, self->params, 0), ccv_nnc_no_hint);
3740	}
3741}
3742 
3743static ccv_cnnp_model_t* _ccv_cnnp_lstm_copy(const ccv_cnnp_model_t* const self, void* const context);
3744 
3745static const ccv_cnnp_model_vtab_t ccv_cnnp_lstm_isa = {
3746	.build = _ccv_cnnp_lstm_build,
3747	.init_states = _ccv_cnnp_lstm_init_states,
3748	.add_to_parameter = _ccv_cnnp_lstm_add_to_parameter,
3749	.copy = _ccv_cnnp_lstm_copy,
3750	.set_is_test = _ccv_cnnp_lstm_set_is_test,
3751};
3752 
3753ccv_cnnp_model_t* ccv_cnnp_lstm(const int masked, const int hidden_size, const int proj_size, const int num_layers, const int bias, const int batch_first, const int bidirectional, const float dropout, const int is_trainable, const char* const name)
3754{
3755	ccv_cnnp_model_lstm_t* const model_lstm = (ccv_cnnp_model_lstm_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_lstm_t));
3756	model_lstm->super.isa = &ccv_cnnp_lstm_isa;
3757	model_lstm->super.input_size = masked ? 2 : 1;
3758	model_lstm->super.outputs = &model_lstm->output;
3759	model_lstm->super.output_size = 1;
3760	model_lstm->super.is_trainable = is_trainable;
3761	ccv_cnnp_model_copy_name(&model_lstm->super, name);
3762	model_lstm->masked = masked;
3763	model_lstm->weights.d = CCV_NNC_NO_TENSOR_SYMBOL;
3764	model_lstm->weights.graph = 0;
3765	model_lstm->params.rnn.hidden_size = hidden_size;
3766	model_lstm->params.rnn.proj_size = proj_size;
3767	model_lstm->params.rnn.num_layers = num_layers;
3768	model_lstm->params.rnn.bias = bias;
3769	model_lstm->params.rnn.batch_first = batch_first;
3770	model_lstm->params.rnn.bidirectional = bidirectional;
3771	model_lstm->params.rnn.dropout = dropout;
3772	return (ccv_cnnp_model_t*)model_lstm;
3773}
3774 
3775static ccv_cnnp_model_t* _ccv_cnnp_lstm_copy(const ccv_cnnp_model_t* const super, void* const context)
3776{
3777	const ccv_cnnp_model_lstm_t* const self = (const ccv_cnnp_model_lstm_t*)super;
3778	return ccv_cnnp_lstm(self->masked, self->params.rnn.hidden_size, self->params.rnn.proj_size, self->params.rnn.num_layers, self->params.rnn.bias, self->params.rnn.batch_first, self->params.rnn.bidirectional, self->params.rnn.dropout, self->super.is_trainable, self->super.name);
3779}
3780 
3781/// MARK - Datatype conversion layer.
3782 
3783typedef struct {
3784	ccv_cnnp_model_t super;
3785	ccv_nnc_tensor_symbol_t output;
3786	int datatype;
3787	int ref_to_last;
3788} ccv_cnnp_model_datatype_conversion_t;
3789 
3790static void _ccv_cnnp_datatype_conversion_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3791{
3792	ccv_cnnp_model_datatype_conversion_t* const self = (ccv_cnnp_model_datatype_conversion_t*)super;
3793	PRINT(CCV_CLI_VERBOSE, "[cnnp_datatype_conversion_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_datatype_conversion_build] -\n"); fflush(stdout
); } } while (0);
3794	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3795	if (self->ref_to_last)
3796	{
3797		assert(input_size > 1)((void) sizeof ((input_size > 1) ? 1 : 0), __extension__ (
{ if (input_size > 1) ; else __assert_fail ("input_size > 1"
, "ccv_cnnp_model_addons.c", 3797, __extension__ __PRETTY_FUNCTION__
); }));
3798		const ccv_nnc_tensor_param_t last_params = ccv_nnc_tensor_symbol_params(graph, inputs[input_size - 1]);
3799		params.datatype = last_params.datatype;
3800	} else
3801		params.datatype = self->datatype;
3802	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3802, __extension__ __PRETTY_FUNCTION__
); }));
3803	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
3804	ccv_nnc_graph_exec_symbol_new(graph, CMD_DATATYPE_CONVERSION_FORWARD()ccv_nnc_cmd(CCV_NNC_DATATYPE_CONVERSION_FORWARD, 0, ccv_nnc_cmd_auto
, 0), inputs, output_size /* intentional */, outputs, output_size, 0);
3805}
3806 
3807static ccv_cnnp_model_t* _ccv_cnnp_datatype_conversion_copy(const ccv_cnnp_model_t* const self, void* const context);
3808 
3809static const ccv_cnnp_model_vtab_t ccv_cnnp_datatype_conversion_isa = {
3810	.build = _ccv_cnnp_datatype_conversion_build,
3811	.copy = _ccv_cnnp_datatype_conversion_copy,
3812};
3813 
3814ccv_cnnp_model_t* ccv_cnnp_datatype_conversion(const int datatype, const int ref_to_last, const char* const name)
3815{
3816	ccv_cnnp_model_datatype_conversion_t* const model_datatype_conversion = (ccv_cnnp_model_datatype_conversion_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_datatype_conversion_t));
3817	model_datatype_conversion->super.isa = &ccv_cnnp_datatype_conversion_isa;
3818	model_datatype_conversion->super.input_size = 0;
3819	model_datatype_conversion->super.outputs = &model_datatype_conversion->output;
3820	model_datatype_conversion->super.output_size = 1;
3821	model_datatype_conversion->datatype = datatype;
3822	model_datatype_conversion->ref_to_last = ref_to_last;
3823	ccv_cnnp_model_copy_name(&model_datatype_conversion->super, name);
3824	return (ccv_cnnp_model_t*)model_datatype_conversion;
3825}
3826 
3827static ccv_cnnp_model_t* _ccv_cnnp_datatype_conversion_copy(const ccv_cnnp_model_t* const super, void* const context)
3828{
3829	ccv_cnnp_model_datatype_conversion_t* const self = (ccv_cnnp_model_datatype_conversion_t*)super;
3830	return ccv_cnnp_datatype_conversion(self->datatype, self->ref_to_last, self->super.name);
3831}
3832 
3833/// MARK - Clamp layer.
3834 
3835typedef struct {
3836	ccv_cnnp_model_t super;
3837	ccv_nnc_tensor_symbol_t output;
3838	float min;
3839	float max;
3840} ccv_cnnp_model_clamp_t;
3841 
3842static void _ccv_cnnp_clamp_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3843{
3844	ccv_cnnp_model_clamp_t* const self = (ccv_cnnp_model_clamp_t*)super;
3845	PRINT(CCV_CLI_VERBOSE, "[cnnp_clamp_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_clamp_build] -\n"); fflush(stdout); } } while
 (0);
3846	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3847	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3847, __extension__ __PRETTY_FUNCTION__
); }));
3848	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
3849	ccv_nnc_graph_exec_symbol_new(graph, CMD_CLAMP_FORWARD(self->min, self->max)ccv_nnc_cmd(CCV_NNC_CLAMP_FORWARD, 0, (ccv_nnc_cmd_param_t){.
size={.dim={1,1,1}},.clamp={.min=self->min,.max=self->max
}}, 0), inputs, output_size /* intentional */, outputs, output_size, 0);
3850}
3851 
3852static ccv_cnnp_model_t* _ccv_cnnp_clamp_copy(const ccv_cnnp_model_t* const self, void* const context);
3853 
3854static const ccv_cnnp_model_vtab_t ccv_cnnp_clamp_isa = {
3855	.build = _ccv_cnnp_clamp_build,
3856	.copy = _ccv_cnnp_clamp_copy,
3857};
3858 
3859ccv_cnnp_model_t* ccv_cnnp_clamp(const float min, const float max, const char* const name)
3860{
3861	ccv_cnnp_model_clamp_t* const model_clamp = (ccv_cnnp_model_clamp_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_clamp_t));
3862	model_clamp->super.isa = &ccv_cnnp_clamp_isa;
3863	model_clamp->super.input_size = 0;
3864	model_clamp->super.outputs = &model_clamp->output;
3865	model_clamp->super.output_size = 1;
3866	model_clamp->min = min;
3867	model_clamp->max = max;
3868	ccv_cnnp_model_copy_name(&model_clamp->super, name);
3869	return (ccv_cnnp_model_t*)model_clamp;
3870}
3871 
3872static ccv_cnnp_model_t* _ccv_cnnp_clamp_copy(const ccv_cnnp_model_t* const super, void* const context)
3873{
3874	ccv_cnnp_model_clamp_t* const self = (ccv_cnnp_model_clamp_t*)super;
3875	return ccv_cnnp_clamp(self->min, self->max, self->super.name);
3876}
3877 
3878// MARK - Parameter Layer
3879 
3880typedef struct {
3881	ccv_cnnp_model_t super;
3882	float init_bound;
3883	ccv_nnc_tensor_symbol_t weights;
3884	ccv_nnc_tensor_param_t weights_params;
3885	ccv_nnc_tensor_symbol_t output;
3886} ccv_cnnp_model_parameter_t;
3887 
3888static void _ccv_cnnp_parameter_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3889{
3890	PRINT(CCV_CLI_VERBOSE, "[cnnp_parameter_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_parameter_build] -\n"); fflush(stdout); } } while
 (0);
3891	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3891, __extension__ __PRETTY_FUNCTION__
); }));
3892	ccv_cnnp_model_parameter_t* const self = (ccv_cnnp_model_parameter_t*)super;
3893	if (!self->weights.graph)
3894		self->weights = ccv_nnc_tensor_symbol_new(graph, self->weights_params, "weights");
3895	assert(self->weights.graph == graph)((void) sizeof ((self->weights.graph == graph) ? 1 : 0), __extension__
 ({ if (self->weights.graph == graph) ; else __assert_fail
 ("self->weights.graph == graph", "ccv_cnnp_model_addons.c"
, 3895, __extension__ __PRETTY_FUNCTION__); }));
3896	outputs[0] = self->weights;
3897}
3898 
3899static void _ccv_cnnp_parameter_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
3900{
3901	ccv_cnnp_model_parameter_t* const self = (ccv_cnnp_model_parameter_t*)super;
3902	if (self->init_bound > 0)
3903		initializer(context, CMD_RANDOM_UNIFORM_FORWARD(-self->init_bound, self->init_bound)ccv_nnc_cmd(CCV_NNC_RANDOM_UNIFORM_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={-self->init_bound, self->
init_bound}}}, 0), ccv_nnc_no_hint, 0, 0, self->weights);
3904	else
3905		initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, self->weights);
3906}
3907 
3908static void _ccv_cnnp_parameter_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
3909{
3910	ccv_cnnp_model_parameter_t* const self = (ccv_cnnp_model_parameter_t*)super;
3911	add_to_array(parameters, self->weights, is_trainable);
3912}
3913 
3914static ccv_cnnp_model_t* _ccv_cnnp_parameter_copy(const ccv_cnnp_model_t* const super, void* const context);
3915 
3916static const ccv_cnnp_model_vtab_t ccv_cnnp_parameter_isa = {
3917	.build = _ccv_cnnp_parameter_build,
3918	.init_states = _ccv_cnnp_parameter_init_states,
3919	.add_to_parameter = _ccv_cnnp_parameter_add_to_parameter,
3920	.copy = _ccv_cnnp_parameter_copy,
3921};
3922 
3923ccv_cnnp_model_t* ccv_cnnp_parameter(const ccv_nnc_tensor_param_t params, const float init_bound, const int is_trainable, const char* const name)
3924{
3925	ccv_cnnp_model_parameter_t* const model_parameter = (ccv_cnnp_model_parameter_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_parameter_t));
3926	model_parameter->super.isa = &ccv_cnnp_parameter_isa;
3927	model_parameter->super.input_size = 0;
3928	model_parameter->super.outputs = &model_parameter->output;
3929	model_parameter->super.output_size = 1;
3930	model_parameter->super.is_trainable = is_trainable;
3931	ccv_cnnp_model_copy_name(&model_parameter->super, name);
3932	model_parameter->weights.d = CCV_NNC_NO_TENSOR_SYMBOL;
3933	model_parameter->weights.graph = 0;
3934	model_parameter->weights_params = params;
3935	return (ccv_cnnp_model_t*)model_parameter;
3936}
3937 
3938static ccv_cnnp_model_t* _ccv_cnnp_parameter_copy(const ccv_cnnp_model_t* const super, void* const context)
3939{
3940	const ccv_cnnp_model_parameter_t* const self = (const ccv_cnnp_model_parameter_t*)super;
3941	return ccv_cnnp_parameter(self->weights_params, self->init_bound, self->super.is_trainable, self->super.name);
3942}
3943 
3944// MARK - Scalar Layer
3945 
3946typedef struct {
3947	ccv_cnnp_model_t super;
3948	int type;
3949	int format;
3950	int datatype;
3951	float value;
3952	ccv_nnc_tensor_symbol_t output;
3953} ccv_cnnp_model_scalar_t;
3954 
3955static void _ccv_cnnp_scalar_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
3956{
3957	PRINT(CCV_CLI_VERBOSE, "[cnnp_scalar_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_scalar_build] -\n"); fflush(stdout); } } while
 (0);
3958	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 3958, __extension__ __PRETTY_FUNCTION__
); }));
3959	ccv_cnnp_model_scalar_t* const self = (ccv_cnnp_model_scalar_t*)super;
3960	ccv_nnc_tensor_param_t params = {
3961		.type = self->type,
3962		.format = self->format,
3963		.datatype = self->datatype,
3964		.dim = {
3965			1
3966		}
3967	};
3968	if (input_size > 0)
3969	{
3970		ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
3971		params.type = input_params.type;
3972		params.format = input_params.format;
3973		params.datatype = input_params.datatype;
3974	}
3975	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
3976	ccv_nnc_graph_exec_symbol_new(graph, CMD_SET_FORWARD(self->value)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={self->value,}}}, 0), 0, 0, outputs, 1, 0);
3977}
3978 
3979static ccv_cnnp_model_t* _ccv_cnnp_scalar_copy(const ccv_cnnp_model_t* const super, void* const context);
3980 
3981static const ccv_cnnp_model_vtab_t ccv_cnnp_scalar_isa = {
3982	.build = _ccv_cnnp_scalar_build,
3983	.copy = _ccv_cnnp_scalar_copy,
3984};
3985 
3986ccv_cnnp_model_t* ccv_cnnp_scalar(const int type, const int format, const int datatype, const float value, const char* const name)
3987{
3988	ccv_cnnp_model_scalar_t* const model_scalar = (ccv_cnnp_model_scalar_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_scalar_t));
3989	model_scalar->super.isa = &ccv_cnnp_scalar_isa;
3990	model_scalar->super.input_size = 0;
3991	model_scalar->super.outputs = &model_scalar->output;
3992	model_scalar->super.output_size = 1;
3993	ccv_cnnp_model_copy_name(&model_scalar->super, name);
3994	model_scalar->type = type;
3995	model_scalar->format = format;
3996	model_scalar->datatype = datatype;
3997	model_scalar->value = value;
3998	return (ccv_cnnp_model_t*)model_scalar;
3999}
4000 
4001static ccv_cnnp_model_t* _ccv_cnnp_scalar_copy(const ccv_cnnp_model_t* const super, void* const context)
4002{
4003	const ccv_cnnp_model_scalar_t* const self = (const ccv_cnnp_model_scalar_t*)super;
4004	return ccv_cnnp_scalar(self->type, self->format, self->datatype, self->value, self->super.name);
4005}
4006 
4007// MARK - Variable Layer
4008 
4009typedef struct {
4010	ccv_cnnp_model_t super;
4011	ccv_nnc_tensor_param_t params;
4012	ccv_nnc_tensor_symbol_t output;
4013} ccv_cnnp_model_variable_t;
4014 
4015static void _ccv_cnnp_variable_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4016{
4017	PRINT(CCV_CLI_VERBOSE, "[cnnp_variable_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_variable_build] -\n"); fflush(stdout); } } while
 (0);
4018	assert(input_size == 0)((void) sizeof ((input_size == 0) ? 1 : 0), __extension__ ({ if
 (input_size == 0) ; else __assert_fail ("input_size == 0", "ccv_cnnp_model_addons.c"
, 4018, __extension__ __PRETTY_FUNCTION__); }));
4019	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 4019, __extension__ __PRETTY_FUNCTION__
); }));
4020	ccv_cnnp_model_variable_t* const self = (ccv_cnnp_model_variable_t*)super;
4021	outputs[0] = ccv_nnc_tensor_symbol_new(graph, self->params, 0);
4022}
4023 
4024static ccv_cnnp_model_t* _ccv_cnnp_variable_copy(const ccv_cnnp_model_t* const super, void* const context);
4025 
4026static const ccv_cnnp_model_vtab_t ccv_cnnp_variable_isa = {
4027	.build = _ccv_cnnp_variable_build,
4028	.copy = _ccv_cnnp_variable_copy,
4029};
4030 
4031ccv_cnnp_model_t* ccv_cnnp_variable(const ccv_nnc_tensor_param_t params, const char* const name)
4032{
4033	ccv_cnnp_model_variable_t* const model_variable = (ccv_cnnp_model_variable_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_variable_t));
4034	model_variable->super.isa = &ccv_cnnp_variable_isa;
4035	model_variable->super.input_size = 0;
4036	model_variable->super.outputs = &model_variable->output;
4037	model_variable->super.output_size = 1;
4038	ccv_cnnp_model_copy_name(&model_variable->super, name);
4039	model_variable->params = params;
4040	return (ccv_cnnp_model_t*)model_variable;
4041}
4042 
4043static ccv_cnnp_model_t* _ccv_cnnp_variable_copy(const ccv_cnnp_model_t* const super, void* const context)
4044{
4045	const ccv_cnnp_model_variable_t* const self = (const ccv_cnnp_model_variable_t*)super;
4046	return ccv_cnnp_variable(self->params, self->super.name);
4047}
4048 
4049// MARK - Send Layer
4050 
4051typedef struct {
4052	ccv_cnnp_model_t super;
4053	int device_id;
4054	ccv_nnc_tensor_symbol_t output;
4055} ccv_cnnp_model_send_t;
4056 
4057static void _ccv_cnnp_send_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4058{
4059	ccv_cnnp_model_send_t* const self = (ccv_cnnp_model_send_t*)super;
4060	PRINT(CCV_CLI_VERBOSE, "[cnnp_send_build] - device_id: %d\n", self->device_id)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_send_build] - device_id: %d\n", self->device_id
); fflush(stdout); } } while (0);
4061	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 4061, __extension__ __PRETTY_FUNCTION__); }));
4062	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 4062, __extension__ __PRETTY_FUNCTION__
); }));
4063	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4064	params.type = (params.type & ~0x3) | CCV_TENSOR_GPU_MEMORY;
4065	CCV_TENSOR_SET_DEVICE_ID(params.type, self->device_id)(params.type) = (((params.type) & ~0xfff00) | (((self->
device_id) & 0xfff) << 8));
4066	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4067	ccv_nnc_graph_exec_symbol_new(graph, CMD_DATA_TRANSFER_FORWARD()ccv_nnc_cmd(CCV_NNC_DATA_TRANSFER_FORWARD, 0, ccv_nnc_cmd_auto
, 0), inputs, 1, outputs, 1, "send");
4068}
4069 
4070static ccv_cnnp_model_t* _ccv_cnnp_send_copy(const ccv_cnnp_model_t* const super, void* const context);
4071 
4072static const ccv_cnnp_model_vtab_t ccv_cnnp_send_isa = {
4073	.build = _ccv_cnnp_send_build,
4074	.copy = _ccv_cnnp_send_copy,
4075};
4076 
4077ccv_cnnp_model_t* ccv_cnnp_send(const int device_id, const char* const name)
4078{
4079	assert(device_id >= 0)((void) sizeof ((device_id >= 0) ? 1 : 0), __extension__ (
{ if (device_id >= 0) ; else __assert_fail ("device_id >= 0"
, "ccv_cnnp_model_addons.c", 4079, __extension__ __PRETTY_FUNCTION__
); }));
4080	ccv_cnnp_model_send_t* const model_send = (ccv_cnnp_model_send_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_send_t));
4081	model_send->super.isa = &ccv_cnnp_send_isa;
4082	model_send->super.input_size = 1;
4083	model_send->super.outputs = &model_send->output;
4084	model_send->super.output_size = 1;
4085	ccv_cnnp_model_copy_name(&model_send->super, name);
4086	model_send->device_id = device_id;
4087	return (ccv_cnnp_model_t*)model_send;
4088}
4089 
4090static ccv_cnnp_model_t* _ccv_cnnp_send_copy(const ccv_cnnp_model_t* const super, void* const context)
4091{
4092	const ccv_cnnp_model_send_t* const self = (const ccv_cnnp_model_send_t*)super;
4093	return ccv_cnnp_send(self->device_id, self->super.name);
4094}
4095 
4096// MARK - Move Layer
4097 
4098typedef struct {
4099	ccv_cnnp_model_t super;
4100	ccv_nnc_tensor_symbol_t output;
4101} ccv_cnnp_model_move_t;
4102 
4103static void _ccv_cnnp_move_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4104{
4105	PRINT(CCV_CLI_VERBOSE, "[cnnp_move_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_move_build] -\n"); fflush(stdout); } } while
 (0);
4106	assert(input_size == 2)((void) sizeof ((input_size == 2) ? 1 : 0), __extension__ ({ if
 (input_size == 2) ; else __assert_fail ("input_size == 2", "ccv_cnnp_model_addons.c"
, 4106, __extension__ __PRETTY_FUNCTION__); }));
4107	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 4107, __extension__ __PRETTY_FUNCTION__
); }));
4108	outputs[0] = inputs[1];
4109	ccv_nnc_graph_exec_symbol_new(graph, CMD_FORMAT_TRANSFORM_FORWARD()ccv_nnc_cmd(CCV_NNC_FORMAT_TRANSFORM_FORWARD, 0, ccv_nnc_cmd_auto
, 0), inputs, 1, outputs, 1, "move");
4110}
4111 
4112static ccv_cnnp_model_t* _ccv_cnnp_move_copy(const ccv_cnnp_model_t* const super, void* const context);
4113 
4114static const ccv_cnnp_model_vtab_t ccv_cnnp_move_isa = {
4115	.build = _ccv_cnnp_move_build,
4116	.copy = _ccv_cnnp_move_copy,
4117};
4118 
4119ccv_cnnp_model_t* ccv_cnnp_move(const char* const name)
4120{
4121	ccv_cnnp_model_move_t* const model_move = (ccv_cnnp_model_move_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_move_t));
4122	model_move->super.isa = &ccv_cnnp_move_isa;
4123	model_move->super.input_size = 2;
4124	model_move->super.outputs = &model_move->output;
4125	model_move->super.output_size = 1;
4126	ccv_cnnp_model_copy_name(&model_move->super, name);
4127	return (ccv_cnnp_model_t*)model_move;
4128}
4129 
4130static ccv_cnnp_model_t* _ccv_cnnp_move_copy(const ccv_cnnp_model_t* const super, void* const context)
4131{
4132	const ccv_cnnp_model_move_t* const self = (const ccv_cnnp_model_move_t*)super;
4133	return ccv_cnnp_move(self->super.name);
4134}
4135 
4136// MARK - "Making" Contiguous Layer
4137 
4138typedef struct {
4139	ccv_cnnp_model_t super;
4140	ccv_nnc_tensor_symbol_t output;
4141} ccv_cnnp_model_contiguous_t;
4142 
4143static void _ccv_cnnp_contiguous_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4144{
4145	PRINT(CCV_CLI_VERBOSE, "[cnnp_contiguous_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_contiguous_build] -\n"); fflush(stdout); } }
 while (0);
4146	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 4146, __extension__ __PRETTY_FUNCTION__); }));
4147	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 4147, __extension__ __PRETTY_FUNCTION__
); }));
4148	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4149	ccv_nnc_tensor_symbol_t to = ccv_nnc_tensor_symbol_alias_to(graph, inputs[0]);
4150	if (to.d == CCV_NNC_NO_TENSOR_SYMBOL) // If we are not reshape an alias, it is straightforward.
4151	{
4152		outputs[0] = inputs[0];
4153		return;
4154	}
4155	// Otherwise, we need to check its stride to know if it is contiguous.
4156	int old_stride[CCV_NNC_MAX_DIM_ALLOC(12)];
4157	ccv_nnc_tensor_symbol_alias_params(graph, inputs[0], 0, old_stride);
4158	// We identify permute by checking if the stride is not in descending order.
4159	// This also covered "permute" through reshape, rather than using ccv_cnnp_permute directly.
4160	if (ccv_nnc_is_tensor_stride_packed(old_stride, params.dim))
4161	{
4162		outputs[0] = inputs[0];
4163		return;
4164	}
4165	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4166	ccv_nnc_graph_exec_symbol_t make_contiguous = ccv_nnc_graph_exec_symbol_new(graph, CMD_FORMAT_TRANSFORM_FORWARD()ccv_nnc_cmd(CCV_NNC_FORMAT_TRANSFORM_FORWARD, 0, ccv_nnc_cmd_auto
, 0), inputs, 1, outputs, 1, "contiguous");
4167	ccv_nnc_graph_exec_symbol_set_flags(graph, make_contiguous, CCV_NNC_GRAPH_EXEC_DISABLE_OPT);
4168}
4169 
4170static ccv_cnnp_model_t* _ccv_cnnp_contiguous_copy(const ccv_cnnp_model_t* const super, void* const context);
4171 
4172static const ccv_cnnp_model_vtab_t ccv_cnnp_contiguous_isa = {
4173	.build = _ccv_cnnp_contiguous_build,
4174	.copy = _ccv_cnnp_contiguous_copy,
4175};
4176 
4177ccv_cnnp_model_t* ccv_cnnp_contiguous(const char* const name)
4178{
4179	ccv_cnnp_model_contiguous_t* const model_contiguous = (ccv_cnnp_model_contiguous_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_contiguous_t));
4180	model_contiguous->super.isa = &ccv_cnnp_contiguous_isa;
4181	model_contiguous->super.input_size = 1;
4182	model_contiguous->super.outputs = &model_contiguous->output;
4183	model_contiguous->super.output_size = 1;
4184	ccv_cnnp_model_copy_name(&model_contiguous->super, name);
4185	return (ccv_cnnp_model_t*)model_contiguous;
4186}
4187 
4188static ccv_cnnp_model_t* _ccv_cnnp_contiguous_copy(const ccv_cnnp_model_t* const super, void* const context)
4189{
4190	const ccv_cnnp_model_contiguous_t* const self = (const ccv_cnnp_model_contiguous_t*)super;
4191	return ccv_cnnp_contiguous(self->super.name);
4192}
4193 
4194// MARK - "Making" Copy Layer
4195 
4196typedef struct {
4197	ccv_cnnp_model_t super;
4198	ccv_nnc_tensor_symbol_t output;
4199} ccv_cnnp_model_copy_t;
4200 
4201static void _ccv_cnnp_copy_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4202{
4203	PRINT(CCV_CLI_VERBOSE, "[cnnp_copy_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_copy_build] -\n"); fflush(stdout); } } while
 (0);
4204	assert(input_size == 1)((void) sizeof ((input_size == 1) ? 1 : 0), __extension__ ({ if
 (input_size == 1) ; else __assert_fail ("input_size == 1", "ccv_cnnp_model_addons.c"
, 4204, __extension__ __PRETTY_FUNCTION__); }));
4205	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 4205, __extension__ __PRETTY_FUNCTION__
); }));
4206	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4207	ccv_nnc_tensor_symbol_t to = ccv_nnc_tensor_symbol_alias_to(graph, inputs[0]);
4208	if (to.d == CCV_NNC_NO_TENSOR_SYMBOL) // If we are not reshape an alias, it is straightforward.
4209	{
4210		outputs[0] = inputs[0];
4211		return;
4212	}
4213	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4214	ccv_nnc_graph_exec_symbol_t make_contiguous = ccv_nnc_graph_exec_symbol_new(graph, CMD_FORMAT_TRANSFORM_FORWARD()ccv_nnc_cmd(CCV_NNC_FORMAT_TRANSFORM_FORWARD, 0, ccv_nnc_cmd_auto
, 0), inputs, 1, outputs, 1, "contiguous");
4215	ccv_nnc_graph_exec_symbol_set_flags(graph, make_contiguous, CCV_NNC_GRAPH_EXEC_DISABLE_OPT);
4216}
4217 
4218static ccv_cnnp_model_t* _ccv_cnnp_copy_copy(const ccv_cnnp_model_t* const super, void* const context);
4219 
4220static const ccv_cnnp_model_vtab_t ccv_cnnp_copy_isa = {
4221	.build = _ccv_cnnp_copy_build,
4222	.copy = _ccv_cnnp_copy_copy,
4223};
4224 
4225ccv_cnnp_model_t* ccv_cnnp_copy(const char* const name)
4226{
4227	ccv_cnnp_model_copy_t* const model_copy = (ccv_cnnp_model_copy_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_copy_t));
4228	model_copy->super.isa = &ccv_cnnp_copy_isa;
4229	model_copy->super.input_size = 1;
4230	model_copy->super.outputs = &model_copy->output;
4231	model_copy->super.output_size = 1;
4232	ccv_cnnp_model_copy_name(&model_copy->super, name);
4233	return (ccv_cnnp_model_t*)model_copy;
4234}
4235 
4236static ccv_cnnp_model_t* _ccv_cnnp_copy_copy(const ccv_cnnp_model_t* const super, void* const context)
4237{
4238	const ccv_cnnp_model_copy_t* const self = (const ccv_cnnp_model_copy_t*)super;
4239	return ccv_cnnp_copy(self->super.name);
4240}
4241 
4242// MARK - All-To-All Layer
4243 
4244typedef struct {
4245	ccv_cnnp_model_t super;
4246	int axis;
4247	ccv_nnc_tensor_symbol_t outputs[1];
4248} ccv_cnnp_model_all_to_all_t;
4249 
4250static void _ccv_cnnp_all_to_all_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4251{
4252	ccv_cnnp_model_all_to_all_t* const self = (ccv_cnnp_model_all_to_all_t*)super;
4253	PRINT(CCV_CLI_VERBOSE, "[cnnp_all_to_all_build] - axis: %d\n", self->axis)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_all_to_all_build] - axis: %d\n", self->axis
); fflush(stdout); } } while (0);
4254	assert(input_size == self->super.input_size)((void) sizeof ((input_size == self->super.input_size) ? 1
 : 0), __extension__ ({ if (input_size == self->super.input_size
) ; else __assert_fail ("input_size == self->super.input_size"
, "ccv_cnnp_model_addons.c", 4254, __extension__ __PRETTY_FUNCTION__
); }));
4255	assert(output_size == self->super.output_size)((void) sizeof ((output_size == self->super.output_size) ?
 1 : 0), __extension__ ({ if (output_size == self->super.output_size
) ; else __assert_fail ("output_size == self->super.output_size"
, "ccv_cnnp_model_addons.c", 4255, __extension__ __PRETTY_FUNCTION__
); }));
4256	assert(input_size == output_size)((void) sizeof ((input_size == output_size) ? 1 : 0), __extension__
 ({ if (input_size == output_size) ; else __assert_fail ("input_size == output_size"
, "ccv_cnnp_model_addons.c", 4256, __extension__ __PRETTY_FUNCTION__
); }));
4257	assert(input_size > 0)((void) sizeof ((input_size > 0) ? 1 : 0), __extension__ (
{ if (input_size > 0) ; else __assert_fail ("input_size > 0"
, "ccv_cnnp_model_addons.c", 4257, __extension__ __PRETTY_FUNCTION__
); }));
4258	const ccv_nnc_tensor_param_t input_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4259	const int nd = ccv_nnc_tensor_nd(input_params.dim);
4260	assert(self->axis >= 0 && self->axis < nd)((void) sizeof ((self->axis >= 0 && self->axis
 < nd) ? 1 : 0), __extension__ ({ if (self->axis >= 0
 && self->axis < nd) ; else __assert_fail ("self->axis >= 0 && self->axis < nd"
, "ccv_cnnp_model_addons.c", 4260, __extension__ __PRETTY_FUNCTION__
); }));
4261	assert(input_params.dim[self->axis] % input_size == 0)((void) sizeof ((input_params.dim[self->axis] % input_size
 == 0) ? 1 : 0), __extension__ ({ if (input_params.dim[self->
axis] % input_size == 0) ; else __assert_fail ("input_params.dim[self->axis] % input_size == 0"
, "ccv_cnnp_model_addons.c", 4261, __extension__ __PRETTY_FUNCTION__
); }));
4262	int i;
4263	for (i = 0; i < input_size; i++)
4264	{
4265		const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[i]);
4266		assert(params.format == input_params.format)((void) sizeof ((params.format == input_params.format) ? 1 : 0
), __extension__ ({ if (params.format == input_params.format)
 ; else __assert_fail ("params.format == input_params.format"
, "ccv_cnnp_model_addons.c", 4266, __extension__ __PRETTY_FUNCTION__
); }));
4267		assert(params.datatype == input_params.datatype)((void) sizeof ((params.datatype == input_params.datatype) ? 1
 : 0), __extension__ ({ if (params.datatype == input_params.datatype
) ; else __assert_fail ("params.datatype == input_params.datatype"
, "ccv_cnnp_model_addons.c", 4267, __extension__ __PRETTY_FUNCTION__
); }));
4268		assert(CCV_TENSOR_GET_MEMORY(params.type) == CCV_TENSOR_GET_MEMORY(input_params.type))((void) sizeof ((((params.type) & 0x3) == ((input_params.
type) & 0x3)) ? 1 : 0), __extension__ ({ if (((params.type
) & 0x3) == ((input_params.type) & 0x3)) ; else __assert_fail
 ("CCV_TENSOR_GET_MEMORY(params.type) == CCV_TENSOR_GET_MEMORY(input_params.type)"
, "ccv_cnnp_model_addons.c", 4268, __extension__ __PRETTY_FUNCTION__
); }));
4269		assert(memcmp(params.dim, input_params.dim, sizeof(input_params.dim)) == 0)((void) sizeof ((memcmp(params.dim, input_params.dim, sizeof(
input_params.dim)) == 0) ? 1 : 0), __extension__ ({ if (memcmp
(params.dim, input_params.dim, sizeof(input_params.dim)) == 0
) ; else __assert_fail ("memcmp(params.dim, input_params.dim, sizeof(input_params.dim)) == 0"
, "ccv_cnnp_model_addons.c", 4269, __extension__ __PRETTY_FUNCTION__
); }));
4270		outputs[i] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4271	}
4272	ccv_nnc_graph_exec_symbol_new(graph, CMD_COMM_ALL_TO_ALL_FORWARD(self->axis)ccv_nnc_cmd(CCV_NNC_COMM_ALL_TO_ALL_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.all_to_all={.axis=self->axis}}), 0
), inputs, input_size, outputs, output_size, "all_to_all");
4273}
4274 
4275static ccv_cnnp_model_t* _ccv_cnnp_all_to_all_copy(const ccv_cnnp_model_t* const super, void* const context);
4276 
4277static const ccv_cnnp_model_vtab_t ccv_cnnp_all_to_all_isa = {
4278	.build = _ccv_cnnp_all_to_all_build,
4279	.copy = _ccv_cnnp_all_to_all_copy,
4280};
4281 
4282ccv_cnnp_model_t* ccv_cnnp_all_to_all(const int count, const int axis, const char* const name)
4283{
4284	assert(count > 0)((void) sizeof ((count > 0) ? 1 : 0), __extension__ ({ if (
count > 0) ; else __assert_fail ("count > 0", "ccv_cnnp_model_addons.c"
, 4284, __extension__ __PRETTY_FUNCTION__); }));
4285	assert(axis >= 0)((void) sizeof ((axis >= 0) ? 1 : 0), __extension__ ({ if (
axis >= 0) ; else __assert_fail ("axis >= 0", "ccv_cnnp_model_addons.c"
, 4285, __extension__ __PRETTY_FUNCTION__); }));
4286	ccv_cnnp_model_all_to_all_t* const model_all_to_all = (ccv_cnnp_model_all_to_all_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_all_to_all_t) + sizeof(ccv_nnc_tensor_symbol_t) * (count - 1));
4287	model_all_to_all->super.isa = &ccv_cnnp_all_to_all_isa;
4288	model_all_to_all->super.input_size = count;
4289	model_all_to_all->super.outputs = model_all_to_all->outputs;
4290	model_all_to_all->super.output_size = count;
4291	model_all_to_all->axis = axis;
4292	ccv_cnnp_model_copy_name(&model_all_to_all->super, name);
4293	return (ccv_cnnp_model_t*)model_all_to_all;
4294}
4295 
4296static ccv_cnnp_model_t* _ccv_cnnp_all_to_all_copy(const ccv_cnnp_model_t* const super, void* const context)
4297{
4298	const ccv_cnnp_model_all_to_all_t* const self = (const ccv_cnnp_model_all_to_all_t*)super;
4299	return ccv_cnnp_all_to_all(self->super.output_size, self->axis, self->super.name);
4300}
4301 
4302// MARK - Scaled-Dot Product Attention Layer
4303 
4304typedef struct {
4305	ccv_cnnp_model_t super;
4306	ccv_nnc_tensor_symbol_t output;
4307	ccv_nnc_tensor_symbol_t weights;
4308	ccv_nnc_tensor_symbol_t bias;
4309	float scale;
4310	int is_causal;
4311	int has_attn_mask;
4312	int flags;
4313	int fused_unify_head_weights;
4314	int no_bias;
4315} ccv_cnnp_model_scaled_dot_product_attention_t;
4316 
4317static void _ccv_cnnp_scaled_dot_product_attention_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4318{
4319	PRINT(CCV_CLI_VERBOSE, "[cnnp_scaled_dot_product_attention_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_scaled_dot_product_attention_build] -\n"); fflush
(stdout); } } while (0);
4320	assert(input_size == 3 || input_size == 4)((void) sizeof ((input_size == 3 || input_size == 4) ? 1 : 0)
, __extension__ ({ if (input_size == 3 || input_size == 4) ; else
 __assert_fail ("input_size == 3 || input_size == 4", "ccv_cnnp_model_addons.c"
, 4320, __extension__ __PRETTY_FUNCTION__); }));
4321	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 4321, __extension__ __PRETTY_FUNCTION__
); }));
4322	ccv_cnnp_model_scaled_dot_product_attention_t* const self = (ccv_cnnp_model_scaled_dot_product_attention_t*)super;
4323	const ccv_nnc_tensor_param_t q_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4324	const ccv_nnc_tensor_param_t k_params = ccv_nnc_tensor_symbol_params(graph, inputs[1]);
4325	const ccv_nnc_tensor_param_t v_params = ccv_nnc_tensor_symbol_params(graph, inputs[2]);
4326	const int v_nd = ccv_nnc_tensor_nd(v_params.dim);
4327	assert(v_nd == 3 || v_nd == 4)((void) sizeof ((v_nd == 3 || v_nd == 4) ? 1 : 0), __extension__
 ({ if (v_nd == 3 || v_nd == 4) ; else __assert_fail ("v_nd == 3 || v_nd == 4"
, "ccv_cnnp_model_addons.c", 4327, __extension__ __PRETTY_FUNCTION__
); }));
4328	const int hEv = (v_nd == 3 ? 1 : v_params.dim[2]) * v_params.dim[v_nd - 1];
4329	ccv_nnc_tensor_param_t weights_params = q_params;
4330	memset(weights_params.dim, 0, sizeof(weights_params.dim));
4331	weights_params.dim[0] = hEv;
4332	weights_params.dim[1] = hEv;
4333	ccv_nnc_tensor_param_t bias_params = q_params;
4334	memset(bias_params.dim, 0, sizeof(bias_params.dim));
4335	bias_params.dim[0] = hEv;
4336	ccv_nnc_cmd_t cmd = {0};
4337	cmd.cmd = CCV_NNC_SCALED_DOT_PRODUCT_ATTENTION_FORWARD;
4338	cmd.info.scaled_dot_product_attention.scale = self->scale;
4339	cmd.info.scaled_dot_product_attention.is_causal = self->is_causal;
4340	cmd.info.scaled_dot_product_attention.flags = self->flags;
4341	ccv_nnc_tensor_param_t output_params[3];
4342	ccv_nnc_tensor_symbol_t output;
4343	ccv_nnc_tensor_symbol_t saved_softmax_lse;
4344	ccv_nnc_tensor_symbol_t saved_v_proj = NO_TENSOR_SYMBOL(const ccv_nnc_tensor_symbol_t){.d = CCV_NNC_NO_TENSOR_SYMBOL
};
4345	ccv_nnc_tensor_symbol_t attn_mask = NO_TENSOR_SYMBOL(const ccv_nnc_tensor_symbol_t){.d = CCV_NNC_NO_TENSOR_SYMBOL
};
4346	ccv_nnc_tensor_symbol_t weights = NO_TENSOR_SYMBOL(const ccv_nnc_tensor_symbol_t){.d = CCV_NNC_NO_TENSOR_SYMBOL
};
4347	ccv_nnc_tensor_symbol_t bias = NO_TENSOR_SYMBOL(const ccv_nnc_tensor_symbol_t){.d = CCV_NNC_NO_TENSOR_SYMBOL
};
4348	if (self->has_attn_mask)
4349		attn_mask = inputs[3];
4350	if (self->fused_unify_head_weights)
4351	{
4352		if (!self->weights.graph)
4353			self->weights = ccv_nnc_tensor_symbol_new(graph, weights_params, "weights");
4354		weights = self->weights;
4355		if (!self->no_bias)
4356		{
4357			if (!self->bias.graph)
4358				self->bias = ccv_nnc_tensor_symbol_new(graph, bias_params, "bias");
4359			bias = self->bias;
4360		}
4361		ccv_nnc_hint_tensor_auto(cmd, (ccv_nnc_tensor_param_t []){
4362				q_params,
4363				k_params,
4364				v_params,
4365				(ccv_nnc_tensor_param_t){},
4366				weights_params,
4367				bias_params,
4368			}, 6, ccv_nnc_no_hint, output_params, 3);
4369		output = ccv_nnc_tensor_symbol_new(graph, output_params[0], 0);
4370		saved_softmax_lse = ccv_nnc_tensor_symbol_new(graph, output_params[1], 0);
4371		saved_v_proj = ccv_nnc_tensor_symbol_new(graph, output_params[2], 0);
4372	} else {
4373		ccv_nnc_hint_tensor_auto(cmd, (ccv_nnc_tensor_param_t []){
4374				q_params,
4375				k_params,
4376				v_params,
4377			}, 3, ccv_nnc_no_hint, output_params, 2);
4378		output = ccv_nnc_tensor_symbol_new(graph, output_params[0], 0);
4379		saved_softmax_lse = ccv_nnc_tensor_symbol_new(graph, output_params[1], 0);
4380	}
4381	ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0], inputs[1], inputs[2], attn_mask, weights, bias)(const ccv_nnc_tensor_symbol_t []){inputs[0], inputs[1], inputs
[2], attn_mask, weights, bias}, (1 +1 +1 +1 +1 +1 +1 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output, saved_softmax_lse, saved_v_proj)(const ccv_nnc_tensor_symbol_t []){output, saved_softmax_lse,
 saved_v_proj}, (1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 -1), "scaled_dot_product_attention");
4382	outputs[0] = output;
4383}
4384 
4385static void _ccv_cnnp_scaled_dot_product_attention_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
4386{
4387	ccv_cnnp_model_scaled_dot_product_attention_t* const self = (ccv_cnnp_model_scaled_dot_product_attention_t*)super;
4388	if (self->weights.graph)
4389	{
4390		assert(self->fused_unify_head_weights)((void) sizeof ((self->fused_unify_head_weights) ? 1 : 0),
 __extension__ ({ if (self->fused_unify_head_weights) ; else
 __assert_fail ("self->fused_unify_head_weights", "ccv_cnnp_model_addons.c"
, 4390, __extension__ __PRETTY_FUNCTION__); }));
4391		const ccv_nnc_tensor_param_t weight_params = ccv_nnc_tensor_symbol_params(graph, self->weights);
4392		const int c = weight_params.dim[1];
4393		const float std = sqrtf(2) / sqrtf(c);
4394		const float bound = sqrtf(3) * std;
4395		initializer(context, CMD_RANDOM_UNIFORM_FORWARD(-bound, bound)ccv_nnc_cmd(CCV_NNC_RANDOM_UNIFORM_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={-bound, bound}}}, 0), ccv_nnc_no_hint, 0, 0, self->weights);
4396		if (self->bias.graph)
4397			initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, self->bias);
4398	}
4399}
4400 
4401static void _ccv_cnnp_scaled_dot_product_attention_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
4402{
4403	ccv_cnnp_model_scaled_dot_product_attention_t* const self = (ccv_cnnp_model_scaled_dot_product_attention_t*)super;
4404	if (self->weights.graph)
4405	{
4406		assert(self->fused_unify_head_weights)((void) sizeof ((self->fused_unify_head_weights) ? 1 : 0),
 __extension__ ({ if (self->fused_unify_head_weights) ; else
 __assert_fail ("self->fused_unify_head_weights", "ccv_cnnp_model_addons.c"
, 4406, __extension__ __PRETTY_FUNCTION__); }));
4407		add_to_array(parameters, self->weights, is_trainable);
4408		if (self->bias.graph)
4409			add_to_array(parameters, self->bias, is_trainable);
4410	}
4411}
4412 
4413static ccv_cnnp_model_t* _ccv_cnnp_scaled_dot_product_attention_copy(const ccv_cnnp_model_t* const super, void* const context);
4414 
4415static const ccv_cnnp_model_vtab_t ccv_cnnp_scaled_dot_product_attention_isa = {
4416	.build = _ccv_cnnp_scaled_dot_product_attention_build,
4417	.copy = _ccv_cnnp_scaled_dot_product_attention_copy,
4418};
4419 
4420static const ccv_cnnp_model_vtab_t ccv_cnnp_scaled_dot_product_attention_fused_isa = {
4421	.build = _ccv_cnnp_scaled_dot_product_attention_build,
4422	.init_states = _ccv_cnnp_scaled_dot_product_attention_init_states,
4423	.add_to_parameter = _ccv_cnnp_scaled_dot_product_attention_add_to_parameter,
4424	.copy = _ccv_cnnp_scaled_dot_product_attention_copy,
4425};
4426 
4427ccv_cnnp_model_t* ccv_cnnp_scaled_dot_product_attention(const float scale, const int is_causal, const int has_attn_mask, const int flags, const int fused_unify_head_weights, const int no_bias, const int is_trainable, const char* const name)
4428{
4429	ccv_cnnp_model_scaled_dot_product_attention_t* const model_scaled_dot_product_attention = (ccv_cnnp_model_scaled_dot_product_attention_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_scaled_dot_product_attention_t));
4430	model_scaled_dot_product_attention->super.isa = fused_unify_head_weights ? &ccv_cnnp_scaled_dot_product_attention_fused_isa : &ccv_cnnp_scaled_dot_product_attention_isa;
4431	model_scaled_dot_product_attention->super.input_size = has_attn_mask ? 4 : 3;
4432	model_scaled_dot_product_attention->super.outputs = &model_scaled_dot_product_attention->output;
4433	model_scaled_dot_product_attention->super.output_size = 1;
4434	model_scaled_dot_product_attention->super.is_trainable = is_trainable;
4435	ccv_cnnp_model_copy_name(&model_scaled_dot_product_attention->super, name);
4436	model_scaled_dot_product_attention->weights.d = CCV_NNC_NO_TENSOR_SYMBOL;
4437	model_scaled_dot_product_attention->weights.graph = 0;
4438	model_scaled_dot_product_attention->bias.d = CCV_NNC_NO_TENSOR_SYMBOL;
4439	model_scaled_dot_product_attention->bias.graph = 0;
4440	model_scaled_dot_product_attention->scale = scale;
4441	model_scaled_dot_product_attention->is_causal = is_causal;
4442	model_scaled_dot_product_attention->has_attn_mask = has_attn_mask;
4443	model_scaled_dot_product_attention->flags = flags;
4444	model_scaled_dot_product_attention->fused_unify_head_weights = fused_unify_head_weights;
4445	model_scaled_dot_product_attention->no_bias = no_bias;
4446	return (ccv_cnnp_model_t*)model_scaled_dot_product_attention;
4447}
4448 
4449static ccv_cnnp_model_t* _ccv_cnnp_scaled_dot_product_attention_copy(const ccv_cnnp_model_t* const super, void* const context)
4450{
4451	const ccv_cnnp_model_scaled_dot_product_attention_t* const self = (const ccv_cnnp_model_scaled_dot_product_attention_t*)super;
4452	return ccv_cnnp_scaled_dot_product_attention(self->scale, self->is_causal, self->has_attn_mask, self->flags, self->fused_unify_head_weights, self->no_bias, self->super.is_trainable, self->super.name);
4453}
4454 
4455// MARK - Debug Layer
4456 
4457typedef struct {
4458	ccv_cnnp_model_t super;
4459	ccv_nnc_tensor_symbol_t output;
4460	ccv_cnnp_model_debug_f debugger;
4461	ccv_cnnp_model_debug_context_deinit_f debug_deinit;
4462	ccv_cnnp_model_debug_context_copy_f debug_copy;
4463	void* debug_context;
4464} ccv_cnnp_model_debug_t;
4465 
4466static int _ccv_cnnp_debug_exec(const ccv_nnc_cmd_t cmd, const ccv_nnc_hint_t hint, const int flags, ccv_nnc_tensor_t* const* const inputs, const int input_size, ccv_nnc_tensor_t* const* const outputs, const int output_size, ccv_nnc_stream_context_t* const stream_context)
4467{
4468	if (cmd.cmd == CCV_NNC_CUSTOM_BACKWARD)
4469	{
4470		assert(0 && "don't support debug backward pass yet")((void) sizeof ((0 && "don't support debug backward pass yet"
) ? 1 : 0), __extension__ ({ if (0 && "don't support debug backward pass yet"
) ; else __assert_fail ("0 && \"don't support debug backward pass yet\""
, "ccv_cnnp_model_addons.c", 4470, __extension__ __PRETTY_FUNCTION__
); }));
4471	}
4472	ccv_cnnp_model_debug_t* const self = (ccv_cnnp_model_debug_t*)cmd.data;
4473	self->debugger(inputs, input_size, stream_context, self->debug_context);
4474	return CCV_NNC_EXEC_SUCCESS;
4475}
4476 
4477static ccv_nnc_cmd_vtab_t ccv_cnnp_debug_exec_isa = {
4478	.exec = _ccv_cnnp_debug_exec
4479};
4480 
4481static void _ccv_cnnp_debug_build(ccv_cnnp_model_t* const self, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4482{
4483	PRINT(CCV_CLI_VERBOSE, "[cnnp_debug_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_debug_build] -\n"); fflush(stdout); } } while
 (0);
4484	assert(input_size >= 1)((void) sizeof ((input_size >= 1) ? 1 : 0), __extension__ (
{ if (input_size >= 1) ; else __assert_fail ("input_size >= 1"
, "ccv_cnnp_model_addons.c", 4484, __extension__ __PRETTY_FUNCTION__
); }));
4485	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 4485, __extension__ __PRETTY_FUNCTION__
); }));
4486	ccv_nnc_tensor_symbol_t to = ccv_nnc_tensor_symbol_alias_to(graph, inputs[0]);
4487	ccv_nnc_tensor_param_t output_params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4488	if (to.d == CCV_NNC_NO_TENSOR_SYMBOL) // If we are not reshape an alias, it is straightforward.
4489	{
4490		int ofs[CCV_NNC_MAX_DIM_ALLOC(12)] = {0};
4491		int stride[CCV_NNC_MAX_DIM_ALLOC(12)];
4492		ccv_nnc_tensor_get_stride(output_params.dim, stride);
4493		outputs[0] = ccv_nnc_tensor_symbol_alias_new(graph, inputs[0], ofs, stride, output_params, 0);
4494	} else {
4495		int old_ofs[CCV_NNC_MAX_DIM_ALLOC(12)];
4496		int old_stride[CCV_NNC_MAX_DIM_ALLOC(12)];
4497		ccv_nnc_tensor_symbol_alias_params(graph, inputs[0], old_ofs, old_stride);
4498		outputs[0] = ccv_nnc_tensor_symbol_alias_new(graph, to, old_ofs, old_stride, output_params, 0);
4499	}
4500	ccv_nnc_cmd_t cmd = ccv_nnc_cmd(CCV_NNC_CUSTOM_FORWARD, (ccv_nnc_cmd_vtab_t*)&ccv_cnnp_debug_exec_isa, (ccv_nnc_cmd_param_t){}, 0);
4501	cmd.data = self;
4502	ccv_nnc_graph_exec_symbol_t make_debug = ccv_nnc_graph_exec_symbol_new(graph, cmd, inputs, input_size, outputs, 1, "debug");
4503	// Disable any optimizations.
4504	ccv_nnc_graph_exec_symbol_set_flags(graph, make_debug, CCV_NNC_GRAPH_EXEC_DISABLE_OPT);
4505}
4506 
4507static void _ccv_cnnp_debug_deinit(ccv_cnnp_model_t* const super)
4508{
4509	const ccv_cnnp_model_debug_t* const self = (const ccv_cnnp_model_debug_t*)super;
4510	if (self->debug_deinit && self->debug_context)
4511		self->debug_deinit(self->debug_context);
4512}
4513 
4514static ccv_cnnp_model_t* _ccv_cnnp_debug_copy(const ccv_cnnp_model_t* const super, void* const context);
4515 
4516static const ccv_cnnp_model_vtab_t ccv_cnnp_debug_isa = {
4517	.build = _ccv_cnnp_debug_build,
4518	.deinit = _ccv_cnnp_debug_deinit,
4519	.copy = _ccv_cnnp_debug_copy,
4520};
4521 
4522ccv_cnnp_model_t* ccv_cnnp_debug(ccv_cnnp_model_debug_f func, void* const context, ccv_cnnp_model_debug_context_deinit_f deinit, ccv_cnnp_model_debug_context_copy_f copy, const char* const name)
4523{
4524	ccv_cnnp_model_debug_t* const model_debug = (ccv_cnnp_model_debug_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_debug_t));
4525	model_debug->super.isa = &ccv_cnnp_debug_isa;
4526	model_debug->super.input_size = 0;
4527	model_debug->super.outputs = &model_debug->output;
4528	model_debug->super.output_size = 1;
4529	model_debug->debugger = func;
4530	model_debug->debug_context = context;
4531	model_debug->debug_deinit = deinit;
4532	model_debug->debug_copy = copy;
4533	ccv_cnnp_model_copy_name(&model_debug->super, name);
4534	return (ccv_cnnp_model_t*)model_debug;
4535}
4536 
4537static ccv_cnnp_model_t* _ccv_cnnp_debug_copy(const ccv_cnnp_model_t* const super, void* const context)
4538{
4539	const ccv_cnnp_model_debug_t* const self = (const ccv_cnnp_model_debug_t*)super;
4540	void* debug_context = self->debug_context;
4541	if (self->debug_copy && self->debug_context)
4542		debug_context = self->debug_copy(self->debug_context);
4543	return ccv_cnnp_debug(self->debugger, debug_context, self->debug_deinit, self->debug_copy, self->super.name);
4544}
4545 
4546/// MARK - Sort layer.
4547 
4548typedef struct {
4549	ccv_cnnp_model_t super;
4550	ccv_nnc_tensor_symbol_t outputs[2];
4551	int along_axis;
4552	int descending;
4553} ccv_cnnp_model_sort_t;
4554 
4555static void _ccv_cnnp_sort_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4556{
4557	ccv_cnnp_model_sort_t* const self = (ccv_cnnp_model_sort_t*)super;
4558	PRINT(CCV_CLI_VERBOSE, "[cnnp_sort_build] - along_axis: %d, descending: %d\n", self->along_axis, self->descending)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_sort_build] - along_axis: %d, descending: %d\n"
, self->along_axis, self->descending); fflush(stdout); }
 } while (0);
4559	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4560	assert(output_size == 2)((void) sizeof ((output_size == 2) ? 1 : 0), __extension__ ({
 if (output_size == 2) ; else __assert_fail ("output_size == 2"
, "ccv_cnnp_model_addons.c", 4560, __extension__ __PRETTY_FUNCTION__
); }));
4561	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4562	params.datatype = CCV_32S;
4563	outputs[1] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4564	ccv_nnc_graph_exec_symbol_new(graph, CMD_SORT_FORWARD(self->along_axis, self->descending)ccv_nnc_cmd(CCV_NNC_SORT_FORWARD, 0, ((ccv_nnc_cmd_param_t){.
size={.dim={1,1,1}},.sort={.along_axis=self->along_axis,.descending
=self->descending}}), 0), inputs, input_size, outputs, output_size, "sort");
4565}
4566 
4567static ccv_cnnp_model_t* _ccv_cnnp_sort_copy(const ccv_cnnp_model_t* const self, void* const context);
4568 
4569static const ccv_cnnp_model_vtab_t ccv_cnnp_sort_isa = {
4570	.build = _ccv_cnnp_sort_build,
4571	.copy = _ccv_cnnp_sort_copy,
4572};
4573 
4574ccv_cnnp_model_t* ccv_cnnp_sort(const int along_axis, const int descending, const char* const name)
4575{
4576	ccv_cnnp_model_sort_t* const model_sort = (ccv_cnnp_model_sort_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_sort_t));
4577	model_sort->super.isa = &ccv_cnnp_sort_isa;
4578	model_sort->super.input_size = 0;
4579	model_sort->super.outputs = model_sort->outputs;
4580	model_sort->super.output_size = 2;
4581	model_sort->along_axis = along_axis;
4582	model_sort->descending = descending;
4583	ccv_cnnp_model_copy_name(&model_sort->super, name);
4584	return (ccv_cnnp_model_t*)model_sort;
4585}
4586 
4587static ccv_cnnp_model_t* _ccv_cnnp_sort_copy(const ccv_cnnp_model_t* const super, void* const context)
4588{
4589	ccv_cnnp_model_sort_t* const self = (ccv_cnnp_model_sort_t*)super;
4590	return ccv_cnnp_sort(self->along_axis, self->descending, self->super.name);
4591}
4592 
4593/// MARK - Partition layer.
4594 
4595typedef struct {
4596	ccv_cnnp_model_t super;
4597	ccv_nnc_tensor_symbol_t outputs[2];
4598	int kth;
4599	int along_axis;
4600	int descending;
4601} ccv_cnnp_model_partition_t;
4602 
4603static void _ccv_cnnp_partition_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4604{
4605	ccv_cnnp_model_partition_t* const self = (ccv_cnnp_model_partition_t*)super;
4606	PRINT(CCV_CLI_VERBOSE, "[cnnp_partition_build] - kth: %d, along_axis: %d, descending: %d\n", self->kth, self->along_axis, self->descending)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_partition_build] - kth: %d, along_axis: %d, descending: %d\n"
, self->kth, self->along_axis, self->descending); fflush
(stdout); } } while (0);
4607	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4608	assert(output_size == 2)((void) sizeof ((output_size == 2) ? 1 : 0), __extension__ ({
 if (output_size == 2) ; else __assert_fail ("output_size == 2"
, "ccv_cnnp_model_addons.c", 4608, __extension__ __PRETTY_FUNCTION__
); }));
4609	if (self->kth > 0)
4610		params.dim[self->along_axis] = self->kth;
4611	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4612	params.datatype = CCV_32S;
4613	outputs[1] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4614	ccv_nnc_graph_exec_symbol_new(graph, CMD_PARTITION_FORWARD(self->kth, self->along_axis, self->descending)ccv_nnc_cmd(CCV_NNC_PARTITION_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.partition={.kth=self->kth,.along_axis
=self->along_axis,.descending=self->descending}}), 0), inputs, input_size, outputs, output_size, "partition");
4615}
4616 
4617static ccv_cnnp_model_t* _ccv_cnnp_partition_copy(const ccv_cnnp_model_t* const self, void* const context);
4618 
4619static const ccv_cnnp_model_vtab_t ccv_cnnp_partition_isa = {
4620	.build = _ccv_cnnp_partition_build,
4621	.copy = _ccv_cnnp_partition_copy,
4622};
4623 
4624ccv_cnnp_model_t* ccv_cnnp_partition(const int kth, const int along_axis, const int descending, const char* const name)
4625{
4626	ccv_cnnp_model_partition_t* const model_partition = (ccv_cnnp_model_partition_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_partition_t));
4627	model_partition->super.isa = &ccv_cnnp_partition_isa;
4628	model_partition->super.input_size = 0;
4629	model_partition->super.outputs = model_partition->outputs;
4630	model_partition->super.output_size = 2;
4631	model_partition->kth = kth;
4632	model_partition->along_axis = along_axis;
4633	model_partition->descending = descending;
4634	ccv_cnnp_model_copy_name(&model_partition->super, name);
4635	return (ccv_cnnp_model_t*)model_partition;
4636}
4637 
4638static ccv_cnnp_model_t* _ccv_cnnp_partition_copy(const ccv_cnnp_model_t* const super, void* const context)
4639{
4640	ccv_cnnp_model_partition_t* const self = (ccv_cnnp_model_partition_t*)super;
4641	return ccv_cnnp_partition(self->kth, self->along_axis, self->descending, self->super.name);
4642}
4643 
4644/// MARK - Unique consecutive layer.
4645 
4646typedef struct {
4647	ccv_cnnp_model_t super;
4648	ccv_nnc_tensor_symbol_t outputs[2];
4649	int bincount;
4650} ccv_cnnp_model_unique_consecutive_t;
4651 
4652static void _ccv_cnnp_unique_consecutive_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4653{
4654	ccv_cnnp_model_unique_consecutive_t* const self = (ccv_cnnp_model_unique_consecutive_t*)super;
4655	PRINT(CCV_CLI_VERBOSE, "[cnnp_unique_consecutive_build] - bincount: %d\n", self->bincount)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_unique_consecutive_build] - bincount: %d\n",
 self->bincount); fflush(stdout); } } while (0);
4656	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4657	assert(output_size == 2)((void) sizeof ((output_size == 2) ? 1 : 0), __extension__ ({
 if (output_size == 2) ; else __assert_fail ("output_size == 2"
, "ccv_cnnp_model_addons.c", 4657, __extension__ __PRETTY_FUNCTION__
); }));
4658	if (self->bincount > 0)
4659		params.dim[0] = ccv_min(params.dim[0], self->bincount)({ typeof (params.dim[0]) _a = (params.dim[0]); typeof (self->
bincount) _b = (self->bincount); (_a < _b) ? _a : _b; }
);
4660	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4661	params.datatype = CCV_32S;
4662	outputs[1] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4663	ccv_nnc_graph_exec_symbol_new(graph, CMD_UNIQUE_CONSECUTIVE_FORWARD(self->bincount)ccv_nnc_cmd(CCV_NNC_UNIQUE_CONSECUTIVE_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.unique_consecutive={.bincount=self->
bincount}}), 0), inputs, input_size, outputs, output_size, "unique_consecutive");
4664}
4665 
4666static ccv_cnnp_model_t* _ccv_cnnp_unique_consecutive_copy(const ccv_cnnp_model_t* const self, void* const context);
4667 
4668static const ccv_cnnp_model_vtab_t ccv_cnnp_unique_consecutive_isa = {
4669	.build = _ccv_cnnp_unique_consecutive_build,
4670	.copy = _ccv_cnnp_unique_consecutive_copy,
4671};
4672 
4673ccv_cnnp_model_t* ccv_cnnp_unique_consecutive(const int bincount, const char* const name)
4674{
4675	ccv_cnnp_model_unique_consecutive_t* const model_unique_consecutive = (ccv_cnnp_model_unique_consecutive_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_unique_consecutive_t));
4676	model_unique_consecutive->super.isa = &ccv_cnnp_unique_consecutive_isa;
4677	model_unique_consecutive->super.input_size = 0;
4678	model_unique_consecutive->super.outputs = model_unique_consecutive->outputs;
4679	model_unique_consecutive->super.output_size = 2;
4680	model_unique_consecutive->bincount = bincount;
4681	ccv_cnnp_model_copy_name(&model_unique_consecutive->super, name);
4682	return (ccv_cnnp_model_t*)model_unique_consecutive;
4683}
4684 
4685static ccv_cnnp_model_t* _ccv_cnnp_unique_consecutive_copy(const ccv_cnnp_model_t* const super, void* const context)
4686{
4687	ccv_cnnp_model_unique_consecutive_t* const self = (ccv_cnnp_model_unique_consecutive_t*)super;
4688	return ccv_cnnp_unique_consecutive(self->bincount, self->super.name);
4689}
4690 
4691/// MARK - Scatter add layer.
4692 
4693typedef struct {
4694	ccv_cnnp_model_t super;
4695	ccv_nnc_tensor_symbol_t output;
4696	int bincount;
4697} ccv_cnnp_model_scatter_add_t;
4698 
4699static void _ccv_cnnp_scatter_add_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4700{
4701	ccv_cnnp_model_scatter_add_t* const self = (ccv_cnnp_model_scatter_add_t*)super;
4702	PRINT(CCV_CLI_VERBOSE, "[cnnp_scatter_add_build] - bincount: %d\n", self->bincount)do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_scatter_add_build] - bincount: %d\n", self->
bincount); fflush(stdout); } } while (0);
4703	ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4704	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 4704, __extension__ __PRETTY_FUNCTION__
); }));
4705	assert(self->bincount > 0)((void) sizeof ((self->bincount > 0) ? 1 : 0), __extension__
 ({ if (self->bincount > 0) ; else __assert_fail ("self->bincount > 0"
, "ccv_cnnp_model_addons.c", 4705, __extension__ __PRETTY_FUNCTION__
); }));
4706	params.dim[0] = self->bincount;
4707	outputs[0] = ccv_nnc_tensor_symbol_new(graph, params, 0);
4708	ccv_nnc_graph_exec_symbol_new(graph, CMD_SCATTER_ADD_FORWARD(self->bincount)ccv_nnc_cmd(CCV_NNC_SCATTER_ADD_FORWARD, 0, ((ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.scatter_add={.bincount=self->bincount
}}), 0), inputs, input_size, outputs, output_size, "scatter_add");
4709}
4710 
4711static ccv_cnnp_model_t* _ccv_cnnp_scatter_add_copy(const ccv_cnnp_model_t* const self, void* const context);
4712 
4713static const ccv_cnnp_model_vtab_t ccv_cnnp_scatter_add_isa = {
4714	.build = _ccv_cnnp_scatter_add_build,
4715	.copy = _ccv_cnnp_scatter_add_copy,
4716};
4717 
4718ccv_cnnp_model_t* ccv_cnnp_scatter_add(const int bincount, const char* const name)
4719{
4720	assert(bincount > 0)((void) sizeof ((bincount > 0) ? 1 : 0), __extension__ ({ if
 (bincount > 0) ; else __assert_fail ("bincount > 0", "ccv_cnnp_model_addons.c"
, 4720, __extension__ __PRETTY_FUNCTION__); }));
4721	ccv_cnnp_model_scatter_add_t* const model_scatter_add = (ccv_cnnp_model_scatter_add_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_scatter_add_t));
4722	model_scatter_add->super.isa = &ccv_cnnp_scatter_add_isa;
4723	model_scatter_add->super.input_size = 0;
4724	model_scatter_add->super.outputs = &model_scatter_add->output;
4725	model_scatter_add->super.output_size = 1;
4726	model_scatter_add->bincount = bincount;
4727	ccv_cnnp_model_copy_name(&model_scatter_add->super, name);
4728	return (ccv_cnnp_model_t*)model_scatter_add;
4729}
4730 
4731static ccv_cnnp_model_t* _ccv_cnnp_scatter_add_copy(const ccv_cnnp_model_t* const super, void* const context)
4732{
4733	ccv_cnnp_model_scatter_add_t* const self = (ccv_cnnp_model_scatter_add_t*)super;
4734	return ccv_cnnp_scatter_add(self->bincount, self->super.name);
4735}
4736 
4737// MARK - Segmented Dense Layer
4738 
4739typedef struct {
4740	ccv_cnnp_model_t super;
4741	ccv_nnc_tensor_symbol_t output;
4742	ccv_nnc_tensor_symbol_t weights;
4743	ccv_nnc_tensor_symbol_t bias;
4744	int segments;
4745	int count;
4746	int no_bias;
4747	int flags;
4748} ccv_cnnp_model_segmented_dense_t;
4749 
4750static void _ccv_cnnp_segmented_dense_build(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_nnc_tensor_symbol_t* const inputs, const int input_size, ccv_nnc_tensor_symbol_t* const outputs, const int output_size)
4751{
4752	ccv_cnnp_model_segmented_dense_t* const self = (ccv_cnnp_model_segmented_dense_t*)super;
4753	PRINT(CCV_CLI_VERBOSE, "[cnnp_segmented_dense_build] -\n")do { if ((CCV_CLI_VERBOSE & ccv_cli_get_output_levels()))
 { printf("[cnnp_segmented_dense_build] -\n"); fflush(stdout)
; } } while (0);
4754	assert(input_size == 3)((void) sizeof ((input_size == 3) ? 1 : 0), __extension__ ({ if
 (input_size == 3) ; else __assert_fail ("input_size == 3", "ccv_cnnp_model_addons.c"
, 4754, __extension__ __PRETTY_FUNCTION__); }));
4755	assert(output_size == 1)((void) sizeof ((output_size == 1) ? 1 : 0), __extension__ ({
 if (output_size == 1) ; else __assert_fail ("output_size == 1"
, "ccv_cnnp_model_addons.c", 4755, __extension__ __PRETTY_FUNCTION__
); }));
4756	const ccv_nnc_tensor_param_t params = ccv_nnc_tensor_symbol_params(graph, inputs[0]);
4757	const ccv_nnc_tensor_param_t indices_params = ccv_nnc_tensor_symbol_params(graph, inputs[1]);
4758	const ccv_nnc_tensor_param_t counts_params = ccv_nnc_tensor_symbol_params(graph, inputs[2]);
4759	ccv_nnc_tensor_param_t weights_params = params;
4760	memset(weights_params.dim, 0, sizeof(weights_params.dim));
4761	weights_params.dim[0] = self->segments;
4762	weights_params.dim[1] = self->count;
4763	weights_params.dim[2] = params.dim[ccv_nnc_tensor_nd(params.dim) - 1];
4764	if (!self->weights.graph)
4765		self->weights = ccv_nnc_tensor_symbol_new(graph, weights_params, "weights");
4766	assert(self->weights.graph == graph)((void) sizeof ((self->weights.graph == graph) ? 1 : 0), __extension__
 ({ if (self->weights.graph == graph) ; else __assert_fail
 ("self->weights.graph == graph", "ccv_cnnp_model_addons.c"
, 4766, __extension__ __PRETTY_FUNCTION__); }));
4767	ccv_nnc_tensor_param_t bias_params = params;
4768	memset(bias_params.dim, 0, sizeof(bias_params.dim));
4769	bias_params.dim[0] = self->segments;
4770	bias_params.dim[1] = self->count;
4771	ccv_nnc_cmd_t cmd = {0};
4772	cmd.cmd = CCV_NNC_SEGMENTED_GEMM_FORWARD;
4773	cmd.info.blas.a[0] = 1;
4774	cmd.info.blas.a[1] = 1;
4775	cmd.info.blas.transpose_b[0] = 1;
4776	cmd.info.blas.transpose_b[1] = 2;
4777	cmd.info.blas.flags = self->flags;
4778	ccv_nnc_tensor_param_t output_params;
4779	ccv_nnc_hint_tensor_auto(cmd, (ccv_nnc_tensor_param_t []){
4780			params, indices_params, counts_params,
4781			weights_params,
4782			bias_params,
4783		}, 5, ccv_nnc_no_hint, &output_params, 1);
4784	const ccv_nnc_tensor_symbol_t output = ccv_nnc_tensor_symbol_new(graph, output_params, 0);
4785	if (self->no_bias)
4786		ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0], inputs[1], inputs[2], self->weights)(const ccv_nnc_tensor_symbol_t []){inputs[0], inputs[1], inputs
[2], self->weights}, (1 +1 +1 +1 +1 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "segmented_dense");
4787	else {
4788		if (!self->bias.graph)
4789			self->bias = ccv_nnc_tensor_symbol_new(graph, bias_params, "bias");
4790		ccv_nnc_graph_exec_symbol_new(graph, cmd, TENSOR_SYMBOL_LIST(inputs[0], inputs[1], inputs[2], self->weights, self->bias)(const ccv_nnc_tensor_symbol_t []){inputs[0], inputs[1], inputs
[2], self->weights, self->bias}, (1 +1 +1 +1 +1 +1 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), TENSOR_SYMBOL_LIST(output)(const ccv_nnc_tensor_symbol_t []){output}, (1 +1 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +
0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0
 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 +0 -1), "segmented_dense");
4791	}
4792	outputs[0] = output;
4793}
4794 
4795static void _ccv_cnnp_segmented_dense_init_states(ccv_cnnp_model_t* const super, ccv_nnc_symbolic_graph_t* const graph, const ccv_cnnp_state_initializer_f initializer, void* const context)
4796{
4797	ccv_cnnp_model_segmented_dense_t* const self = (ccv_cnnp_model_segmented_dense_t*)super;
4798	const ccv_nnc_tensor_param_t weight_params = ccv_nnc_tensor_symbol_params(graph, self->weights);
4799	const int c = weight_params.dim[1];
4800	const float std = sqrtf(2) / sqrtf(c);
4801	const float bound = sqrtf(3) * std;
4802	initializer(context, CMD_RANDOM_UNIFORM_FORWARD(-bound, bound)ccv_nnc_cmd(CCV_NNC_RANDOM_UNIFORM_FORWARD, 0, (ccv_nnc_cmd_param_t
){.size={.dim={1,1,1}},.blas={.a={-bound, bound}}}, 0), ccv_nnc_no_hint, 0, 0, self->weights);
4803	if (self->bias.graph)
4804		initializer(context, CMD_SET_FORWARD(0)ccv_nnc_cmd(CCV_NNC_SET_FORWARD, 0, (ccv_nnc_cmd_param_t){.size
={.dim={1,1,1}},.blas={.a={0,}}}, 0), ccv_nnc_no_hint, 0, 0, self->bias);
4805}
4806 
4807static void _ccv_cnnp_segmented_dense_add_to_parameter(ccv_cnnp_model_t* const super, const ccv_cnnp_add_to_array_f add_to_array, void* const parameters, const int is_trainable)
4808{
4809	ccv_cnnp_model_segmented_dense_t* const self = (ccv_cnnp_model_segmented_dense_t*)super;
4810	add_to_array(parameters, self->weights, is_trainable);
4811	if (self->bias.graph)
4812		add_to_array(parameters, self->bias, is_trainable);
4813}
4814 
4815static ccv_cnnp_model_t* _ccv_cnnp_segmented_dense_copy(const ccv_cnnp_model_t* const super, void* const context);
4816 
4817static const ccv_cnnp_model_vtab_t ccv_cnnp_segmented_dense_isa = {
4818	.build = _ccv_cnnp_segmented_dense_build,
4819	.init_states = _ccv_cnnp_segmented_dense_init_states,
4820	.add_to_parameter = _ccv_cnnp_segmented_dense_add_to_parameter,
4821	.copy = _ccv_cnnp_segmented_dense_copy,
4822};
4823 
4824ccv_cnnp_model_t* ccv_cnnp_segmented_dense(const int segments, const int count, const int no_bias, const int flags, const int is_trainable, const char* const name)
4825{
4826	ccv_cnnp_model_segmented_dense_t* const model_segmented_dense = (ccv_cnnp_model_segmented_dense_t*)cccalloccalloc(1, sizeof(ccv_cnnp_model_segmented_dense_t));
4827	model_segmented_dense->super.isa = &ccv_cnnp_segmented_dense_isa;
4828	model_segmented_dense->super.input_size = 3;
4829	model_segmented_dense->super.outputs = &model_segmented_dense->output;
4830	model_segmented_dense->super.output_size = 1;
4831	model_segmented_dense->super.is_trainable = is_trainable;
4832	ccv_cnnp_model_copy_name(&model_segmented_dense->super, name);
4833	model_segmented_dense->weights.d = CCV_NNC_NO_TENSOR_SYMBOL;
4834	model_segmented_dense->weights.graph = 0;
4835	model_segmented_dense->bias.d = CCV_NNC_NO_TENSOR_SYMBOL;
4836	model_segmented_dense->bias.graph = 0;
4837	model_segmented_dense->segments = segments;
4838	model_segmented_dense->count = count;
4839	model_segmented_dense->no_bias = no_bias;
4840	model_segmented_dense->flags = flags;
4841	return (ccv_cnnp_model_t*)model_segmented_dense;
4842}
4843 
4844static ccv_cnnp_model_t* _ccv_cnnp_segmented_dense_copy(const ccv_cnnp_model_t* const super, void* const context)
4845{
4846	const ccv_cnnp_model_segmented_dense_t* const self = (const ccv_cnnp_model_segmented_dense_t*)super;
4847	return ccv_cnnp_segmented_dense(self->segments, self->count, self->no_bias, self->flags, self->super.is_trainable, self->super.name);
4848}