GPU Kernel Information
layer_index | layer_name | layer_type | layer_shape | layer_duration (us) | layer_allocated_bytes | layer_peak_allocated_bytes | layer_allocator_bytes_in_use | layer_allocator_name | layer_host_temp_mem_bytes | layer_device_temp_mem_bytes | layer_host_persistent_mem_bytes | layer_device_persistent_mem_bytes | kernel_name | kernel_duration (us) | kernel_flops | kernel_dram_read_bytes | kernel_dram_write_bytes | kernel_achieved_occupancy (%) | kernel_arithmetic_intensity (flops/byte) | kernel_arithmetic_throughput (GFlops) | kernel_memory_bound | achieved_occupancy | flop_count_sp | dram_read_bytes | dram_write_bytes |
---|
layer_index | layer_name | layer_type | layer_shape | layer_duration (us) | layer_allocated_bytes | layer_peak_allocated_bytes | layer_allocator_bytes_in_use | layer_allocator_name | layer_host_temp_mem_bytes | layer_device_temp_mem_bytes | layer_host_persistent_mem_bytes | layer_device_persistent_mem_bytes | kernel_name | kernel_duration (us) | kernel_flops | kernel_dram_read_bytes | kernel_dram_write_bytes | kernel_achieved_occupancy (%) | kernel_arithmetic_intensity (flops/byte) | kernel_arithmetic_throughput (GFlops) | kernel_memory_bound | achieved_occupancy | flop_count_sp | dram_read_bytes | dram_write_bytes |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | mobilenetv22_features_conv0_fwd | Convolution | [1,3,224,224] | 2798.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 11.00 | 25890816 | 2730.67 | 341749.33 | 12.10 | 75.16 | 2353.71 | false | 0.120825;0.120376;0.121430;0.120552;0.121653 | 25890816;25890816;25890816;25890816;25890816 | 15680;2560;2944;2688;2560 | 324128;334112;342496;348640;349568 | |
1 | mobilenetv22_features_batchnorm0_fwd | BatchNorm | [1,16,112,112] | 106 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 9.33 | 1212416 | 501.33 | 0.00 | 23.80 | 2418.38 | 129.91 | false | 0.238595;0.238882;0.238012;0.237938;0.238517 | 1212416;1212416;1212416;1212416;1212416 | 672;672;416;416;416 | 0;0;0;128;0 | |
2 | mobilenetv22_features_relu60_relu6 | clip | [1,16,112,112] | 109.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 4.67 | 0 | 85.33 | 2048.00 | 39.30 | 0.00 | 0.00 | true | 0.392026;0.392330;0.395343;0.392047;0.394507 | 0;0;0;0;0 | 0;0;0;256;256 | 2304;1408;2304;1536;2304 | |
3 | mobilenetv22_features_linearbottleneck0_conv0_fwd | Convolution | [1,16,112,112] | 1851 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 9.00 | 13045760 | 1024.00 | 608.00 | 12.30 | 7993.73 | 1449.53 | false | 0.123148;0.123395;0.123268;0.123059;0.123216 | 13045760;13045760;13045760;13045760;13045760 | 480;480;864;992;480 | 1024;1024;1024;1280;1024 | |
4 | mobilenetv22_features_linearbottleneck0_batchnorm0_fwd | BatchNorm | [1,16,112,112] | 76 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 9.00 | 1212416 | 256.00 | 64.00 | 23.80 | 3788.80 | 134.71 | false | 0.237839;0.237965;0.237681;0.239093;0.237467 | 1212416;1212416;1212416;1212416;1212416 | 256;256;256;256;256 | 64;64;64;64;64 | |
5 | mobilenetv22_features_linearbottleneck0_relu60_relu6 | clip | [1,16,112,112] | 97.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 4.33 | 0 | 0.00 | 64.00 | 38.80 | 0.00 | 0.00 | true | 0.388985;0.391741;0.385144;0.388453;0.387453 | 0;0;0;0;0 | 0;0;0;0;0 | 64;64;64;64;64 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_winograd_128x128_ldg1_ldg4_relu_tile148t_nt_v1 | 12.00 | 30908416 | 0.00 | 58.67 | 15.50 | 526845.01 | 2575.70 | false | 0.154724;0.154433;0.154831;0.155000;0.154971;0.154432;0.154834;0.154544;0.154910;0.154528;0.155486;0.154619;0.154984;0.154642;0.154983;0.154551;0.154202;0.154499;0.155679;0.154620;0.154651;0.155025;0.154826;0.154675;0.154698;0.154717;0.154794;0.154670;0.154837;0.154616;0.154643;0.155689;0.153607;0.155379;0.154734;0.155462;0.155648;0.154867;0.155273;0.154555;0.154903;0.155679;0.155692;0.154429;0.154801;0.154854;0.154837;0.155452;0.154550;0.155997;0.154948;0.154562;0.154739;0.154370;0.154795;0.154724;0.154760;0.154796;0.154860;0.154565;0.154948;0.154496;0.155803;0.154726;0.155085;0.154549;0.154813;0.154984;0.154782;0.154606;0.155789;0.154761;0.154897;0.154971;0.155012;0.155582;0.155707;0.154548;0.156492;0.154592 | 30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416;30908416 | 3040;1856;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;576;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;4832;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0;5088;320;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 1664;0;288;0;0;0;288;0;0;288;0;0;384;0;288;288;1536;32;64;384;0;0;0;0;0;256;0;0;0;0;0;0;1664;0;288;0;0;0;288;0;0;288;0;0;0;0;288;288;1792;32;192;0;128;0;0;0;0;0;0;0;0;0;128;0;1664;0;288;256;0;0;288;0;0;288;0;0;0;0;288;288 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
6 | mobilenetv22_features_linearbottleneck0_conv1_fwd | Convolution | [1,16,112,112] | 3129.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::winograd::generateWinogradTilesKernel<0, float, float>(cudnn::winograd::GenerateWinogradTilesParams<float, float>) | 4.00 | 14848 | 40.00 | 0.00 | 6.20 | 371.20 | 3.71 | false | 0.062334;0.062095;0.062308;0.062128;0.062325;0.062054;0.062283;0.062055;0.062316;0.062063;0.062296;0.062054;0.062324;0.062055;0.062299;0.062063;0.062329;0.062113;0.062338;0.062074;0.062278;0.062074;0.062321;0.062073;0.062304;0.062074;0.062312;0.062074;0.062321;0.062090;0.062304;0.062081;0.062318;0.062110;0.062291;0.062070;0.062300;0.062071;0.062291;0.062071;0.062300;0.062079;0.062258;0.062087;0.062300;0.062079;0.062300;0.062079;0.062331;0.062113;0.062321;0.062066;0.062295;0.062074;0.062295;0.062066;0.062321;0.062074;0.062278;0.062058;0.062295;0.062082;0.062270;0.062082;0.062326;0.062089;0.062316;0.062062;0.062316;0.062071;0.062299;0.062054;0.062291;0.062054;0.062308;0.062055;0.062316;0.062047;0.062300;0.062056 | 14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848;14848 | 2816;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;5888;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0;3072;256;0;64;0;64;0;64;64;0;64;0;64;0;64;0 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;128;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | |
7 | mobilenetv22_features_linearbottleneck0_batchnorm1_fwd | BatchNorm | [1,16,112,112] | 406.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 9.33 | 1212416 | 256.00 | 512.00 | 23.80 | 1578.67 | 129.91 | false | 0.237901;0.238054;0.237265;0.237219;0.237382 | 1212416;1212416;1212416;1212416;1212416 | 256;256;256;256;256 | 608;320;608;320;608 | |
8 | mobilenetv22_features_linearbottleneck0_relu61_relu6 | clip | [1,16,112,112] | 97 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 4.67 | 0 | 256.00 | 320.00 | 40.00 | 0.00 | 0.00 | true | 0.396589;0.398269;0.399229;0.403512;0.403355 | 0;0;0;0;0 | 256;256;256;0;256 | 320;320;320;448;320 | |
9 | mobilenetv22_features_linearbottleneck0_conv2_fwd | Convolution | [1,16,112,112] | 808 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 8.67 | 12945408 | 597.33 | 608.00 | 12.40 | 10740.11 | 1493.64 | false | 0.123817;0.123597;0.124067;0.123431;0.123620 | 12945408;12945408;12945408;12945408;12945408 | 608;608;608;608;608 | 512;512;768;512;768 | |
10 | mobilenetv22_features_linearbottleneck0_batchnorm2_fwd | BatchNorm | [1,8,112,112] | 30.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 9.33 | 606208 | 256.00 | 64.00 | 23.70 | 1894.40 | 64.95 | false | 0.237400;0.237641;0.236629;0.236604;0.237952 | 606208;606208;606208;606208;606208 | 256;256;256;256;256 | 64;64;64;64;64 | |
11 | mobilenetv22_features_linearbottleneck1_conv0_fwd | Convolution | [1,8,112,112] | 1032 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 14.00 | 14450688 | 8192.00 | 765258.67 | 7.70 | 18.68 | 1032.19 | false | 0.076991;0.076825;0.076870;0.076807;0.076824 | 14450688;14450688;14450688;14450688;14450688 | 8192;8192;8192;8192;8192 | 765472;765120;765184;764768;765632 | |
11 | mobilenetv22_features_linearbottleneck1_conv0_fwd | Convolution | [1,8,112,112] | 1032 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.67 | 0 | 1706.67 | 42.67 | 7.40 | 0.00 | 0.00 | true | 0.074596;0.074859;0.073302;0.073346;0.073282 | 0;0;0;0;0 | 3328;1792;1792;1536;1536 | 0;0;128;0;128 | |
12 | mobilenetv22_features_linearbottleneck1_batchnorm0_fwd | BatchNorm | [1,48,112,112] | 110.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 9.67 | 3637248 | 789.33 | 2462645.33 | 23.80 | 1.48 | 376.25 | true | 0.237656;0.237921;0.237778;0.237662;0.237780 | 3637248;3637248;3637248;3637248;3637248 | 2464480;2468032;2465152;2455744;2458304 | 832;768;1024;768;768 | |
13 | mobilenetv22_features_linearbottleneck1_relu60_relu6 | clip | [1,48,112,112] | 362.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 7.00 | 0 | 0.00 | 2053728.00 | 38.30 | 0.00 | 0.00 | true | 0.382580;0.384155;0.380635;0.382633;0.382724 | 0;0;0;0;0 | 0;0;512;0;0 | 2063072;2056128;2048128;2053536;2051520 | |
14 | mobilenetv22_features_linearbottleneck1_conv1_fwd | Convolution | [1,48,112,112] | 2300 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 7.00 | 2827872 | 1952.00 | 528501.33 | 78.30 | 5.33 | 403.98 | true | 0.789847;0.782459;0.775973;0.781444;0.784849 | 2827872;2827872;2827872;2827872;2827872 | 527424;529568;518496;528512;532992 | 1952;1952;1952;1952;1952 | |
15 | mobilenetv22_features_linearbottleneck1_batchnorm1_fwd | BatchNorm | [1,48,56,56] | 87.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 927744 | 768.00 | 449728.00 | 22.70 | 2.06 | 185.55 | true | 0.227814;0.227585;0.227375;0.227417;0.227469 | 927744;927744;927744;927744;927744 | 768;768;768;768;768 | 455680;450592;452128;446464;428992 | |
16 | mobilenetv22_features_linearbottleneck1_relu61_relu6 | clip | [1,48,56,56] | 143 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 4.00 | 0 | 0.00 | 145258.67 | 35.40 | 0.00 | 0.00 | true | 0.353717;0.353230;0.354933;0.354632;0.352459 | 0;0;0;0;0 | 141600;144992;147072;143712;151328 | 0;5120;0;0;0 | |
17 | mobilenetv22_features_linearbottleneck1_conv2_fwd | Convolution | [1,48,56,56] | 314 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 10.00 | 9671424 | 2474.67 | 2997.33 | 3.70 | 1767.44 | 967.14 | false | 0.036851;0.036784;0.036771;0.036793;0.036760 | 9671424;9671424;9671424;9671424;9671424 | 3072;2560;2560;2304;2304 | 2880;2624;2848;3264;4160 | |
18 | mobilenetv22_features_linearbottleneck1_batchnorm2_fwd | BatchNorm | [1,12,56,56] | 18.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 231936 | 256.00 | 512.00 | 22.80 | 302.00 | 46.39 | false | 0.227978;0.227585;0.228813;0.227704;0.228010 | 231936;231936;231936;231936;231936 | 256;256;256;256;256 | 512;384;768;384;640 | |
19 | mobilenetv22_features_linearbottleneck2_conv0_fwd | Convolution | [1,12,56,56] | 770 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 9.00 | 9859584 | 3456.00 | 66378.67 | 10.20 | 141.18 | 1095.51 | false | 0.102405;0.101958;0.102759;0.102542;0.102237 | 9859584;9859584;9859584;9859584;9859584 | 62272;68320;68544;68576;60480 | 3456;5504;3456;3456;3456 | |
20 | mobilenetv22_features_linearbottleneck2_batchnorm0_fwd | BatchNorm | [1,72,56,56] | 56 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 6.00 | 1391616 | 1301.33 | 642272.00 | 22.80 | 2.16 | 231.94 | true | 0.227609;0.227232;0.227903;0.227861;0.227701 | 1391616;1391616;1391616;1391616;1391616 | 1312;1280;1312;1280;1312 | 663232;640896;642720;642464;641632 | |
21 | mobilenetv22_features_linearbottleneck2_relu60_relu6 | clip | [1,72,56,56] | 162.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 5.00 | 0 | 128.00 | 269984.00 | 41.90 | 0.00 | 0.00 | true | 0.418752;0.419656;0.418960;0.419406;0.415922 | 0;0;0;0;0 | 128;128;128;128;128 | 237696;270144;270528;269280;271424 | |
22 | mobilenetv22_features_linearbottleneck2_conv1_fwd | Convolution | [1,72,56,56] | 3509.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_c1_k1_nchw_hw_packed_kernel<float, float, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, int) | 10.67 | 4741632 | 5696.00 | 256.00 | 12.20 | 796.65 | 444.51 | false | 0.122017;0.121936;0.121944;0.121935;0.121953 | 4741632;4741632;4741632;4741632;4741632 | 5696;5696;5696;5696;5696 | 256;256;256;256;256 | |
23 | mobilenetv22_features_linearbottleneck2_batchnorm1_fwd | BatchNorm | [1,72,56,56] | 99.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 6.00 | 1391616 | 1280.00 | 42.67 | 22.80 | 1052.13 | 231.94 | false | 0.227772;0.227241;0.227344;0.228639;0.227403 | 1391616;1391616;1391616;1391616;1391616 | 1280;1280;1280;6656;1280 | 0;128;0;128;0 | |
24 | mobilenetv22_features_linearbottleneck2_relu61_relu6 | clip | [1,72,56,56] | 194 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 4.00 | 0 | 0.00 | 0.00 | 41.40 | 0.00 | 0.00 | true | 0.416877;0.409905;0.419741;0.407816;0.415991 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;0 | |
25 | mobilenetv22_features_linearbottleneck2_conv2_fwd | Convolution | [1,72,56,56] | 729 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 12.00 | 14488320 | 3456.00 | 501.33 | 3.70 | 3661.13 | 1207.36 | false | 0.036993;0.036955;0.036978;0.036963;0.037028 | 14488320;14488320;14488320;14488320;14488320 | 3456;3456;3456;3456;3456 | 544;416;544;416;544 | |
26 | mobilenetv22_features_linearbottleneck2_batchnorm2_fwd | BatchNorm | [1,12,56,56] | 15.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 231936 | 266.67 | 0.00 | 22.80 | 869.76 | 46.39 | false | 0.227898;0.227523;0.227290;0.227706;0.227675 | 231936;231936;231936;231936;231936 | 512;256;288;256;256 | 0;0;224;0;0 | |
27 | mobilenetv22_features_linearbottleneck2_elemwise_add0 | elemwise_add | [1,12,56,56] | 13.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.33 | 37632 | 0.00 | 42.67 | 20.20 | 881.99 | 11.29 | false | 0.201723;0.202767;0.202052;0.202618;0.202069 | 37632;37632;37632;37632;37632 | 0;0;0;0;0 | 0;128;0;128;0 | |
28 | mobilenetv22_features_linearbottleneck3_conv0_fwd | Convolution | [1,12,56,56] | 732.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 9.00 | 9859584 | 3456.00 | 416.00 | 10.20 | 2546.38 | 1095.51 | false | 0.102380;0.102163;0.102089;0.102234;0.102959 | 9859584;9859584;9859584;9859584;9859584 | 3456;3456;3456;3456;3456 | 416;416;416;416;416 | |
29 | mobilenetv22_features_linearbottleneck3_batchnorm0_fwd | BatchNorm | [1,72,56,56] | 46 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 6.00 | 1391616 | 1280.00 | 85.33 | 22.80 | 1019.25 | 231.94 | false | 0.227502;0.228155;0.227913;0.227802;0.227579 | 1391616;1391616;1391616;1391616;1391616 | 1280;1280;1280;1280;1280 | 128;0;128;0;128 | |
30 | mobilenetv22_features_linearbottleneck3_relu60_relu6 | clip | [1,72,56,56] | 172.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 4.67 | 0 | 0.00 | 146122.67 | 42.40 | 0.00 | 0.00 | true | 0.428241;0.420040;0.425328;0.422544;0.425519 | 0;0;0;0;0 | 0;0;0;0;0 | 144480;145600;145248;147808;147520 | |
31 | mobilenetv22_features_linearbottleneck3_conv1_fwd | Convolution | [1,72,56,56] | 907 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.00 | 1048464 | 2624.00 | 153984.00 | 46.60 | 6.69 | 209.69 | true | 0.466049;0.465583;0.467226;0.466472;0.466026 | 1048464;1048464;1048464;1048464;1048464 | 2624;2624;2624;2624;2624 | 155072;154496;155168;152000;152384 | |
32 | mobilenetv22_features_linearbottleneck3_batchnorm1_fwd | BatchNorm | [1,72,28,28] | 20.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 357120 | 1280.00 | 1226.67 | 11.40 | 142.47 | 71.42 | false | 0.113625;0.113498;0.113373;0.113547;0.114258 | 357120;357120;357120;357120;357120 | 1280;1280;1280;1280;1280 | 1056;1440;1184;1440;1056 | |
33 | mobilenetv22_features_linearbottleneck3_relu61_relu6 | clip | [1,72,28,28] | 56 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.67 | 0 | 42.67 | 938.67 | 27.10 | 0.00 | 0.00 | true | 0.270625;0.270907;0.270675;0.271038;0.270198 | 0;0;0;0;0 | 0;0;0;1792;128 | 768;1664;768;1280;768 | |
34 | mobilenetv22_features_linearbottleneck3_conv2_fwd | Convolution | [1,72,28,28] | 242.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 10.00 | 3698944 | 4608.00 | 27722.67 | 3.10 | 114.41 | 369.89 | false | 0.030893;0.030898;0.030904;0.030898;0.030895 | 3698944;3698944;3698944;3698944;3698944 | 27776;27776;25984;27616;27904 | 4608;4608;4608;4608;4992 | |
35 | mobilenetv22_features_linearbottleneck3_batchnorm2_fwd | BatchNorm | [1,16,28,28] | 13 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 79360 | 256.00 | 48960.00 | 11.30 | 1.61 | 19.84 | true | 0.112965;0.113021;0.112917;0.113004;0.112930 | 79360;79360;79360;79360;79360 | 48800;48672;50720;49152;48928 | 256;512;256;256;256 | |
36 | mobilenetv22_features_linearbottleneck4_conv0_fwd | Convolution | [1,16,28,28] | 276.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 128, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 9.00 | 2532864 | 13066.67 | 25408.00 | 3.90 | 65.83 | 281.43 | false | 0.039646;0.040303;0.038982;0.038380;0.038365 | 2532864;2532864;2532864;2532864;2532864 | 13056;13056;13056;13088;13312 | 25408;25408;25408;25632;25408 | |
37 | mobilenetv22_features_linearbottleneck4_batchnorm0_fwd | BatchNorm | [1,96,28,28] | 24.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.67 | 476160 | 1536.00 | 298.67 | 13.60 | 259.53 | 102.03 | false | 0.135737;0.136271;0.136722;0.136426;0.136296 | 476160;476160;476160;476160;476160 | 1536;1536;1536;1536;1536 | 384;256;384;256;256 | |
38 | mobilenetv22_features_linearbottleneck4_relu60_relu6 | clip | [1,96,28,28] | 43.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 4.00 | 0 | 0.00 | 0.00 | 33.10 | 0.00 | 0.00 | true | 0.331275;0.330737;0.331050;0.330977;0.331738 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;128 | |
39 | mobilenetv22_features_linearbottleneck4_conv1_fwd | Convolution | [1,96,28,28] | 1178.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_c1_k1_nchw_hw_packed_kernel<float, float, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, int) | 6.67 | 1580544 | 4138.67 | 4266.67 | 14.10 | 188.04 | 237.07 | false | 0.141375;0.141408;0.141082;0.141280;0.141513 | 1580544;1580544;1580544;1580544;1580544 | 4704;4480;4096;4224;4096 | 3456;4992;8320;3968;3456 | |
40 | mobilenetv22_features_linearbottleneck4_batchnorm1_fwd | BatchNorm | [1,96,28,28] | 42.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 476160 | 1536.00 | 12469.33 | 13.60 | 34.00 | 95.23 | false | 0.136578;0.135905;0.136275;0.136283;0.136106 | 476160;476160;476160;476160;476160 | 1536;1536;1536;1536;1536 | 13824;12288;12320;12800;12288 | |
41 | mobilenetv22_features_linearbottleneck4_relu61_relu6 | clip | [1,96,28,28] | 72.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.67 | 0 | 0.00 | 42.67 | 31.60 | 0.00 | 0.00 | true | 0.316029;0.316427;0.316013;0.317149;0.316455 | 0;0;0;0;0 | 0;0;0;0;0 | 128;0;128;0;0 | |
42 | mobilenetv22_features_linearbottleneck4_conv2_fwd | Convolution | [1,96,28,28] | 202.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 11.00 | 4927744 | 6144.00 | 0.00 | 3.10 | 802.04 | 447.98 | false | 0.030958;0.030953;0.030956;0.030966;0.030953 | 4927744;4927744;4927744;4927744;4927744 | 6144;6144;6144;6144;6144 | 0;0;0;0;128 | |
43 | mobilenetv22_features_linearbottleneck4_batchnorm2_fwd | BatchNorm | [1,16,28,28] | 14 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.33 | 79360 | 256.00 | 25642.67 | 11.30 | 3.06 | 18.32 | true | 0.112845;0.112996;0.112814;0.112960;0.112833 | 79360;79360;79360;79360;79360 | 256;256;256;256;256 | 25600;25728;25600;25728;25600 | |
44 | mobilenetv22_features_linearbottleneck4_elemwise_add0 | elemwise_add | [1,16,28,28] | 9 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.00 | 12544 | 0.00 | 24650.67 | 12.10 | 0.51 | 4.18 | true | 0.121257;0.121464;0.121401;0.121090;0.121228 | 12544;12544;12544;12544;12544 | 24352;24992;24480;24992;24480 | 0;0;0;0;0 | |
45 | mobilenetv22_features_linearbottleneck5_conv0_fwd | Convolution | [1,16,28,28] | 267.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 128, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 7.33 | 2532864 | 6400.00 | 416.00 | 4.10 | 371.61 | 345.41 | false | 0.039222;0.041438;0.041376;0.039923;0.042756 | 2532864;2532864;2532864;2532864;2532864 | 416;416;544;416;416 | 6144;6400;6400;6400;10240 | |
46 | mobilenetv22_features_linearbottleneck5_batchnorm0_fwd | BatchNorm | [1,96,28,28] | 20.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.67 | 476160 | 1536.00 | 0.00 | 13.70 | 310.00 | 102.03 | false | 0.136593;0.136375;0.136596;0.136793;0.137712 | 476160;476160;476160;476160;476160 | 1536;1536;1536;1536;1568 | 0;0;0;0;352 | |
47 | mobilenetv22_features_linearbottleneck5_relu60_relu6 | clip | [1,96,28,28] | 49.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.67 | 0 | 0.00 | 42.67 | 33.10 | 0.00 | 0.00 | true | 0.329819;0.331478;0.330598;0.331110;0.329857 | 0;0;0;0;0 | 0;128;0;128;0 | 0;0;0;0;0 | |
48 | mobilenetv22_features_linearbottleneck5_conv1_fwd | Convolution | [1,96,28,28] | 1183.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_c1_k1_nchw_hw_packed_kernel<float, float, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, int) | 6.00 | 1580544 | 3456.00 | 0.00 | 14.10 | 457.33 | 263.42 | false | 0.141473;0.141287;0.141583;0.141347;0.141368 | 1580544;1580544;1580544;1580544;1580544 | 3456;3456;3456;3456;3456 | 0;0;0;0;0 | |
49 | mobilenetv22_features_linearbottleneck5_batchnorm1_fwd | BatchNorm | [1,96,28,28] | 32 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.67 | 476160 | 1536.00 | 42.67 | 13.60 | 301.62 | 102.03 | false | 0.135729;0.136051;0.135786;0.135918;0.135812 | 476160;476160;476160;476160;476160 | 128;0;128;0;0 | 1536;1536;1536;1536;2816 | |
50 | mobilenetv22_features_linearbottleneck5_relu61_relu6 | clip | [1,96,28,28] | 81 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.67 | 0 | 0.00 | 0.00 | 31.80 | 0.00 | 0.00 | true | 0.318473;0.316913;0.318295;0.316635;0.318356 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;128 | |
51 | mobilenetv22_features_linearbottleneck5_conv2_fwd | Convolution | [1,96,28,28] | 204.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 11.00 | 4927744 | 6154.67 | 1386.67 | 3.10 | 653.43 | 447.98 | false | 0.030952;0.030958;0.030961;0.030966;0.030962 | 4927744;4927744;4927744;4927744;4927744 | 6144;6176;6144;6176;6144 | 288;3328;416;3328;416 | |
52 | mobilenetv22_features_linearbottleneck5_batchnorm2_fwd | BatchNorm | [1,16,28,28] | 12 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 79360 | 256.00 | 0.00 | 11.30 | 310.00 | 19.84 | false | 0.112944;0.112904;0.112921;0.112872;0.113002 | 79360;79360;79360;79360;79360 | 256;256;256;256;256 | 0;0;0;0;0 | |
53 | mobilenetv22_features_linearbottleneck5_elemwise_add0 | elemwise_add | [1,16,28,28] | 9.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.67 | 12544 | 0.00 | 42.67 | 12.10 | 294.00 | 3.42 | false | 0.121232;0.121182;0.121187;0.121026;0.120946 | 12544;12544;12544;12544;12544 | 0;0;0;0;0 | 128;0;128;0;0 | |
54 | mobilenetv22_features_linearbottleneck6_conv0_fwd | Convolution | [1,16,28,28] | 270.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 128, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 7.67 | 2532864 | 6144.00 | 416.00 | 3.90 | 386.11 | 330.36 | false | 0.039916;0.040702;0.039253;0.038699;0.038772 | 2532864;2532864;2532864;2532864;2532864 | 6144;6144;6144;6144;6144 | 288;416;416;416;544 | |
55 | mobilenetv22_features_linearbottleneck6_batchnorm0_fwd | BatchNorm | [1,96,28,28] | 19 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 476160 | 1536.00 | 42.67 | 13.60 | 301.62 | 95.23 | false | 0.136386;0.136514;0.136405;0.136562;0.135886 | 476160;476160;476160;476160;476160 | 1536;1536;1536;1536;1536 | 0;128;0;128;0 | |
56 | mobilenetv22_features_linearbottleneck6_relu60_relu6 | clip | [1,96,28,28] | 55.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 4.00 | 0 | 0.00 | 0.00 | 32.90 | 0.00 | 0.00 | true | 0.328614;0.328395;0.328138;0.329108;0.329214 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;0 | |
57 | mobilenetv22_features_linearbottleneck6_conv1_fwd | Convolution | [1,96,28,28] | 339 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.33 | 341568 | 3456.00 | 1578.67 | 46.00 | 67.84 | 64.05 | false | 0.458588;0.460442;0.460090;0.459733;0.459781 | 341568;341568;341568;341568;341568 | 1664;1536;1664;1536;1536 | 3456;3456;3456;3456;3456 | |
58 | mobilenetv22_features_linearbottleneck6_batchnorm1_fwd | BatchNorm | [1,96,14,14] | 12.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 119040 | 1536.00 | 23456.00 | 3.60 | 4.76 | 29.76 | true | 0.035981;0.035956;0.035918;0.035998;0.035888 | 119040;119040;119040;119040;119040 | 1536;1536;1536;1536;1536 | 23456;23456;23456;23456;23584 | |
59 | mobilenetv22_features_linearbottleneck6_relu61_relu6 | clip | [1,96,14,14] | 18.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.00 | 0 | 0.00 | 42.67 | 12.10 | 0.00 | 0.00 | true | 0.120880;0.120854;0.120891;0.120706;0.120708 | 0;0;0;0;0 | 4096;0;0;0;0 | 0;128;0;128;0 | |
60 | mobilenetv22_features_linearbottleneck6_conv2_fwd | Convolution | [1,96,14,14] | 93.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 11.00 | 1382528 | 12288.00 | 416.00 | 3.10 | 108.83 | 125.68 | false | 0.031240;0.031241;0.031240;0.031242;0.031242 | 1382528;1382528;1382528;1382528;1382528 | 12288;12288;12288;12288;12288 | 288;416;416;416;416 | |
61 | mobilenetv22_features_linearbottleneck6_batchnorm2_fwd | BatchNorm | [1,32,14,14] | 11.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.33 | 39680 | 512.00 | 42.67 | 3.00 | 71.54 | 9.16 | false | 0.030102;0.030110;0.030105;0.030108;0.030106 | 39680;39680;39680;39680;39680 | 512;512;512;512;512 | 128;0;128;0;0 | |
62 | mobilenetv22_features_linearbottleneck7_conv0_fwd | Convolution | [1,32,14,14] | 176.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 8.00 | 2790144 | 24576.00 | 42.67 | 3.10 | 113.33 | 348.77 | false | 0.031233;0.031233;0.031233;0.031235;0.031233 | 2790144;2790144;2790144;2790144;2790144 | 26144;24576;24576;24576;24576 | 384;0;0;0;128 | |
63 | mobilenetv22_features_linearbottleneck7_batchnorm0_fwd | BatchNorm | [1,192,14,14] | 20 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 238080 | 3072.00 | 458.67 | 6.80 | 67.43 | 47.62 | false | 0.068102;0.068743;0.067577;0.067525;0.068548 | 238080;238080;238080;238080;238080 | 3072;3072;3072;3072;3072 | 288;544;416;544;416 | |
64 | mobilenetv22_features_linearbottleneck7_relu60_relu6 | clip | [1,192,14,14] | 25 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.00 | 0 | 0.00 | 0.00 | 20.40 | 0.00 | 0.00 | true | 0.203503;0.203710;0.203530;0.203608;0.203573 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;0 | |
65 | mobilenetv22_features_linearbottleneck7_conv1_fwd | Convolution | [1,192,14,14] | 648.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.00 | 652032 | 6912.00 | 42.67 | 47.00 | 93.75 | 130.41 | false | 0.470065;0.469860;0.469915;0.469429;0.470344 | 652032;652032;652032;652032;652032 | 6912;6912;6912;6912;6912 | 128;0;128;0;0 | |
66 | mobilenetv22_features_linearbottleneck7_batchnorm1_fwd | BatchNorm | [1,192,14,14] | 21 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 238080 | 3072.00 | 42.67 | 6.70 | 76.44 | 47.62 | false | 0.066851;0.068112;0.067671;0.067750;0.066796 | 238080;238080;238080;238080;238080 | 3072;3072;3072;3072;3072 | 0;0;0;128;128 | |
67 | mobilenetv22_features_linearbottleneck7_relu61_relu6 | clip | [1,192,14,14] | 39 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.67 | 0 | 0.00 | 85.33 | 20.20 | 0.00 | 0.00 | true | 0.201881;0.202212;0.201947;0.202160;0.201870 | 0;0;0;0;0 | 0;0;0;0;0 | 128;128;0;1024;0 | |
68 | mobilenetv22_features_linearbottleneck7_conv2_fwd | Convolution | [1,192,14,14] | 180.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 16.33 | 2758784 | 24576.00 | 373.33 | 3.10 | 110.58 | 168.91 | false | 0.031244;0.031244;0.031245;0.031244;0.031245 | 2758784;2758784;2758784;2758784;2758784 | 24576;24576;24576;24576;24576 | 288;416;416;288;416 | |
69 | mobilenetv22_features_linearbottleneck7_batchnorm2_fwd | BatchNorm | [1,32,14,14] | 10.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.33 | 39680 | 512.00 | 42.67 | 3.00 | 71.54 | 9.16 | false | 0.030105;0.030114;0.030105;0.030112;0.030106 | 39680;39680;39680;39680;39680 | 512;512;512;512;512 | 128;0;128;0;0 | |
70 | mobilenetv22_features_linearbottleneck7_elemwise_add0 | elemwise_add | [1,32,14,14] | 8 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.00 | 6272 | 0.00 | 0.00 | 12.10 | 0.00 | 2.09 | true | 0.121318;0.121310;0.121328;0.121354;0.121323 | 6272;6272;6272;6272;6272 | 0;0;0;0;0 | 0;0;0;0;128 | |
71 | mobilenetv22_features_linearbottleneck8_conv0_fwd | Convolution | [1,32,14,14] | 178.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 8.00 | 2790144 | 24576.00 | 42.67 | 3.10 | 113.33 | 348.77 | false | 0.031232;0.031234;0.031232;0.031232;0.031234 | 2790144;2790144;2790144;2790144;2790144 | 24576;24608;24576;24576;24576 | 0;480;0;128;0 | |
72 | mobilenetv22_features_linearbottleneck8_batchnorm0_fwd | BatchNorm | [1,192,14,14] | 17.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 238080 | 3072.00 | 0.00 | 6.80 | 77.50 | 47.62 | false | 0.067746;0.068069;0.067941;0.068117;0.067088 | 238080;238080;238080;238080;238080 | 3072;3072;3072;3072;3072 | 0;0;0;0;0 | |
73 | mobilenetv22_features_linearbottleneck8_relu60_relu6 | clip | [1,192,14,14] | 30.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.33 | 0 | 0.00 | 42.67 | 20.30 | 0.00 | 0.00 | true | 0.203131;0.203786;0.203238;0.203600;0.203114 | 0;0;0;0;0 | 0;0;0;0;0 | 128;0;128;0;0 | |
74 | mobilenetv22_features_linearbottleneck8_conv1_fwd | Convolution | [1,192,14,14] | 648.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.00 | 652032 | 6912.00 | 501.33 | 47.00 | 87.95 | 130.41 | false | 0.470410;0.470114;0.469979;0.469803;0.469598 | 652032;652032;652032;652032;652032 | 6912;6912;6912;6912;6912 | 416;544;544;416;672 | |
75 | mobilenetv22_features_linearbottleneck8_batchnorm1_fwd | BatchNorm | [1,192,14,14] | 26.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.67 | 238080 | 3072.00 | 42.67 | 6.80 | 76.44 | 51.01 | false | 0.067697;0.067514;0.067766;0.067899;0.067478 | 238080;238080;238080;238080;238080 | 3072;3072;3072;3072;3072 | 0;128;0;128;0 | |
76 | mobilenetv22_features_linearbottleneck8_relu61_relu6 | clip | [1,192,14,14] | 36 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.33 | 0 | 0.00 | 0.00 | 20.20 | 0.00 | 0.00 | true | 0.201886;0.201897;0.202273;0.201601;0.202077 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;0 | |
77 | mobilenetv22_features_linearbottleneck8_conv2_fwd | Convolution | [1,192,14,14] | 182 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 17.00 | 2758784 | 24576.00 | 42.67 | 3.10 | 112.06 | 162.28 | false | 0.031244;0.031245;0.031244;0.031244;0.031244 | 2758784;2758784;2758784;2758784;2758784 | 24576;24576;24576;24576;24576 | 128;0;128;0;0 | |
78 | mobilenetv22_features_linearbottleneck8_batchnorm2_fwd | BatchNorm | [1,32,14,14] | 11.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.33 | 39680 | 512.00 | 0.00 | 3.00 | 77.50 | 9.16 | false | 0.030107;0.030099;0.030104;0.030098;0.030119 | 39680;39680;39680;39680;39680 | 512;512;512;512;512 | 0;0;0;0;128 | |
79 | mobilenetv22_features_linearbottleneck8_elemwise_add0 | elemwise_add | [1,32,14,14] | 8 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.00 | 6272 | 0.00 | 42.67 | 12.10 | 147.00 | 2.09 | false | 0.121343;0.121363;0.121299;0.121396;0.121341 | 6272;6272;6272;6272;6272 | 0;128;0;128;0 | 0;0;0;0;0 | |
80 | mobilenetv22_features_linearbottleneck9_conv0_fwd | Convolution | [1,32,14,14] | 177.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 7.67 | 2790144 | 24576.00 | 1429.33 | 3.10 | 107.29 | 363.92 | false | 0.031233;0.031233;0.031233;0.031233;0.031234 | 2790144;2790144;2790144;2790144;2790144 | 24576;24576;24576;24576;24576 | 1376;1440;1472;1440;1408 | |
81 | mobilenetv22_features_linearbottleneck9_batchnorm0_fwd | BatchNorm | [1,192,14,14] | 17.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 238080 | 3072.00 | 416.00 | 6.80 | 68.26 | 47.62 | false | 0.067317;0.068034;0.067786;0.067894;0.068064 | 238080;238080;238080;238080;238080 | 3072;3072;3072;3072;3072 | 416;416;544;288;416 | |
82 | mobilenetv22_features_linearbottleneck9_relu60_relu6 | clip | [1,192,14,14] | 31 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.67 | 0 | 0.00 | 0.00 | 20.40 | 0.00 | 0.00 | true | 0.203471;0.203592;0.203589;0.203398;0.203533 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;128 | |
83 | mobilenetv22_features_linearbottleneck9_conv1_fwd | Convolution | [1,192,14,14] | 649.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.00 | 652032 | 6912.00 | 42.67 | 47.00 | 93.75 | 130.41 | false | 0.469895;0.469947;0.469470;0.470062;0.469140 | 652032;652032;652032;652032;652032 | 6912;6912;6912;6912;6912 | 0;128;0;128;0 | |
84 | mobilenetv22_features_linearbottleneck9_batchnorm1_fwd | BatchNorm | [1,192,14,14] | 26.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.67 | 238080 | 3072.00 | 0.00 | 6.80 | 77.50 | 51.01 | false | 0.067759;0.068217;0.067792;0.067718;0.067716 | 238080;238080;238080;238080;238080 | 3072;3072;3072;3072;3072 | 0;0;0;0;0 | |
85 | mobilenetv22_features_linearbottleneck9_relu61_relu6 | clip | [1,192,14,14] | 33.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.33 | 0 | 0.00 | 42.67 | 20.20 | 0.00 | 0.00 | true | 0.201594;0.202020;0.201755;0.201982;0.202009 | 0;0;0;0;0 | 128;0;128;0;0 | 0;0;0;0;0 | |
86 | mobilenetv22_features_linearbottleneck9_conv2_fwd | Convolution | [1,192,14,14] | 180 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 17.00 | 2758784 | 24576.00 | 373.33 | 3.10 | 110.58 | 162.28 | false | 0.031244;0.031244;0.031245;0.031245;0.031244 | 2758784;2758784;2758784;2758784;2758784 | 24576;24576;24576;24576;24576 | 288;416;416;288;544 | |
87 | mobilenetv22_features_linearbottleneck9_batchnorm2_fwd | BatchNorm | [1,32,14,14] | 10.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 39680 | 512.00 | 42.67 | 3.00 | 71.54 | 9.92 | false | 0.030101;0.030174;0.030103;0.030110;0.030200 | 39680;39680;39680;39680;39680 | 512;512;512;512;512 | 0;128;0;128;0 | |
88 | mobilenetv22_features_linearbottleneck9_elemwise_add0 | elemwise_add | [1,32,14,14] | 7.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.00 | 6272 | 0.00 | 0.00 | 12.10 | 0.00 | 2.09 | true | 0.121311;0.121340;0.121162;0.121406;0.121316 | 6272;6272;6272;6272;6272 | 0;0;0;0;0 | 0;0;0;0;256 | |
89 | mobilenetv22_features_linearbottleneck10_conv0_fwd | Convolution | [1,32,14,14] | 179.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 7.33 | 2790144 | 24576.00 | 42.67 | 3.10 | 113.33 | 380.49 | false | 0.031232;0.031233;0.031233;0.031232;0.031232 | 2790144;2790144;2790144;2790144;2790144 | 24576;24576;24576;24576;24576 | 128;0;128;0;0 | |
90 | mobilenetv22_features_linearbottleneck10_batchnorm0_fwd | BatchNorm | [1,192,14,14] | 17 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 238080 | 3072.00 | 0.00 | 6.80 | 77.50 | 47.62 | false | 0.067965;0.067841;0.067983;0.068060;0.067973 | 238080;238080;238080;238080;238080 | 3072;3072;3072;3072;3072 | 0;0;0;0;288 | |
91 | mobilenetv22_features_linearbottleneck10_relu60_relu6 | clip | [1,192,14,14] | 32 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.00 | 0 | 0.00 | 42.67 | 20.30 | 0.00 | 0.00 | true | 0.203122;0.203436;0.203392;0.203656;0.203062 | 0;0;0;0;0 | 0;0;0;0;0 | 0;128;0;128;0 | |
92 | mobilenetv22_features_linearbottleneck10_conv1_fwd | Convolution | [1,192,14,14] | 648.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.00 | 652032 | 6912.00 | 373.33 | 47.00 | 89.50 | 130.41 | false | 0.470461;0.469689;0.470152;0.469881;0.469800 | 652032;652032;652032;652032;652032 | 6912;7168;6912;6912;6912 | 288;416;416;288;416 | |
93 | mobilenetv22_features_linearbottleneck10_batchnorm1_fwd | BatchNorm | [1,192,14,14] | 16 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.33 | 238080 | 3072.00 | 42.67 | 6.80 | 76.44 | 54.95 | false | 0.067762;0.067711;0.067568;0.067930;0.067854 | 238080;238080;238080;238080;238080 | 3072;3072;3072;3072;3072 | 128;0;128;0;0 | |
94 | mobilenetv22_features_linearbottleneck10_relu61_relu6 | clip | [1,192,14,14] | 28.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.00 | 0 | 0.00 | 0.00 | 20.20 | 0.00 | 0.00 | true | 0.201894;0.201979;0.202113;0.201896;0.202228 | 0;0;0;0;0 | 0;0;0;0;128 | 0;0;0;0;0 | |
95 | mobilenetv22_features_linearbottleneck10_conv2_fwd | Convolution | [1,192,14,14] | 239.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 17.00 | 5514432 | 36864.00 | 42.67 | 3.10 | 149.42 | 324.38 | false | 0.031170;0.031173;0.031170;0.031168;0.031170 | 5514432;5514432;5514432;5514432;5514432 | 36864;36864;36864;36864;36864 | 0;128;0;128;0 | |
96 | mobilenetv22_features_linearbottleneck10_batchnorm2_fwd | BatchNorm | [1,48,14,14] | 11.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.67 | 59520 | 768.00 | 0.00 | 3.00 | 77.50 | 12.75 | false | 0.030092;0.030091;0.030102;0.030095;0.030107 | 59520;59520;59520;59520;59520 | 0;0;0;0;0 | 768;768;768;768;768 | |
97 | mobilenetv22_features_linearbottleneck11_conv0_fwd | Convolution | [1,48,14,14] | 308 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 8.67 | 6249600 | 55296.00 | 42.67 | 3.10 | 112.93 | 721.08 | false | 0.031214;0.031217;0.031212;0.031216;0.031219 | 6249600;6249600;6249600;6249600;6249600 | 55296;55296;55296;55296;59392 | 128;0;128;0;0 | |
98 | mobilenetv22_features_linearbottleneck11_batchnorm0_fwd | BatchNorm | [1,288,14,14] | 22.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 357120 | 4608.00 | 373.33 | 9.70 | 71.69 | 71.42 | false | 0.096268;0.097549;0.097353;0.097127;0.097492 | 357120;357120;357120;357120;357120 | 4608;4608;4608;4608;4608 | 288;416;416;288;544 | |
99 | mobilenetv22_features_linearbottleneck11_relu60_relu6 | clip | [1,288,14,14] | 48.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.00 | 0 | 0.00 | 42.67 | 27.50 | 0.00 | 0.00 | true | 0.274640;0.274870;0.275231;0.275071;0.274828 | 0;0;0;0;0 | 0;0;0;0;0 | 0;128;0;128;0 | |
100 | mobilenetv22_features_linearbottleneck11_conv1_fwd | Convolution | [1,288,14,14] | 974 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.00 | 978048 | 10368.00 | 0.00 | 46.90 | 94.33 | 195.61 | false | 0.468810;0.469323;0.469129;0.469539;0.469454 | 978048;978048;978048;978048;978048 | 10368;10368;10368;10368;10368 | 0;0;0;0;0 | |
101 | mobilenetv22_features_linearbottleneck11_batchnorm1_fwd | BatchNorm | [1,288,14,14] | 29.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.67 | 357120 | 4608.00 | 42.67 | 9.50 | 76.79 | 76.52 | false | 0.095330;0.093430;0.096104;0.094401;0.095832 | 357120;357120;357120;357120;357120 | 4608;4608;4608;4608;4608 | 128;0;128;0;0 | |
102 | mobilenetv22_features_linearbottleneck11_relu61_relu6 | clip | [1,288,14,14] | 52 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.00 | 0 | 0.00 | 0.00 | 27.10 | 0.00 | 0.00 | true | 0.271247;0.269892;0.270977;0.270226;0.271565 | 0;0;0;0;0 | 0;0;1024;0;0 | 0;0;0;0;128 | |
103 | mobilenetv22_features_linearbottleneck11_conv2_fwd | Convolution | [1,288,14,14] | 354 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 22.33 | 8266944 | 55296.00 | 416.00 | 3.10 | 148.39 | 370.17 | false | 0.031192;0.031194;0.031192;0.031193;0.031194 | 8266944;8266944;8266944;8266944;8266944 | 55296;55296;55296;55296;55296 | 288;544;416;416;416 | |
104 | mobilenetv22_features_linearbottleneck11_batchnorm2_fwd | BatchNorm | [1,48,14,14] | 11 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 59520 | 768.00 | 0.00 | 3.00 | 77.50 | 14.88 | false | 0.030101;0.030096;0.030114;0.030094;0.030107 | 59520;59520;59520;59520;59520 | 768;768;768;768;768 | 0;0;0;0;0 | |
105 | mobilenetv22_features_linearbottleneck11_elemwise_add0 | elemwise_add | [1,48,14,14] | 8.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.00 | 9408 | 0.00 | 42.67 | 12.20 | 220.50 | 3.14 | false | 0.121364;0.121436;0.121542;0.121617;0.121710 | 9408;9408;9408;9408;9408 | 128;0;128;0;0 | 0;0;0;0;0 | |
106 | mobilenetv22_features_linearbottleneck12_conv0_fwd | Convolution | [1,48,14,14] | 308.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 9.00 | 6249600 | 55296.00 | 469.33 | 3.10 | 112.07 | 694.40 | false | 0.031214;0.031212;0.031216;0.031218;0.031214 | 6249600;6249600;6249600;6249600;6249600 | 55296;55296;55296;55296;55296 | 288;576;416;448;544 | |
107 | mobilenetv22_features_linearbottleneck12_batchnorm0_fwd | BatchNorm | [1,288,14,14] | 19.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 357120 | 4608.00 | 42.67 | 9.70 | 76.79 | 71.42 | false | 0.096729;0.098112;0.096987;0.096985;0.096976 | 357120;357120;357120;357120;357120 | 4608;4608;4608;4608;4608 | 0;128;0;128;0 | |
108 | mobilenetv22_features_linearbottleneck12_relu60_relu6 | clip | [1,288,14,14] | 45 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.33 | 0 | 0.00 | 0.00 | 27.50 | 0.00 | 0.00 | true | 0.275485;0.274927;0.275210;0.274856;0.274875 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;0 | |
109 | mobilenetv22_features_linearbottleneck12_conv1_fwd | Convolution | [1,288,14,14] | 968.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.33 | 978048 | 10368.00 | 42.67 | 46.90 | 93.95 | 183.40 | false | 0.468687;0.469498;0.469124;0.469270;0.468766 | 978048;978048;978048;978048;978048 | 128;0;128;0;0 | 10368;10368;10368;10368;10368 | |
110 | mobilenetv22_features_linearbottleneck12_batchnorm1_fwd | BatchNorm | [1,288,14,14] | 28.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.67 | 357120 | 4608.00 | 0.00 | 9.60 | 77.50 | 76.52 | false | 0.096327;0.096454;0.096630;0.094485;0.096788 | 357120;357120;357120;357120;357120 | 4608;4608;4608;4608;4608 | 0;0;0;0;128 | |
111 | mobilenetv22_features_linearbottleneck12_relu61_relu6 | clip | [1,288,14,14] | 43 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.33 | 0 | 0.00 | 42.67 | 27.20 | 0.00 | 0.00 | true | 0.271568;0.272054;0.271759;0.272691;0.271502 | 0;0;0;0;0 | 0;128;0;128;0 | 0;0;0;0;256 | |
112 | mobilenetv22_features_linearbottleneck12_conv2_fwd | Convolution | [1,288,14,14] | 353.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 22.33 | 8266944 | 55296.00 | 0.00 | 3.10 | 149.50 | 370.17 | false | 0.031192;0.031192;0.031193;0.031193;0.031194 | 8266944;8266944;8266944;8266944;8266944 | 55296;57472;55296;55296;55296 | 0;0;0;0;0 | |
113 | mobilenetv22_features_linearbottleneck12_batchnorm2_fwd | BatchNorm | [1,48,14,14] | 11.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.33 | 59520 | 768.00 | 42.67 | 3.00 | 73.42 | 13.74 | false | 0.030097;0.030140;0.030094;0.030107;0.030098 | 59520;59520;59520;59520;59520 | 768;1408;768;768;768 | 128;0;128;0;0 | |
114 | mobilenetv22_features_linearbottleneck12_elemwise_add0 | elemwise_add | [1,48,14,14] | 8 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.33 | 9408 | 0.00 | 373.33 | 12.20 | 25.20 | 2.82 | false | 0.121619;0.121623;0.121548;0.121650;0.121597 | 9408;9408;9408;9408;9408 | 0;0;0;0;0 | 288;416;416;288;544 | |
115 | mobilenetv22_features_linearbottleneck13_conv0_fwd | Convolution | [1,48,14,14] | 307.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 9.00 | 6249600 | 55296.00 | 42.67 | 3.10 | 112.93 | 694.40 | false | 0.031215;0.031212;0.031216;0.031218;0.031214 | 6249600;6249600;6249600;6249600;6249600 | 0;128;0;128;0 | 55296;55296;55296;55296;55296 | |
116 | mobilenetv22_features_linearbottleneck13_batchnorm0_fwd | BatchNorm | [1,288,14,14] | 18.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 357120 | 4608.00 | 373.33 | 9.70 | 71.69 | 71.42 | false | 0.097344;0.097398;0.097368;0.097164;0.097494 | 357120;357120;357120;357120;357120 | 4608;4608;4608;4608;4608 | 288;416;416;288;416 | |
117 | mobilenetv22_features_linearbottleneck13_relu60_relu6 | clip | [1,288,14,14] | 46.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.67 | 0 | 0.00 | 42.67 | 27.40 | 0.00 | 0.00 | true | 0.274018;0.274708;0.274432;0.271654;0.274138 | 0;0;0;0;0 | 0;0;0;0;0 | 128;0;128;0;0 | |
118 | mobilenetv22_features_linearbottleneck13_conv1_fwd | Convolution | [1,288,14,14] | 327 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 6.00 | 244512 | 10368.00 | 0.00 | 46.30 | 23.58 | 40.75 | false | 0.462971;0.462086;0.463603;0.460838;0.463179 | 244512;244512;244512;244512;244512 | 10368;10368;10624;10368;10368 | 0;0;0;0;128 | |
119 | mobilenetv22_features_linearbottleneck13_batchnorm1_fwd | BatchNorm | [1,288,7,7] | 15 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 98784 | 4608.00 | 42.67 | 9.50 | 21.24 | 24.70 | false | 0.094607;0.094566;0.094888;0.094211;0.094448 | 98784;98784;98784;98784;98784 | 4608;4608;4608;4608;4608 | 0;128;0;128;0 | |
120 | mobilenetv22_features_linearbottleneck13_relu61_relu6 | clip | [1,288,7,7] | 12.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.33 | 0 | 0.00 | 0.00 | 12.10 | 0.00 | 0.00 | true | 0.120859;0.120746;0.120873;0.120799;0.120702 | 0;0;0;0;0 | 0;0;0;0;0 | 0;5120;0;0;0 | |
121 | mobilenetv22_features_linearbottleneck13_conv2_fwd | Convolution | [1,288,7,7] | 176.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 23.00 | 3542864 | 92160.00 | 416.00 | 3.10 | 38.27 | 154.04 | false | 0.031191;0.031191;0.031190;0.031190;0.031190 | 3542864;3542864;3542864;3542864;3542864 | 92160;92160;92160;92160;92160 | 416;416;544;288;416 | |
122 | mobilenetv22_features_linearbottleneck13_batchnorm2_fwd | BatchNorm | [1,80,7,7] | 10.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 27440 | 1280.00 | 0.00 | 3.10 | 21.44 | 6.86 | false | 0.031162;0.031154;0.031184;0.031175;0.031088 | 27440;27440;27440;27440;27440 | 1280;1280;1280;1280;1280 | 0;0;0;0;128 | |
123 | mobilenetv22_features_linearbottleneck14_conv0_fwd | Convolution | [1,80,7,7] | 266.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 11.00 | 4938720 | 153600.00 | 42.67 | 3.10 | 32.14 | 448.97 | false | 0.031240;0.031240;0.031239;0.031239;0.031240 | 4938720;4938720;4938720;4938720;4938720 | 0;128;0;128;0 | 153600;153600;153600;153600;153600 | |
124 | mobilenetv22_features_linearbottleneck14_batchnorm0_fwd | BatchNorm | [1,480,7,7] | 17 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 164640 | 7680.00 | 16330.67 | 13.90 | 6.86 | 32.93 | true | 0.143943;0.138548;0.138961;0.134696;0.139330 | 164640;164640;164640;164640;164640 | 7680;7680;7680;7680;7680 | 16544;16800;16544;15904;14240 | |
125 | mobilenetv22_features_linearbottleneck14_relu60_relu6 | clip | [1,480,7,7] | 20 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.00 | 0 | 0.00 | 2645.33 | 13.70 | 0.00 | 0.00 | true | 0.136661;0.136790;0.136714;0.136828;0.136692 | 0;0;0;0;0 | 5376;0;0;0;0 | 2688;2432;2816;3200;2176 | |
126 | mobilenetv22_features_linearbottleneck14_conv1_fwd | Convolution | [1,480,7,7] | 522.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.00 | 370080 | 17280.00 | 0.00 | 47.10 | 21.42 | 74.02 | false | 0.471087;0.470862;0.471133;0.470754;0.471279 | 370080;370080;370080;370080;370080 | 17280;17280;17280;17280;17280 | 0;0;0;0;128 | |
127 | mobilenetv22_features_linearbottleneck14_batchnorm1_fwd | BatchNorm | [1,480,7,7] | 16.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 164640 | 7680.00 | 85.33 | 13.60 | 21.20 | 32.93 | false | 0.134368;0.136482;0.135723;0.135408;0.136768 | 164640;164640;164640;164640;164640 | 7680;7680;12800;7680;7680 | 0;128;0;128;1024 | |
128 | mobilenetv22_features_linearbottleneck14_relu61_relu6 | clip | [1,480,7,7] | 24.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.33 | 0 | 0.00 | 0.00 | 13.70 | 0.00 | 0.00 | true | 0.136713;0.136583;0.136634;0.136515;0.136704 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;0 | |
129 | mobilenetv22_features_linearbottleneck14_conv2_fwd | Convolution | [1,480,7,7] | 287 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 34.00 | 5902160 | 153600.00 | 373.33 | 3.10 | 38.33 | 173.59 | false | 0.031213;0.031211;0.031211;0.031212;0.031212 | 5902160;5902160;5902160;5902160;5902160 | 153600;153600;153600;153600;153600 | 416;416;544;288;288 | |
130 | mobilenetv22_features_linearbottleneck14_batchnorm2_fwd | BatchNorm | [1,80,7,7] | 10 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 27440 | 1280.00 | 0.00 | 3.10 | 21.44 | 6.86 | false | 0.031164;0.031101;0.031145;0.031152;0.031162 | 27440;27440;27440;27440;27440 | 2304;1280;1280;1280;1280 | 0;0;0;0;128 | |
131 | mobilenetv22_features_linearbottleneck14_elemwise_add0 | elemwise_add | [1,80,7,7] | 7.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.00 | 3920 | 0.00 | 42.67 | 12.10 | 91.87 | 1.31 | false | 0.121125;0.121146;0.121116;0.121186;0.121084 | 3920;3920;3920;3920;3920 | 0;0;0;0;0 | 0;128;0;128;0 | |
132 | mobilenetv22_features_linearbottleneck15_conv0_fwd | Convolution | [1,80,7,7] | 262.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 11.00 | 4938720 | 153600.00 | 0.00 | 3.10 | 32.15 | 448.97 | false | 0.031239;0.031239;0.031240;0.031238;0.031239 | 4938720;4938720;4938720;4938720;4938720 | 153600;153600;153600;153600;153600 | 0;0;0;0;0 | |
133 | mobilenetv22_features_linearbottleneck15_batchnorm0_fwd | BatchNorm | [1,480,7,7] | 17.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.67 | 164640 | 7680.00 | 37504.00 | 13.80 | 3.64 | 35.28 | true | 0.136976;0.138048;0.137384;0.137629;0.138220 | 164640;164640;164640;164640;164640 | 7680;7680;7680;7680;7680 | 38144;38016;36096;36352;38272 | |
134 | mobilenetv22_features_linearbottleneck15_relu60_relu6 | clip | [1,480,7,7] | 20 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.00 | 0 | 0.00 | 5717.33 | 13.70 | 0.00 | 0.00 | true | 0.137012;0.136871;0.136957;0.136746;0.136917 | 0;0;0;0;0 | 0;256;0;0;0 | 5888;5888;4608;5504;5760 | |
135 | mobilenetv22_features_linearbottleneck15_conv1_fwd | Convolution | [1,480,7,7] | 515 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.00 | 370080 | 17280.00 | 42.67 | 47.10 | 21.36 | 74.02 | false | 0.470976;0.471170;0.471097;0.471316;0.471171 | 370080;370080;370080;370080;370080 | 17280;17280;17280;17280;17280 | 0;256;0;128;0 | |
136 | mobilenetv22_features_linearbottleneck15_batchnorm1_fwd | BatchNorm | [1,480,7,7] | 19.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.33 | 164640 | 7680.00 | 0.00 | 13.50 | 21.44 | 38.00 | false | 0.134860;0.137487;0.135799;0.134600;0.134588 | 164640;164640;164640;164640;164640 | 0;0;0;0;0 | 7680;7680;7680;7680;14336 | |
137 | mobilenetv22_features_linearbottleneck15_relu61_relu6 | clip | [1,480,7,7] | 21.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.67 | 0 | 0.00 | 42.67 | 13.70 | 0.00 | 0.00 | true | 0.136570;0.136489;0.136639;0.136570;0.136659 | 0;0;0;0;0 | 0;0;0;0;0 | 128;0;128;0;0 | |
138 | mobilenetv22_features_linearbottleneck15_conv2_fwd | Convolution | [1,480,7,7] | 282.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 34.00 | 5902160 | 153600.00 | 0.00 | 3.10 | 38.43 | 173.59 | false | 0.031212;0.031211;0.031211;0.031212;0.031212 | 5902160;5902160;5902160;5902160;5902160 | 153600;153600;153600;153600;153600 | 0;0;0;0;128 | |
139 | mobilenetv22_features_linearbottleneck15_batchnorm2_fwd | BatchNorm | [1,80,7,7] | 10.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 27440 | 1280.00 | 42.67 | 3.10 | 20.75 | 6.86 | false | 0.031167;0.031170;0.031172;0.031171;0.031164 | 27440;27440;27440;27440;27440 | 1280;3328;1280;1280;1280 | 0;128;0;128;0 | |
140 | mobilenetv22_features_linearbottleneck15_elemwise_add0 | elemwise_add | [1,80,7,7] | 7.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::mxnet_op::op_with_req<mxnet::op::mshadow_op::plus, 1>, float*, float*, float*>(int, float*, float*, float*) | 3.00 | 3920 | 0.00 | 0.00 | 12.10 | 0.00 | 1.31 | true | 0.121074;0.121058;0.121037;0.121050;0.121040 | 3920;3920;3920;3920;3920 | 0;0;0;0;0 | 0;0;0;0;0 | |
141 | mobilenetv22_features_linearbottleneck16_conv0_fwd | Convolution | [1,80,7,7] | 262.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 10.67 | 4938720 | 153600.00 | 416.00 | 3.10 | 32.07 | 462.99 | false | 0.031240;0.031240;0.031240;0.031239;0.031240 | 4938720;4938720;4938720;4938720;4938720 | 416;928;544;288;288 | 153600;153600;153600;158720;153600 | |
142 | mobilenetv22_features_linearbottleneck16_batchnorm0_fwd | BatchNorm | [1,480,7,7] | 16.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 5.00 | 164640 | 7680.00 | 0.00 | 13.60 | 21.44 | 32.93 | false | 0.137331;0.134561;0.138694;0.135759;0.135998 | 164640;164640;164640;164640;164640 | 7680;7680;7680;7680;7680 | 0;0;0;0;128 | |
143 | mobilenetv22_features_linearbottleneck16_relu60_relu6 | clip | [1,480,7,7] | 19 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.33 | 0 | 0.00 | 42.67 | 13.70 | 0.00 | 0.00 | true | 0.136918;0.137023;0.136975;0.137023;0.136921 | 0;0;0;0;0 | 0;0;0;0;0 | 0;128;0;128;0 | |
144 | mobilenetv22_features_linearbottleneck16_conv1_fwd | Convolution | [1,480,7,7] | 522.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 5.00 | 370080 | 17365.33 | 0.00 | 47.10 | 21.31 | 74.02 | false | 0.471287;0.471240;0.471196;0.471023;0.471344 | 370080;370080;370080;370080;370080 | 17280;17536;17792;17280;17280 | 0;0;0;0;0 | |
145 | mobilenetv22_features_linearbottleneck16_batchnorm1_fwd | BatchNorm | [1,480,7,7] | 19 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.33 | 164640 | 7680.00 | 42.67 | 13.30 | 21.32 | 38.00 | false | 0.135094;0.131770;0.131739;0.133052;0.132876 | 164640;164640;164640;164640;164640 | 7680;7680;9472;7680;7680 | 128;0;128;0;0 | |
146 | mobilenetv22_features_linearbottleneck16_relu61_relu6 | clip | [1,480,7,7] | 15 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.00 | 0 | 0.00 | 0.00 | 13.70 | 0.00 | 0.00 | true | 0.136656;0.135670;0.136645;0.136556;0.136698 | 0;0;0;0;0 | 0;0;0;0;0 | 0;0;0;0;128 | |
147 | mobilenetv22_features_linearbottleneck16_conv2_fwd | Convolution | [1,480,7,7] | 543 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 34.67 | 9838240 | 307200.00 | 373.33 | 3.10 | 31.99 | 283.79 | false | 0.031247;0.031248;0.031247;0.031247;0.031247 | 9838240;9838240;9838240;9838240;9838240 | 307200;307200;307200;307200;307200 | 288;416;416;416;288 | |
148 | mobilenetv22_features_linearbottleneck16_batchnorm2_fwd | BatchNorm | [1,160,7,7] | 11.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 4.00 | 54880 | 2560.00 | 0.00 | 5.80 | 21.44 | 13.72 | false | 0.057930;0.057671;0.057758;0.057443;0.057782 | 54880;54880;54880;54880;54880 | 0;0;0;0;0 | 2560;2560;2560;2560;2560 | |
149 | mobilenetv22_features_conv1_fwd | Convolution | [1,160,7,7] | 1409.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 16.00 | 26277120 | 819200.00 | 20042.67 | 3.10 | 31.31 | 1642.32 | false | 0.031234;0.031234;0.031235;0.031235;0.031233 | 26277120;26277120;26277120;26277120;26277120 | 20000;20256;20000;20128;20000 | 819200;819200;819200;819200;819200 | |
150 | mobilenetv22_features_batchnorm1_fwd | BatchNorm | [1,1280,7,7] | 38.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 6.00 | 439040 | 20480.00 | 6528.00 | 18.80 | 16.26 | 73.17 | true | 0.202994;0.176096;0.189551;0.185212;0.190186 | 439040;439040;439040;439040;439040 | 20480;20480;20480;20480;20480 | 6528;6528;6528;6528;5632 | |
151 | mobilenetv22_features_relu61_relu6 | clip | [1,1280,7,7] | 40.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mxnet::op::mxnet_op::mxnet_generic_kernel<mxnet::op::clip, float*, float*, float, float>(int, float*, float*, float, float) | 3.67 | 0 | 0.00 | 85.33 | 29.60 | 0.00 | 0.00 | true | 0.295545;0.295862;0.295696;0.295962;0.295304 | 0;0;0;0;0 | 256;0;0;0;0 | 5120;128;0;128;0 | |
152 | mobilenetv22_features_pool0_fwd | Pooling | [1,1280,7,7] | 94.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::pooling_fw_4d_kernel<float, float, cudnn::detail::averpooling_func<float>, 1, false>(cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnPoolingStruct, float, float, int, cudnn::reduced_divisor, cudnn::reduced_divisor) | 8.00 | 83635 | 3840.00 | 5205.33 | 12.10 | 9.25 | 10.45 | true | 0.121151;0.121019;0.121112;0.121052;0.121156 | 83635;83635;83635;83635;83635 | 3840;3840;3840;3840;3840 | 7936;5120;5248;5248;5120 | |
153 | mobilenetv22_output_pred_fwd | Convolution | [1,1280,1,1] | 2170.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::implicit_convolve_sgemm<float, float, 1024, 5, 5, 3, 3, 3, 1, true, false, true>(int, int, int, float const*, int, float*, float*, kernel_conv_params, int, float, float, int, float*, float*, int, int) | 89.33 | 83887080 | 5120000.00 | 2215808.00 | 3.10 | 11.44 | 939.04 | true | 0.031249;0.031249;0.031249;0.031249;0.031249 | 83887080;83887080;83887080;83887080;83887080 | 2207936;2213312;2219744;2215616;2218496 | 5120000;5120000;5120000;5120256;5120000 |
Showing 1 to 186 of 186 entries