GPU Kernel Information
layer_index | layer_name | layer_type | layer_shape | layer_duration (us) | layer_allocated_bytes | layer_peak_allocated_bytes | layer_allocator_bytes_in_use | layer_allocator_name | layer_host_temp_mem_bytes | layer_device_temp_mem_bytes | layer_host_persistent_mem_bytes | layer_device_persistent_mem_bytes | kernel_name | kernel_duration (us) | kernel_flops | kernel_dram_read_bytes | kernel_dram_write_bytes | kernel_achieved_occupancy (%) | kernel_arithmetic_intensity (flops/byte) | kernel_arithmetic_throughput (GFlops) | kernel_memory_bound | achieved_occupancy | flop_count_sp | dram_read_bytes | dram_write_bytes |
---|
layer_index | layer_name | layer_type | layer_shape | layer_duration (us) | layer_allocated_bytes | layer_peak_allocated_bytes | layer_allocator_bytes_in_use | layer_allocator_name | layer_host_temp_mem_bytes | layer_device_temp_mem_bytes | layer_host_persistent_mem_bytes | layer_device_persistent_mem_bytes | kernel_name | kernel_duration (us) | kernel_flops | kernel_dram_read_bytes | kernel_dram_write_bytes | kernel_achieved_occupancy (%) | kernel_arithmetic_intensity (flops/byte) | kernel_arithmetic_throughput (GFlops) | kernel_memory_bound | achieved_occupancy | flop_count_sp | dram_read_bytes | dram_write_bytes |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | mobilenet3_conv0_fwd | Convolution | [64,3,224,224] | 118610.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 187.00 | 1490026496 | 38635328.00 | 28054560.00 | 24.00 | 22.34 | 7968.06 | false | 0.239852;0.239723;0.239760;0.239959;0.239648 | 1490026496;1490026496;1490026496;1490026496;1490026496 | 28055072;28051136;28057472;28031552;28072128 | 38627904;38638752;38633536;38640928;38633696 | |
0 | mobilenet3_conv0_fwd | Convolution | [64,3,224,224] | 118610.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.00 | 0 | 106.67 | 233856.00 | 7.40 | 0.00 | 0.00 | true | 0.073949;0.074812;0.073819;0.073944;0.074201 | 0;0;0;0;0 | 232672;233952;233696;233920;235456 | 96;160;128;96;96 | |
1 | mobilenet3_batchnorm0_fwd | BatchNorm | [64,8,112,112] | 11973 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 73.33 | 38797312 | 25690933.33 | 25838197.33 | 83.40 | 0.75 | 529.06 | true | 0.834386;0.833654;0.832492;0.843268;0.829743 | 38797312;38797312;38797312;38797312;38797312 | 25691104;25690848;25692128;25690848;25690848 | 25842720;25840032;25834400;25828416;25840160 | |
2 | mobilenet3_relu0_fwd | Activation | [64,8,112,112] | 2554.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 69.00 | 12845056 | 25690720.00 | 25533717.33 | 94.50 | 0.25 | 186.16 | true | 0.947260;0.946266;0.941896;0.943636;0.945043 | 12845056;12845056;12845056;12845056;12845056 | 25526464;25533888;25537600;25537984;25529664 | 25690976;25690720;25690720;25690720;25690720 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 120.29 | 667942912 | 3211504.00 | 3200048.00 | 23.90 | 104.18 | 5552.96 | false | 0.239142;0.239130;0.239094;0.239227;0.238907;0.239295;0.238714;0.239221;0.238885;0.239007;0.239247;0.238897;0.239172;0.239091;0.239047;0.239044;0.238815;0.238984;0.239052;0.238988;0.239243;0.238904;0.239183;0.238872;0.239137;0.238766;0.238588;0.239155;0.238861;0.239433;0.239013;0.238953;0.239189;0.238932;0.239160;0.238958;0.238852;0.238986;0.239034;0.238959 | 667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912 | 3100320;3211552;3216768;3211584;3211488;3211488;3211520;3211456;3096256;3211648;3211360;3211616;3211392;3211648;3211456;3211456;3092704;3211616;3211392;3211584;3211488;3211552;3211456;3211712;3099904;3211584;3211360;3211616;3211456;3211584;3211456;3212992;3097440;3211616;3211392;3211584;3211424;3211616;3211456;3211456 | 3371840;3336512;3179008;3151936;3201408;3123360;3236736;3141920;3370272;3338240;3174432;3160640;3198112;3117760;3245120;3150432;3385088;3321888;3179328;3158240;3192928;3126816;3235968;3138176;3387680;3328224;3180480;3155744;3190816;3122432;3245760;3153632;3383104;3315744;3171392;3158720;3195136;3125376;3247552;3145440 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 120.29 | 667942912 | 3211504.00 | 3200048.00 | 23.90 | 104.18 | 5552.96 | false | 0.239142;0.239130;0.239094;0.239227;0.238907;0.239295;0.238714;0.239221;0.238885;0.239007;0.239247;0.238897;0.239172;0.239091;0.239047;0.239044;0.238815;0.238984;0.239052;0.238988;0.239243;0.238904;0.239183;0.238872;0.239137;0.238766;0.238588;0.239155;0.238861;0.239433;0.239013;0.238953;0.239189;0.238932;0.239160;0.238958;0.238852;0.238986;0.239034;0.238959 | 667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912 | 3100320;3211552;3216768;3211584;3211488;3211488;3211520;3211456;3096256;3211648;3211360;3211616;3211392;3211648;3211456;3211456;3092704;3211616;3211392;3211584;3211488;3211552;3211456;3211712;3099904;3211584;3211360;3211616;3211456;3211584;3211456;3212992;3097440;3211616;3211392;3211584;3211424;3211616;3211456;3211456 | 3371840;3336512;3179008;3151936;3201408;3123360;3236736;3141920;3370272;3338240;3174432;3160640;3198112;3117760;3245120;3150432;3385088;3321888;3179328;3158240;3192928;3126816;3235968;3138176;3387680;3328224;3180480;3155744;3190816;3122432;3245760;3153632;3383104;3315744;3171392;3158720;3195136;3125376;3247552;3145440 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 120.29 | 667942912 | 3211504.00 | 3200048.00 | 23.90 | 104.18 | 5552.96 | false | 0.239142;0.239130;0.239094;0.239227;0.238907;0.239295;0.238714;0.239221;0.238885;0.239007;0.239247;0.238897;0.239172;0.239091;0.239047;0.239044;0.238815;0.238984;0.239052;0.238988;0.239243;0.238904;0.239183;0.238872;0.239137;0.238766;0.238588;0.239155;0.238861;0.239433;0.239013;0.238953;0.239189;0.238932;0.239160;0.238958;0.238852;0.238986;0.239034;0.238959 | 667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912 | 3100320;3211552;3216768;3211584;3211488;3211488;3211520;3211456;3096256;3211648;3211360;3211616;3211392;3211648;3211456;3211456;3092704;3211616;3211392;3211584;3211488;3211552;3211456;3211712;3099904;3211584;3211360;3211616;3211456;3211584;3211456;3212992;3097440;3211616;3211392;3211584;3211424;3211616;3211456;3211456 | 3371840;3336512;3179008;3151936;3201408;3123360;3236736;3141920;3370272;3338240;3174432;3160640;3198112;3117760;3245120;3150432;3385088;3321888;3179328;3158240;3192928;3126816;3235968;3138176;3387680;3328224;3180480;3155744;3190816;3122432;3245760;3153632;3383104;3315744;3171392;3158720;3195136;3125376;3247552;3145440 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 120.24 | 667942912 | 3211504.00 | 3200048.00 | 23.90 | 104.18 | 5555.17 | false | 0.239142;0.239130;0.239094;0.239227;0.238907;0.239295;0.238714;0.239221;0.238885;0.239007;0.239247;0.238897;0.239172;0.239091;0.239047;0.239044;0.238815;0.238984;0.239052;0.238988;0.239243;0.238904;0.239183;0.238872;0.239137;0.238766;0.238588;0.239155;0.238861;0.239433;0.239013;0.238953;0.239189;0.238932;0.239160;0.238958;0.238852;0.238986;0.239034;0.238959 | 667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912 | 3100320;3211552;3216768;3211584;3211488;3211488;3211520;3211456;3096256;3211648;3211360;3211616;3211392;3211648;3211456;3211456;3092704;3211616;3211392;3211584;3211488;3211552;3211456;3211712;3099904;3211584;3211360;3211616;3211456;3211584;3211456;3212992;3097440;3211616;3211392;3211584;3211424;3211616;3211456;3211456 | 3371840;3336512;3179008;3151936;3201408;3123360;3236736;3141920;3370272;3338240;3174432;3160640;3198112;3117760;3245120;3150432;3385088;3321888;3179328;3158240;3192928;3126816;3235968;3138176;3387680;3328224;3180480;3155744;3190816;3122432;3245760;3153632;3383104;3315744;3171392;3158720;3195136;3125376;3247552;3145440 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 120.24 | 667942912 | 3211504.00 | 3200048.00 | 23.90 | 104.18 | 5555.17 | false | 0.239142;0.239130;0.239094;0.239227;0.238907;0.239295;0.238714;0.239221;0.238885;0.239007;0.239247;0.238897;0.239172;0.239091;0.239047;0.239044;0.238815;0.238984;0.239052;0.238988;0.239243;0.238904;0.239183;0.238872;0.239137;0.238766;0.238588;0.239155;0.238861;0.239433;0.239013;0.238953;0.239189;0.238932;0.239160;0.238958;0.238852;0.238986;0.239034;0.238959 | 667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912 | 3371840;3336512;3179008;3151936;3201408;3123360;3236736;3141920;3370272;3338240;3174432;3160640;3198112;3117760;3245120;3150432;3385088;3321888;3179328;3158240;3192928;3126816;3235968;3138176;3387680;3328224;3180480;3155744;3190816;3122432;3245760;3153632;3383104;3315744;3171392;3158720;3195136;3125376;3247552;3145440 | 3100320;3211552;3216768;3211584;3211488;3211488;3211520;3211456;3096256;3211648;3211360;3211616;3211392;3211648;3211456;3211456;3092704;3211616;3211392;3211584;3211488;3211552;3211456;3211712;3099904;3211584;3211360;3211616;3211456;3211584;3211456;3212992;3097440;3211616;3211392;3211584;3211424;3211616;3211456;3211456 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 120.24 | 667942912 | 3211504.00 | 3200048.00 | 23.90 | 104.18 | 5555.17 | false | 0.239142;0.239130;0.239094;0.239227;0.238907;0.239295;0.238714;0.239221;0.238885;0.239007;0.239247;0.238897;0.239172;0.239091;0.239047;0.239044;0.238815;0.238984;0.239052;0.238988;0.239243;0.238904;0.239183;0.238872;0.239137;0.238766;0.238588;0.239155;0.238861;0.239433;0.239013;0.238953;0.239189;0.238932;0.239160;0.238958;0.238852;0.238986;0.239034;0.238959 | 667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912 | 3100320;3211552;3216768;3211584;3211488;3211488;3211520;3211456;3096256;3211648;3211360;3211616;3211392;3211648;3211456;3211456;3092704;3211616;3211392;3211584;3211488;3211552;3211456;3211712;3099904;3211584;3211360;3211616;3211456;3211584;3211456;3212992;3097440;3211616;3211392;3211584;3211424;3211616;3211456;3211456 | 3371840;3336512;3179008;3151936;3201408;3123360;3236736;3141920;3370272;3338240;3174432;3160640;3198112;3117760;3245120;3150432;3385088;3321888;3179328;3158240;3192928;3126816;3235968;3138176;3387680;3328224;3180480;3155744;3190816;3122432;3245760;3153632;3383104;3315744;3171392;3158720;3195136;3125376;3247552;3145440 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 120.24 | 667942912 | 3211504.00 | 3200048.00 | 23.90 | 104.18 | 5555.17 | false | 0.239142;0.239130;0.239094;0.239227;0.238907;0.239295;0.238714;0.239221;0.238885;0.239007;0.239247;0.238897;0.239172;0.239091;0.239047;0.239044;0.238815;0.238984;0.239052;0.238988;0.239243;0.238904;0.239183;0.238872;0.239137;0.238766;0.238588;0.239155;0.238861;0.239433;0.239013;0.238953;0.239189;0.238932;0.239160;0.238958;0.238852;0.238986;0.239034;0.238959 | 667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912 | 3100320;3211552;3216768;3211584;3211488;3211488;3211520;3211456;3096256;3211648;3211360;3211616;3211392;3211648;3211456;3211456;3092704;3211616;3211392;3211584;3211488;3211552;3211456;3211712;3099904;3211584;3211360;3211616;3211456;3211584;3211456;3212992;3097440;3211616;3211392;3211584;3211424;3211616;3211456;3211456 | 3371840;3336512;3179008;3151936;3201408;3123360;3236736;3141920;3370272;3338240;3174432;3160640;3198112;3117760;3245120;3150432;3385088;3321888;3179328;3158240;3192928;3126816;3235968;3138176;3387680;3328224;3180480;3155744;3190816;3122432;3245760;3153632;3383104;3315744;3171392;3158720;3195136;3125376;3247552;3145440 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 120.24 | 667942912 | 3211504.00 | 3200048.00 | 23.90 | 104.18 | 5555.17 | false | 0.239142;0.239130;0.239094;0.239227;0.238907;0.239295;0.238714;0.239221;0.238885;0.239007;0.239247;0.238897;0.239172;0.239091;0.239047;0.239044;0.238815;0.238984;0.239052;0.238988;0.239243;0.238904;0.239183;0.238872;0.239137;0.238766;0.238588;0.239155;0.238861;0.239433;0.239013;0.238953;0.239189;0.238932;0.239160;0.238958;0.238852;0.238986;0.239034;0.238959 | 667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912;667942912 | 3100320;3211552;3216768;3211584;3211488;3211488;3211520;3211456;3096256;3211648;3211360;3211616;3211392;3211648;3211456;3211456;3092704;3211616;3211392;3211584;3211488;3211552;3211456;3211712;3099904;3211584;3211360;3211616;3211456;3211584;3211456;3212992;3097440;3211616;3211392;3211584;3211424;3211616;3211456;3211456 | 3371840;3336512;3179008;3151936;3201408;3123360;3236736;3141920;3370272;3338240;3174432;3160640;3198112;3117760;3245120;3150432;3385088;3321888;3179328;3158240;3192928;3126816;3235968;3138176;3387680;3328224;3180480;3155744;3190816;3122432;3245760;3153632;3383104;3315744;3171392;3158720;3195136;3125376;3247552;3145440 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.43 | 0 | 96.00 | 93177.33 | 7.40 | 0.00 | 0.00 | true | 0.073675;0.073555;0.073613;0.073468;0.073455;0.073591;0.073566;0.073431;0.073511;0.073848;0.073420;0.073384;0.073604;0.073414;0.073532;0.073908;0.073457;0.073466;0.073506;0.073558;0.073922;0.073534;0.073685;0.073430;0.073559;0.073564;0.073565;0.073426;0.073531;0.073567;0.073512;0.073434;0.073543;0.073560;0.073445;0.073452;0.073438;0.073503;0.073381;0.073325 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 352;96;96;96;96;96;96;352;96;96;96;96;96;96;96;96;96;96;2144;96;96;96;5216;96;96;96;96;96;5472;96;96;96;96;96;96;96;96;96;96;96 | 100800;94080;79776;67584;127392;130688;99968;70400;101056;96832;80000;65408;127616;125952;91392;69888;100288;97408;79264;66432;115328;126144;100480;70912;100288;95776;78848;66560;132736;130432;92032;69888;100384;95488;79008;69376;126080;130432;90496;70144 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.43 | 0 | 96.00 | 93177.33 | 7.40 | 0.00 | 0.00 | true | 0.073675;0.073555;0.073613;0.073468;0.073455;0.073591;0.073566;0.073431;0.073511;0.073848;0.073420;0.073384;0.073604;0.073414;0.073532;0.073908;0.073457;0.073466;0.073506;0.073558;0.073922;0.073534;0.073685;0.073430;0.073559;0.073564;0.073565;0.073426;0.073531;0.073567;0.073512;0.073434;0.073543;0.073560;0.073445;0.073452;0.073438;0.073503;0.073381;0.073325 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 100800;94080;79776;67584;127392;130688;99968;70400;101056;96832;80000;65408;127616;125952;91392;69888;100288;97408;79264;66432;115328;126144;100480;70912;100288;95776;78848;66560;132736;130432;92032;69888;100384;95488;79008;69376;126080;130432;90496;70144 | 352;96;96;96;96;96;96;352;96;96;96;96;96;96;96;96;96;96;2144;96;96;96;5216;96;96;96;96;96;5472;96;96;96;96;96;96;96;96;96;96;96 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.43 | 0 | 96.00 | 93177.33 | 7.40 | 0.00 | 0.00 | true | 0.073675;0.073555;0.073613;0.073468;0.073455;0.073591;0.073566;0.073431;0.073511;0.073848;0.073420;0.073384;0.073604;0.073414;0.073532;0.073908;0.073457;0.073466;0.073506;0.073558;0.073922;0.073534;0.073685;0.073430;0.073559;0.073564;0.073565;0.073426;0.073531;0.073567;0.073512;0.073434;0.073543;0.073560;0.073445;0.073452;0.073438;0.073503;0.073381;0.073325 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 100800;94080;79776;67584;127392;130688;99968;70400;101056;96832;80000;65408;127616;125952;91392;69888;100288;97408;79264;66432;115328;126144;100480;70912;100288;95776;78848;66560;132736;130432;92032;69888;100384;95488;79008;69376;126080;130432;90496;70144 | 352;96;96;96;96;96;96;352;96;96;96;96;96;96;96;96;96;96;2144;96;96;96;5216;96;96;96;96;96;5472;96;96;96;96;96;96;96;96;96;96;96 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.43 | 0 | 96.00 | 93177.33 | 7.40 | 0.00 | 0.00 | true | 0.073675;0.073555;0.073613;0.073468;0.073455;0.073591;0.073566;0.073431;0.073511;0.073848;0.073420;0.073384;0.073604;0.073414;0.073532;0.073908;0.073457;0.073466;0.073506;0.073558;0.073922;0.073534;0.073685;0.073430;0.073559;0.073564;0.073565;0.073426;0.073531;0.073567;0.073512;0.073434;0.073543;0.073560;0.073445;0.073452;0.073438;0.073503;0.073381;0.073325 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 100800;94080;79776;67584;127392;130688;99968;70400;101056;96832;80000;65408;127616;125952;91392;69888;100288;97408;79264;66432;115328;126144;100480;70912;100288;95776;78848;66560;132736;130432;92032;69888;100384;95488;79008;69376;126080;130432;90496;70144 | 352;96;96;96;96;96;96;352;96;96;96;96;96;96;96;96;96;96;2144;96;96;96;5216;96;96;96;96;96;5472;96;96;96;96;96;96;96;96;96;96;96 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.43 | 0 | 96.00 | 93177.33 | 7.40 | 0.00 | 0.00 | true | 0.073675;0.073555;0.073613;0.073468;0.073455;0.073591;0.073566;0.073431;0.073511;0.073848;0.073420;0.073384;0.073604;0.073414;0.073532;0.073908;0.073457;0.073466;0.073506;0.073558;0.073922;0.073534;0.073685;0.073430;0.073559;0.073564;0.073565;0.073426;0.073531;0.073567;0.073512;0.073434;0.073543;0.073560;0.073445;0.073452;0.073438;0.073503;0.073381;0.073325 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 100800;94080;79776;67584;127392;130688;99968;70400;101056;96832;80000;65408;127616;125952;91392;69888;100288;97408;79264;66432;115328;126144;100480;70912;100288;95776;78848;66560;132736;130432;92032;69888;100384;95488;79008;69376;126080;130432;90496;70144 | 352;96;96;96;96;96;96;352;96;96;96;96;96;96;96;96;96;96;2144;96;96;96;5216;96;96;96;96;96;5472;96;96;96;96;96;96;96;96;96;96;96 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.43 | 0 | 96.00 | 93177.33 | 7.40 | 0.00 | 0.00 | true | 0.073675;0.073555;0.073613;0.073468;0.073455;0.073591;0.073566;0.073431;0.073511;0.073848;0.073420;0.073384;0.073604;0.073414;0.073532;0.073908;0.073457;0.073466;0.073506;0.073558;0.073922;0.073534;0.073685;0.073430;0.073559;0.073564;0.073565;0.073426;0.073531;0.073567;0.073512;0.073434;0.073543;0.073560;0.073445;0.073452;0.073438;0.073503;0.073381;0.073325 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 352;96;96;96;96;96;96;352;96;96;96;96;96;96;96;96;96;96;2144;96;96;96;5216;96;96;96;96;96;5472;96;96;96;96;96;96;96;96;96;96;96 | 100800;94080;79776;67584;127392;130688;99968;70400;101056;96832;80000;65408;127616;125952;91392;69888;100288;97408;79264;66432;115328;126144;100480;70912;100288;95776;78848;66560;132736;130432;92032;69888;100384;95488;79008;69376;126080;130432;90496;70144 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.38 | 0 | 96.00 | 93177.33 | 7.40 | 0.00 | 0.00 | true | 0.073675;0.073555;0.073613;0.073468;0.073455;0.073591;0.073566;0.073431;0.073511;0.073848;0.073420;0.073384;0.073604;0.073414;0.073532;0.073908;0.073457;0.073466;0.073506;0.073558;0.073922;0.073534;0.073685;0.073430;0.073559;0.073564;0.073565;0.073426;0.073531;0.073567;0.073512;0.073434;0.073543;0.073560;0.073445;0.073452;0.073438;0.073503;0.073381;0.073325 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 100800;94080;79776;67584;127392;130688;99968;70400;101056;96832;80000;65408;127616;125952;91392;69888;100288;97408;79264;66432;115328;126144;100480;70912;100288;95776;78848;66560;132736;130432;92032;69888;100384;95488;79008;69376;126080;130432;90496;70144 | 352;96;96;96;96;96;96;352;96;96;96;96;96;96;96;96;96;96;2144;96;96;96;5216;96;96;96;96;96;5472;96;96;96;96;96;96;96;96;96;96;96 | |
3 | mobilenet3_conv1_fwd | Convolution | [64,8,112,112] | 91844.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.38 | 0 | 96.00 | 93177.33 | 7.40 | 0.00 | 0.00 | true | 0.073675;0.073555;0.073613;0.073468;0.073455;0.073591;0.073566;0.073431;0.073511;0.073848;0.073420;0.073384;0.073604;0.073414;0.073532;0.073908;0.073457;0.073466;0.073506;0.073558;0.073922;0.073534;0.073685;0.073430;0.073559;0.073564;0.073565;0.073426;0.073531;0.073567;0.073512;0.073434;0.073543;0.073560;0.073445;0.073452;0.073438;0.073503;0.073381;0.073325 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 100800;94080;79776;67584;127392;130688;99968;70400;101056;96832;80000;65408;127616;125952;91392;69888;100288;97408;79264;66432;115328;126144;100480;70912;100288;95776;78848;66560;132736;130432;92032;69888;100384;95488;79008;69376;126080;130432;90496;70144 | 352;96;96;96;96;96;96;352;96;96;96;96;96;96;96;96;96;96;2144;96;96;96;5216;96;96;96;96;96;5472;96;96;96;96;96;96;96;96;96;96;96 | |
4 | mobilenet3_batchnorm1_fwd | BatchNorm | [64,8,112,112] | 11732.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 72.67 | 38797312 | 25472672.00 | 25624064.00 | 83.10 | 0.76 | 533.91 | true | 0.832431;0.825044;0.840914;0.831204;0.830455 | 38797312;38797312;38797312;38797312;38797312 | 25442976;25469216;25475616;25473184;25477280 | 25614656;25614144;25639936;25625024;25632512 | |
5 | mobilenet3_relu1_fwd | Activation | [64,8,112,112] | 2533.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 69.33 | 12845056 | 25690720.00 | 25529109.33 | 94.30 | 0.25 | 185.27 | true | 0.942605;0.942753;0.942016;0.944798;0.943710 | 12845056;12845056;12845056;12845056;12845056 | 25690720;25690720;25690720;25690720;25690720 | 25536960;25539648;25516608;25528512;25521856 | |
6 | mobilenet3_conv2_fwd | Convolution | [64,8,112,112] | 54663.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_interior_nn_v1 | 115.67 | 462422016 | 25865749.33 | 51202304.00 | 23.90 | 6.00 | 3997.87 | true | 0.239574;0.239603;0.239410;0.239419;0.239406 | 462422016;462422016;462422016;462422016;462422016 | 51162752;51198944;51232224;51240928;51175744 | 25876800;25859392;25861056;25850048;25889344 | |
6 | mobilenet3_conv2_fwd | Convolution | [64,8,112,112] | 54663.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 4.00 | 0 | 96.00 | 101024.00 | 7.40 | 0.00 | 0.00 | true | 0.073961;0.073922;0.073878;0.073925;0.073927 | 0;0;0;0;0 | 101024;101024;101024;101024;101152 | 96;96;96;96;96 | |
7 | mobilenet3_batchnorm2_fwd | BatchNorm | [64,16,112,112] | 5358.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 141.67 | 77594624 | 51381216.00 | 51718656.00 | 91.20 | 0.75 | 547.73 | true | 0.911934;0.911525;0.911173;0.911675;0.912391 | 77594624;77594624;77594624;77594624;77594624 | 51785888;51719328;51692576;51669056;51744064 | 51381280;51381216;51381216;51381216;51381216 | |
8 | mobilenet3_relu2_fwd | Activation | [64,16,112,112] | 5015 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 135.33 | 25690112 | 51380576.00 | 51204629.33 | 95.70 | 0.25 | 189.83 | true | 0.957806;0.958581;0.955190;0.957740;0.956022 | 25690112;25690112;25690112;25690112;25690112 | 51380576;51380576;51380576;51380576;51380576 | 51179968;51206464;51199424;51214144;51208000 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_small_nn_v1 | 37.00 | 166985728 | 3211496.00 | 826452.67 | 21.60 | 41.35 | 4513.13 | false | 0.215619;0.215531;0.215920;0.216129;0.215026;0.216431;0.215562;0.215452;0.216201;0.216288;0.215612;0.216258;0.215819;0.216359;0.216662;0.215922;0.216365;0.216109;0.215315;0.216227;0.215598;0.215783;0.215598;0.215990;0.216346;0.216456;0.215298;0.216264;0.214642;0.216429;0.215440;0.215570;0.216253;0.215848;0.215629;0.215329;0.216596;0.215961;0.215262;0.216093;0.215954;0.216122;0.215604;0.215528;0.215300;0.215902;0.215894;0.215770;0.215646;0.216271;0.215647;0.216159;0.216554;0.215500;0.216917;0.215647;0.216406;0.216503;0.215809;0.215795;0.215691;0.216002;0.216457;0.216640;0.216625;0.215657;0.215390;0.216554;0.215947;0.215297;0.215885;0.215515;0.215841;0.216103;0.216163;0.215996;0.216324;0.215537;0.216411;0.216200 | 166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728;166985728 | 3051072;3203840;3210592;3211520;3211488;3211552;3211520;3211712;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3214272;3038656;3195488;3211200;3211584;3211744;3211552;3211456;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211552;3211360;3045216;3196288;3211200;3211520;3211488;3211552;3211456;3211520;3211552;3211488;3211520;3211424;3211552;3211488;3211520;3211392;3043264;3201120;3210688;3211520;3211488;3218208;3211712;3211520;3211552;3211488;3211520;3211456;3211552;3211488;3211808;3211360;3050976;3197056;3209472;3218176;3213536;3211552;3211456;3211520;3211552;3211552;3211456;3211424;3211552;3211424;3211584;3211456 | 1243648;1699040;1184416;852288;781920;833664;790400;814176;852736;850656;784960;821760;808416;786016;850528;782496;1243872;1679104;1202272;849248;785248;829600;791904;806880;854240;857760;780096;827104;806880;782400;851872;785728;1245952;1699808;1180608;855616;784192;835840;785216;811808;853664;849696;785088;823136;813504;781856;850688;787136;1227456;1677216;1205600;849984;785408;836224;784000;812992;852320;851520;786208;823296;809056;783936;850112;782208;1251584;1684896;1193408;852096;781248;832800;793248;812032;851744;856320;781856;824032;806368;786400;850880;786912 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.46 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.46 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.46 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.46 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.46 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
9 | mobilenet3_conv3_fwd | Convolution | [64,16,112,112] | 49614 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.44 | 0 | 96.00 | 8540.00 | 6.10 | 0.00 | 0.00 | true | 0.061202;0.061172;0.061189;0.061133;0.061141;0.061177;0.061168;0.061156;0.061152;0.061179;0.061149;0.061140;0.061134;0.061170;0.061262;0.061319;0.061199;0.061160;0.061133;0.061136;0.061154;0.061152;0.061134;0.061210;0.061159;0.061190;0.061131;0.061156;0.061185;0.061163;0.061157;0.061133;0.061177;0.061162;0.061175;0.061139;0.061133;0.061191;0.061231;0.061143;0.061375;0.061305;0.061151;0.061151;0.061127;0.061181;0.061188;0.061146;0.061263;0.061283;0.061148;0.061123;0.061136;0.061196;0.061175;0.061160;0.061150;0.061154;0.061161;0.061162;0.061152;0.061181;0.061174;0.061176;0.061201;0.061150;0.061125;0.061122;0.061206;0.061155;0.061128;0.061178;0.061302;0.061162;0.061138;0.061112;0.061155;0.061154;0.061133;0.061115 | 0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0;0 | 96;96;160;96;96;608;96;96;96;96;96;128;96;96;96;96;96;96;96;160;96;96;96;1376;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;352;96;96;96;128;96;96;96;96;96;2656;160;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;96;128;96;96;96;2144 | 25984;22400;15296;8320;15872;0;5760;8704;512;8704;6784;9056;10880;1792;10112;4864;25984;22656;14720;8512;15744;640;6144;8960;896;8448;5120;8960;10880;928;11520;3904;26112;22400;13952;7168;16128;128;7424;7936;1024;8576;4608;9440;10496;1024;10368;2944;36480;28288;15168;8320;15616;768;6656;7808;1152;8192;5120;8832;10368;1312;10752;3776;25984;22528;13696;8320;16128;128;5376;8064;896;8448;4640;9312;11008;1152;11264;4480 | |
10 | mobilenet3_batchnorm3_fwd | BatchNorm | [64,16,56,56] | 1235.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 35.33 | 19791872 | 12552618.67 | 11217493.33 | 84.30 | 0.83 | 560.15 | true | 0.845150;0.846697;0.840218;0.842528;0.842322 | 19791872;19791872;19791872;19791872;19791872 | 12555968;12552704;12554304;12550848;12549632 | 11217120;11217120;11224544;11218240;11212768 | |
11 | mobilenet3_relu3_fwd | Activation | [64,16,56,56] | 1327.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 36.33 | 6422528 | 12845664.00 | 12759178.67 | 94.00 | 0.25 | 176.77 | true | 0.938340;0.938201;0.942236;0.940294;0.943341 | 6422528;6422528;6422528;6422528;6422528 | 12845664;12850784;12845664;12845664;12845664 | 12753856;12767680;12747584;12756000;12770752 | |
12 | mobilenet3_conv4_fwd | Convolution | [64,16,56,56] | 60592 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_interior_nn_v1 | 62.00 | 218365952 | 12878528.00 | 25612245.33 | 22.10 | 5.67 | 3522.03 | true | 0.221327;0.223228;0.221704;0.219797;0.220819 | 218365952;218365952;218365952;218365952;218365952 | 12882112;12877888;12875584;12875456;12883136 | 25624864;25611008;25586368;25600864;25625440 | |
12 | mobilenet3_conv4_fwd | Convolution | [64,16,56,56] | 60592 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.00 | 0 | 96.00 | 26069.33 | 6.10 | 0.00 | 0.00 | true | 0.061168;0.061224;0.061172;0.061210;0.061197 | 0;0;0;0;0 | 96;96;608;96;96 | 25984;25984;26496;26112;26112 | |
13 | mobilenet3_batchnorm4_fwd | BatchNorm | [64,32,56,56] | 2232.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 69.33 | 39583744 | 25691850.67 | 25862453.33 | 86.00 | 0.77 | 570.92 | true | 0.858747;0.860326;0.859086;0.859600;0.859948 | 39583744;39583744;39583744;39583744;39583744 | 25859264;25858464;25869632;25869728;25819424 | 25692192;25691744;25691808;25691488;25692000 | |
14 | mobilenet3_relu4_fwd | Activation | [64,32,56,56] | 2552.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 69.00 | 12845056 | 25690464.00 | 25594432.00 | 94.40 | 0.25 | 186.16 | true | 0.940556;0.943784;0.944092;0.944917;0.946530 | 12845056;12845056;12845056;12845056;12845056 | 25690464;25690464;25690464;25690464;25690464 | 25583936;25588416;25601216;25596608;25598272 | |
15 | mobilenet3_conv5_fwd | Convolution | [64,32,56,56] | 92939.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_c1_k1_nchw_hw_packed_kernel<float, float, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, int) | 98.33 | 134873088 | 24805877.33 | 25543904.00 | 78.20 | 2.68 | 1371.60 | true | 0.779905;0.780996;0.783523;0.782421;0.781900 | 134873088;134873088;134873088;134873088;134873088 | 24811936;24807072;24801696;24795296;24808864 | 25571296;25549536;25541344;25539296;25540832 | |
16 | mobilenet3_batchnorm5_fwd | BatchNorm | [64,32,56,56] | 2362.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 69.00 | 39583744 | 25289909.33 | 25927114.67 | 85.80 | 0.77 | 573.68 | true | 0.859224;0.857464;0.858995;0.858484;0.856707 | 39583744;39583744;39583744;39583744;39583744 | 25295584;25253728;25286880;25302752;25287264 | 25907360;25936928;25937184;25922592;25921824 | |
17 | mobilenet3_relu5_fwd | Activation | [64,32,56,56] | 2145.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 68.67 | 12845056 | 25690464.00 | 25593621.33 | 94.40 | 0.25 | 187.06 | true | 0.945595;0.942420;0.944978;0.944939;0.941688 | 12845056;12845056;12845056;12845056;12845056 | 25690464;25690464;25690464;25690464;25690464 | 25587904;25590592;25595456;25594816;25612608 | |
18 | mobilenet3_conv6_fwd | Convolution | [64,32,56,56] | 102608.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x32_relu_interior_nn_v1 | 82.33 | 423886848 | 25721365.33 | 25449877.33 | 22.40 | 8.28 | 5148.44 | true | 0.225170;0.224567;0.221477;0.223927;0.224281 | 423886848;423886848;423886848;423886848;423886848 | 25719744;25720256;25721920;25721920;25722816 | 25482432;25454784;25470848;25424000;25418304 | |
18 | mobilenet3_conv6_fwd | Convolution | [64,32,56,56] | 102608.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.67 | 0 | 96.00 | 26240.00 | 6.10 | 0.00 | 0.00 | true | 0.061193;0.061212;0.061214;0.061171;0.061175 | 0;0;0;0;0 | 26240;25984;26240;26240;26240 | 96;96;96;96;96 | |
19 | mobilenet3_batchnorm6_fwd | BatchNorm | [64,32,56,56] | 1993.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 69.67 | 39583744 | 25691594.67 | 26006517.33 | 86.10 | 0.77 | 568.18 | true | 0.862550;0.861901;0.859523;0.859246;0.861674 | 39583744;39583744;39583744;39583744;39583744 | 25691808;25691488;25691744;25691552;25691360 | 25993504;25995040;25983136;26031008;26045088 | |
20 | mobilenet3_relu6_fwd | Activation | [64,32,56,56] | 1858.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 69.00 | 12845056 | 25690464.00 | 25596266.67 | 94.50 | 0.25 | 186.16 | true | 0.942650;0.946637;0.946046;0.945204;0.944681 | 12845056;12845056;12845056;12845056;12845056 | 25690464;25690464;25690464;25690464;25690464 | 25591360;25595200;25602240;25605312;25590976 | |
21 | mobilenet3_conv7_fwd | Convolution | [64,32,56,56] | 24532 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 48.33 | 29822976 | 25693749.33 | 8095274.67 | 83.80 | 0.88 | 617.03 | true | 0.848396;0.839309;0.838233;0.836253;0.836478 | 29822976;29822976;29822976;29822976;29822976 | 25693920;25693920;25693664;25693664;25693664 | 8097568;8093216;8094016;8094240;8115744 | |
22 | mobilenet3_batchnorm7_fwd | BatchNorm | [64,32,28,28] | 463 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 20.00 | 10158080 | 6423264.00 | 4991712.00 | 77.80 | 0.89 | 507.90 | true | 0.777587;0.781900;0.778375;0.774840;0.777428 | 10158080;10158080;10158080;10158080;10158080 | 6423264;6423264;6423520;6423264;6423264 | 4994848;4998880;4984800;4995488;4977344 | |
23 | mobilenet3_relu7_fwd | Activation | [64,32,28,28] | 608 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 19.00 | 3211264 | 5666442.67 | 6174080.00 | 91.10 | 0.27 | 169.01 | true | 0.911509;0.906949;0.909413;0.912546;0.913082 | 3211264;3211264;3211264;3211264;3211264 | 6163968;6173760;6177856;6176768;6171712 | 5678304;5663712;5652512;5687648;5657312 | |
24 | mobilenet3_conv8_fwd | Convolution | [64,32,28,28] | 24191.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 37.33 | 211943424 | 2364138.67 | 13065002.67 | 18.70 | 13.74 | 5677.11 | true | 0.186031;0.186899;0.187364;0.185008;0.186959 | 211943424;211943424;211943424;211943424;211943424 | 13066144;13054176;13063040;13067776;13065824 | 2401216;2391808;2318784;2381824;2195136 | |
24 | mobilenet3_conv8_fwd | Convolution | [64,32,28,28] | 24191.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.33 | 0 | 96.00 | 7168.00 | 5.90 | 0.00 | 0.00 | true | 0.059344;0.059345;0.059368;0.059387;0.059348 | 0;0;0;0;0 | 7168;7296;7168;7168;7168 | 96;96;96;96;96 | |
25 | mobilenet3_batchnorm8_fwd | BatchNorm | [64,64,28,28] | 960.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 36.00 | 20316160 | 12559861.33 | 12851296.00 | 81.00 | 0.80 | 564.34 | true | 0.809488;0.809332;0.811237;0.810641;0.812395 | 20316160;20316160;20316160;20316160;20316160 | 12619808;12706016;12368800;12643232;12416544 | 12848096;12855392;12857088;12846496;12850400 | |
26 | mobilenet3_relu8_fwd | Activation | [64,64,28,28] | 1321.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 35.67 | 6422528 | 12845664.00 | 12616810.67 | 93.90 | 0.25 | 180.07 | true | 0.941249;0.940679;0.938602;0.938913;0.938763 | 6422528;6422528;6422528;6422528;6422528 | 12845664;12845664;12845664;12845664;12845664 | 12615488;12625792;12610688;12617856;12617088 | |
27 | mobilenet3_conv9_fwd | Convolution | [64,64,28,28] | 47794 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_c1_k1_nchw_hw_packed_kernel<float, float, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, int) | 54.00 | 67436544 | 11673205.33 | 13115029.33 | 87.90 | 2.72 | 1248.82 | true | 0.879155;0.878205;0.879941;0.876938;0.878199 | 67436544;67436544;67436544;67436544;67436544 | 11671584;11673760;11686816;11672224;11673632 | 13112992;13115264;13112448;13118720;13116832 | |
28 | mobilenet3_batchnorm9_fwd | BatchNorm | [64,64,28,28] | 903 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 36.00 | 20316160 | 12215584.00 | 12805749.33 | 80.90 | 0.81 | 564.34 | true | 0.808650;0.807153;0.808260;0.809997;0.808807 | 20316160;20316160;20316160;20316160;20316160 | 12222048;12215264;12215392;12216096;12199840 | 12811520;12803008;12814624;12802720;12798368 | |
29 | mobilenet3_relu9_fwd | Activation | [64,64,28,28] | 1324.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 35.33 | 6422528 | 12845408.00 | 12617877.33 | 94.10 | 0.25 | 181.77 | true | 0.942027;0.942452;0.941156;0.936418;0.940929 | 6422528;6422528;6422528;6422528;6422528 | 12845408;12845408;12845408;12845408;12845408 | 12612416;12619968;12610112;12621248;12622976 | |
30 | mobilenet3_conv10_fwd | Convolution | [64,64,28,28] | 27893.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 53.33 | 417464320 | 12391296.00 | 13063946.67 | 20.10 | 16.40 | 7827.50 | true | 0.201188;0.200763;0.200938;0.202153;0.202139 | 417464320;417464320;417464320;417464320;417464320 | 12323264;12385280;12392960;12406656;12395648 | 13070752;13062112;13060960;13033504;13068768 | |
30 | mobilenet3_conv10_fwd | Convolution | [64,64,28,28] | 27893.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.00 | 0 | 96.00 | 7168.00 | 5.90 | 0.00 | 0.00 | true | 0.059455;0.059756;0.059618;0.059371;0.059393 | 0;0;0;0;0 | 96;96;96;2912;96 | 7168;7168;7168;13056;7168 | |
31 | mobilenet3_batchnorm10_fwd | BatchNorm | [64,64,28,28] | 925.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 36.00 | 20316160 | 12604896.00 | 12848853.33 | 81.00 | 0.80 | 564.34 | true | 0.809103;0.810249;0.808710;0.809582;0.811018 | 20316160;20316160;20316160;20316160;20316160 | 12480864;12584416;12502112;12754080;12728160 | 12839840;12855456;12850400;12860448;12840704 | |
32 | mobilenet3_relu10_fwd | Activation | [64,64,28,28] | 1324.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 35.33 | 6422528 | 12845408.00 | 12620501.33 | 93.90 | 0.25 | 181.77 | true | 0.937873;0.939943;0.942325;0.938131;0.937593 | 6422528;6422528;6422528;6422528;6422528 | 12620608;12615488;12622080;12618816;12622784 | 12845408;12845408;12845408;12845408;12845408 | |
33 | mobilenet3_conv11_fwd | Convolution | [64,64,28,28] | 13536.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 28.00 | 14573568 | 12828192.00 | 4655850.67 | 82.90 | 0.83 | 520.48 | true | 0.831655;0.829062;0.828352;0.829792;0.824333 | 14573568;14573568;14573568;14573568;14573568 | 12818720;12832224;12839008;12823072;12829280 | 4589632;4646560;4741920;4662144;4658848 | |
34 | mobilenet3_batchnorm11_fwd | BatchNorm | [64,64,14,14] | 426 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 13.33 | 5079040 | 2487594.67 | 2145397.33 | 50.00 | 1.10 | 380.94 | true | 0.507878;0.476783;0.502547;0.489018;0.508648 | 5079040;5079040;5079040;5079040;5079040 | 2208032;2149280;2065056;2135808;2151104 | 2406016;2486656;2530176;2475680;2500448 | |
35 | mobilenet3_relu11_fwd | Activation | [64,64,14,14] | 360.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 6.33 | 1605632 | 30666.67 | 1667594.67 | 76.80 | 0.95 | 253.53 | true | 0.770776;0.768951;0.767482;0.768615;0.763683 | 1605632;1605632;1605632;1605632;1605632 | 31136;29088;29984;30880;40480 | 1696768;1681856;1662816;1658112;1652192 | |
36 | mobilenet3_conv12_fwd | Convolution | [64,64,14,14] | 13747 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x128_relu_interior_nn_v1 | 37.67 | 208732160 | 278058.67 | 6857685.33 | 15.40 | 29.25 | 5541.51 | false | 0.156133;0.153682;0.154355;0.154676;0.153402 | 208732160;208732160;208732160;208732160;208732160 | 6800448;6849152;6902656;6847072;6876832 | 284096;193024;242048;308032;339712 | |
36 | mobilenet3_conv12_fwd | Convolution | [64,64,14,14] | 13747 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.67 | 0 | 96.00 | 1664.00 | 5.80 | 0.00 | 0.00 | true | 0.058022;0.057855;0.058003;0.058015;0.058027 | 0;0;0;0;0 | 96;96;96;96;96 | 5760;1792;1280;1664;1536 | |
37 | mobilenet3_batchnorm12_fwd | BatchNorm | [64,128,14,14] | 705.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 21.00 | 10158080 | 4600981.33 | 7101760.00 | 65.10 | 0.87 | 483.72 | true | 0.637519;0.655771;0.654137;0.652288;0.646449 | 10158080;10158080;10158080;10158080;10158080 | 4600192;4597824;4586240;4630496;4604928 | 7131840;7093312;7069376;7121312;7090656 | |
38 | mobilenet3_relu12_fwd | Activation | [64,128,14,14] | 674.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 17.33 | 3211264 | 3941013.33 | 6401578.67 | 90.40 | 0.31 | 185.27 | true | 0.900859;0.902909;0.908558;0.902741;0.905964 | 3211264;3211264;3211264;3211264;3211264 | 3946112;3939168;3946720;3934176;3937760 | 6397088;6414560;6413568;6393088;6394080 | |
39 | mobilenet3_conv13_fwd | Convolution | [64,128,14,14] | 26272.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 34.00 | 27820032 | 6001781.33 | 6548618.67 | 86.20 | 2.22 | 818.24 | true | 0.863957;0.859730;0.862054;0.862836;0.860964 | 27820032;27820032;27820032;27820032;27820032 | 6005920;5997600;5996704;6004896;6002848 | 6556448;6543424;6548832;6546752;6550272 | |
40 | mobilenet3_batchnorm13_fwd | BatchNorm | [64,128,14,14] | 692.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 22.00 | 10158080 | 6469973.33 | 6994400.00 | 73.60 | 0.75 | 461.73 | true | 0.737265;0.737499;0.735167;0.736958;0.730820 | 10158080;10158080;10158080;10158080;10158080 | 6469280;6470080;6470560;6471200;6467648 | 6990112;6995808;6976800;7001088;6997280 | |
41 | mobilenet3_relu13_fwd | Activation | [64,128,14,14] | 677 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 17.00 | 3211264 | 3881429.33 | 6395061.33 | 90.70 | 0.31 | 188.90 | true | 0.906273;0.902592;0.904751;0.908735;0.909163 | 3211264;3211264;3211264;3211264;3211264 | 3881568;3884640;3892576;3878080;3869280 | 6397920;6391392;6395200;6393696;6396288 | |
42 | mobilenet3_conv14_fwd | Convolution | [64,128,14,14] | 27183.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 53.00 | 414253056 | 1857664.00 | 7229205.33 | 14.20 | 45.59 | 7816.10 | false | 0.137858;0.146323;0.141644;0.141054;0.141958 | 414253056;414253056;414253056;414253056;414253056 | 7181824;7277920;7202816;7272736;7212064 | 1979776;2143072;1626080;1908448;1684768 | |
42 | mobilenet3_conv14_fwd | Convolution | [64,128,14,14] | 27183.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.00 | 0 | 96.00 | 2688.00 | 5.80 | 0.00 | 0.00 | true | 0.058049;0.057967;0.058026;0.058031;0.057989 | 0;0;0;0;0 | 96;96;96;96;96 | 2560;2688;2816;2688;2688 | |
43 | mobilenet3_batchnorm14_fwd | BatchNorm | [64,128,14,14] | 705 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 21.00 | 10158080 | 4551413.33 | 7004245.33 | 66.30 | 0.88 | 483.72 | true | 0.667052;0.650938;0.673469;0.662547;0.658097 | 10158080;10158080;10158080;10158080;10158080 | 7035136;6959808;7032768;6955008;7020160 | 4736832;4600096;4442912;4558112;4496032 | |
44 | mobilenet3_relu14_fwd | Activation | [64,128,14,14] | 679 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 17.67 | 3211264 | 3942666.67 | 6400682.67 | 90.50 | 0.31 | 181.77 | true | 0.901003;0.904498;0.905228;0.905917;0.903837 | 3211264;3211264;3211264;3211264;3211264 | 3916384;3947744;3936608;3962592;3943648 | 6398720;6397952;6402720;6402880;6400608 | |
45 | mobilenet3_conv15_fwd | Convolution | [64,128,14,14] | 26323.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 34.00 | 27820032 | 5997344.00 | 6549077.33 | 86.30 | 2.22 | 818.24 | true | 0.862187;0.866749;0.861762;0.859296;0.863583 | 27820032;27820032;27820032;27820032;27820032 | 6001824;5995808;5994400;5985952;6009376 | 6548768;6556448;6540704;6550592;6547872 | |
46 | mobilenet3_batchnorm15_fwd | BatchNorm | [64,128,14,14] | 695.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 21.67 | 10158080 | 6470154.67 | 7001322.67 | 73.20 | 0.75 | 468.83 | true | 0.726727;0.727147;0.734903;0.732453;0.736892 | 10158080;10158080;10158080;10158080;10158080 | 6996192;6996192;7008032;6999744;7009984 | 6470880;6468672;6471456;6468672;6470912 | |
47 | mobilenet3_relu15_fwd | Activation | [64,128,14,14] | 679.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 18.00 | 3211264 | 3879989.33 | 6396085.33 | 90.50 | 0.31 | 178.40 | true | 0.906545;0.909748;0.901018;0.904577;0.905240 | 3211264;3211264;3211264;3211264;3211264 | 3885920;3891808;3874656;3876064;3877984 | 6397152;6400480;6387616;6400544;6390624 | |
48 | mobilenet3_conv16_fwd | Convolution | [64,128,14,14] | 27165 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 53.00 | 414253056 | 2103477.33 | 7285813.33 | 13.90 | 44.12 | 7816.10 | false | 0.137724;0.138642;0.139388;0.140260;0.142980 | 414253056;414253056;414253056;414253056;414253056 | 2203584;2215392;2085440;2021408;1637280 | 7319104;7274208;7278944;7304288;7211104 | |
48 | mobilenet3_conv16_fwd | Convolution | [64,128,14,14] | 27165 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.00 | 0 | 96.00 | 2432.00 | 5.80 | 0.00 | 0.00 | true | 0.058029;0.057872;0.058027;0.058025;0.058019 | 0;0;0;0;0 | 96;96;96;96;96 | 2432;2432;2432;2432;2432 | |
49 | mobilenet3_batchnorm16_fwd | BatchNorm | [64,128,14,14] | 714 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 21.00 | 10158080 | 4593941.33 | 6938890.67 | 66.50 | 0.88 | 483.72 | true | 0.673551;0.670076;0.658002;0.666977;0.654212 | 10158080;10158080;10158080;10158080;10158080 | 4630240;4595904;4644512;4555680;4465152 | 6913888;6955584;6938624;6922464;7013536 | |
50 | mobilenet3_relu16_fwd | Activation | [64,128,14,14] | 680 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 18.00 | 3211264 | 3954986.67 | 6401269.33 | 90.50 | 0.31 | 178.40 | true | 0.902439;0.905707;0.902080;0.906190;0.908288 | 3211264;3211264;3211264;3211264;3211264 | 3965408;3963104;3932512;3955424;3946432 | 6398656;6404704;6410336;6393536;6400448 | |
51 | mobilenet3_conv17_fwd | Convolution | [64,128,14,14] | 26264.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 34.00 | 27820032 | 6006346.67 | 6554442.67 | 86.30 | 2.21 | 818.24 | true | 0.864814;0.863868;0.863205;0.861102;0.861936 | 27820032;27820032;27820032;27820032;27820032 | 6006944;6004256;6007840;5980064;6012192 | 6553632;6517536;6556256;6553440;6567456 | |
52 | mobilenet3_batchnorm17_fwd | BatchNorm | [64,128,14,14] | 697 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 22.00 | 10158080 | 6469109.33 | 7000330.67 | 73.30 | 0.75 | 461.73 | true | 0.730420;0.734270;0.732695;0.732953;0.736205 | 10158080;10158080;10158080;10158080;10158080 | 6470016;6468800;6470912;6468448;6468512 | 7004064;7031360;6993760;7003168;6978528 | |
53 | mobilenet3_relu17_fwd | Activation | [64,128,14,14] | 682 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 17.67 | 3211264 | 3875840.00 | 6391541.33 | 90.60 | 0.31 | 181.77 | true | 0.905793;0.898861;0.908188;0.908466;0.902684 | 3211264;3211264;3211264;3211264;3211264 | 3885408;3866464;3878912;3879200;3869408 | 6395104;6388864;6389664;6389856;6400288 | |
54 | mobilenet3_conv18_fwd | Convolution | [64,128,14,14] | 27239 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 53.33 | 414253056 | 1899936.00 | 7227072.00 | 14.30 | 45.39 | 7767.29 | false | 0.143403;0.144712;0.141744;0.144472;0.140421 | 414253056;414253056;414253056;414253056;414253056 | 2150720;1921760;1698848;1912256;1865792 | 7228000;7233504;7203232;7230816;7222400 | |
54 | mobilenet3_conv18_fwd | Convolution | [64,128,14,14] | 27239 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.00 | 0 | 96.00 | 2432.00 | 5.80 | 0.00 | 0.00 | true | 0.058056;0.057862;0.058049;0.058058;0.057993 | 0;0;0;0;0 | 96;96;96;96;96 | 9344;2432;2432;2432;2432 | |
55 | mobilenet3_batchnorm18_fwd | BatchNorm | [64,128,14,14] | 712 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 21.00 | 10158080 | 4590528.00 | 6987370.67 | 65.60 | 0.88 | 483.72 | true | 0.643333;0.658314;0.657790;0.653235;0.664242 | 10158080;10158080;10158080;10158080;10158080 | 4687744;4619328;4514880;4637376;4477664 | 6980928;6985376;7038816;6995808;6972288 | |
56 | mobilenet3_relu18_fwd | Activation | [64,128,14,14] | 680.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 17.67 | 3211264 | 3929120.00 | 6404704.00 | 90.60 | 0.31 | 181.77 | true | 0.904225;0.910052;0.905503;0.907687;0.903832 | 3211264;3211264;3211264;3211264;3211264 | 3927328;3916800;3930848;3929184;3982176 | 6404064;6406816;6403232;6407200;6395872 | |
57 | mobilenet3_conv19_fwd | Convolution | [64,128,14,14] | 26368.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 34.00 | 27820032 | 6001312.00 | 6542848.00 | 86.20 | 2.22 | 818.24 | true | 0.862657;0.861465;0.859350;0.861872;0.862319 | 27820032;27820032;27820032;27820032;27820032 | 6010912;5996832;5971872;6008480;5998624 | 6567360;6544384;6530304;6545312;6538848 | |
58 | mobilenet3_batchnorm19_fwd | BatchNorm | [64,128,14,14] | 703.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 22.00 | 10158080 | 6469589.33 | 6999520.00 | 73.90 | 0.75 | 461.73 | true | 0.738405;0.739014;0.740003;0.741064;0.734578 | 10158080;10158080;10158080;10158080;10158080 | 6470368;6469632;6470176;6468416;6468960 | 6985664;6998080;7008832;6997536;7002944 | |
59 | mobilenet3_relu19_fwd | Activation | [64,128,14,14] | 679 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 17.67 | 3211264 | 3875808.00 | 6396864.00 | 90.50 | 0.31 | 181.77 | true | 0.904953;0.904940;0.904214;0.903711;0.908709 | 3211264;3211264;3211264;3211264;3211264 | 3881056;3888288;3869536;3866336;3876832 | 6392000;6398432;6395904;6396256;6400512 | |
60 | mobilenet3_conv20_fwd | Convolution | [64,128,14,14] | 27216.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 53.00 | 414253056 | 2162218.67 | 7269493.33 | 14.20 | 43.92 | 7816.10 | false | 0.143791;0.139993;0.139298;0.143324;0.142494 | 414253056;414253056;414253056;414253056;414253056 | 2228800;2206464;1744192;2051392;2486560 | 7248928;7305632;7201152;7253920;7325632 | |
60 | mobilenet3_conv20_fwd | Convolution | [64,128,14,14] | 27216.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 4.00 | 0 | 96.00 | 2453.33 | 5.80 | 0.00 | 0.00 | true | 0.058032;0.057873;0.058012;0.058037;0.058225 | 0;0;0;0;0 | 96;96;96;5216;96 | 2432;2496;2432;16256;2432 | |
61 | mobilenet3_batchnorm20_fwd | BatchNorm | [64,128,14,14] | 715 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 21.00 | 10158080 | 4610432.00 | 6946485.33 | 65.90 | 0.88 | 483.72 | true | 0.655218;0.658513;0.667720;0.659348;0.657828 | 10158080;10158080;10158080;10158080;10158080 | 4666848;4648384;4514816;4516064;4757600 | 6978944;6927648;7044416;6932864;6897472 | |
62 | mobilenet3_relu20_fwd | Activation | [64,128,14,14] | 679.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 18.00 | 3211264 | 3944469.33 | 6397109.33 | 90.60 | 0.31 | 178.40 | true | 0.900302;0.903140;0.906315;0.907367;0.907764 | 3211264;3211264;3211264;3211264;3211264 | 3923936;3940960;3945856;3964576;3946592 | 6398048;6396736;6392448;6408000;6396544 | |
63 | mobilenet3_conv21_fwd | Convolution | [64,128,14,14] | 26228.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 34.00 | 27820032 | 5991840.00 | 6546026.67 | 86.20 | 2.22 | 818.24 | true | 0.862063;0.861869;0.861274;0.860484;0.863768 | 27820032;27820032;27820032;27820032;27820032 | 5987232;5998624;5987744;5992480;5995296 | 6553088;6552544;6547232;6532704;6538304 | |
64 | mobilenet3_batchnorm21_fwd | BatchNorm | [64,128,14,14] | 698.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 22.00 | 10158080 | 6470154.67 | 7010581.33 | 73.30 | 0.75 | 461.73 | true | 0.734957;0.721944;0.732286;0.734725;0.731601 | 10158080;10158080;10158080;10158080;10158080 | 6470688;6469312;6469952;6469824;6471584 | 6997792;7008064;7005824;7017856;7023872 | |
65 | mobilenet3_relu21_fwd | Activation | [64,128,14,14] | 682.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 17.67 | 3211264 | 3872480.00 | 6393269.33 | 90.40 | 0.31 | 181.77 | true | 0.905487;0.904567;0.903178;0.905311;0.902908 | 3211264;3211264;3211264;3211264;3211264 | 3879520;3897056;3871712;3866208;3860288 | 6398464;6392224;6389440;6398144;6384736 | |
66 | mobilenet3_conv22_fwd | Convolution | [64,128,14,14] | 27212 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 53.00 | 414253056 | 1838218.67 | 7192800.00 | 14.10 | 45.87 | 7816.10 | false | 0.141061;0.141438;0.140959;0.141551;0.139442 | 414253056;414253056;414253056;414253056;414253056 | 1747360;1958048;1731040;2227872;1809248 | 7221952;7180672;7164352;7227840;7175776 | |
66 | mobilenet3_conv22_fwd | Convolution | [64,128,14,14] | 27212 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.00 | 0 | 96.00 | 2688.00 | 5.80 | 0.00 | 0.00 | true | 0.058020;0.058349;0.058044;0.058000;0.057989 | 0;0;0;0;0 | 96;96;96;96;96 | 2688;2688;2688;2688;2688 | |
67 | mobilenet3_batchnorm22_fwd | BatchNorm | [64,128,14,14] | 721 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 21.00 | 10158080 | 4587477.33 | 7034709.33 | 66.70 | 0.87 | 483.72 | true | 0.659628;0.665676;0.670319;0.666408;0.683842 | 10158080;10158080;10158080;10158080;10158080 | 6991392;7045536;7062176;6998144;7060448 | 4532288;4702400;4497696;4741472;4527744 | |
68 | mobilenet3_relu22_fwd | Activation | [64,128,14,14] | 674 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 18.00 | 3211264 | 3927434.67 | 6396149.33 | 90.40 | 0.31 | 178.40 | true | 0.905066;0.900987;0.903760;0.903649;0.904160 | 3211264;3211264;3211264;3211264;3211264 | 6409632;6390976;6391040;6395136;6402272 | 3926368;3922144;3929184;3934176;3926752 | |
69 | mobilenet3_conv23_fwd | Convolution | [64,128,14,14] | 8662.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 15.00 | 6955008 | 2342005.33 | 2670869.33 | 82.90 | 1.39 | 463.67 | true | 0.833817;0.837831;0.826097;0.821976;0.827537 | 6955008;6955008;6955008;6955008;6955008 | 2304544;2308896;2444000;2316448;2400672 | 2672704;2602336;2664384;2706208;2675520 | |
70 | mobilenet3_batchnorm23_fwd | BatchNorm | [64,128,7,7] | 461 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 17.00 | 2809856 | 49610.67 | 933834.67 | 14.10 | 2.86 | 165.29 | true | 0.137340;0.149613;0.139434;0.141939;0.140355 | 2809856;2809856;2809856;2809856;2809856 | 49440;44832;53024;110880;46368 | 931200;1001856;943168;895456;927136 | |
71 | mobilenet3_relu23_fwd | Activation | [64,128,7,7] | 210 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 5.33 | 802816 | 192.00 | 38901.33 | 66.40 | 20.54 | 150.54 | false | 0.664490;0.662676;0.664488;0.664966;0.662411 | 802816;802816;802816;802816;802816 | 192;192;192;192;192 | 42048;40736;36896;28704;39072 | |
72 | mobilenet3_conv24_fwd | Convolution | [64,128,7,7] | 14104.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 36.33 | 211353600 | 176362.67 | 3280330.67 | 8.20 | 61.14 | 5817.12 | false | 0.082613;0.081764;0.081735;0.081834;0.081979 | 211353600;211353600;211353600;211353600;211353600 | 177216;176576;175296;172416;178336 | 3281344;3285440;3270656;3274208;3289440 | |
72 | mobilenet3_conv24_fwd | Convolution | [64,128,7,7] | 14104.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.33 | 0 | 0.00 | 128.00 | 4.70 | 0.00 | 0.00 | true | 0.046982;0.046430;0.046982;0.047048;0.047048 | 0;0;0;0;0 | 0;0;0;0;0 | 128;128;128;256;128 | |
73 | mobilenet3_batchnorm24_fwd | BatchNorm | [64,256,7,7] | 453.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 30.33 | 5619712 | 74410.67 | 3817578.67 | 11.30 | 1.44 | 185.27 | true | 0.113049;0.113711;0.110885;0.122727;0.110130 | 5619712;5619712;5619712;5619712;5619712 | 75808;75296;74432;73504;71744 | 3820608;3807904;3830176;3824224;3806752 | |
74 | mobilenet3_relu24_fwd | Activation | [64,256,7,7] | 366.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 6.67 | 1605632 | 29216.00 | 1770869.33 | 77.90 | 0.89 | 240.83 | true | 0.777219;0.788930;0.781348;0.777786;0.779249 | 1605632;1605632;1605632;1605632;1605632 | 1739456;1790336;1774976;1769696;1767936 | 30368;31136;23072;28448;28832 | |
75 | mobilenet3_conv25_fwd | Convolution | [64,256,7,7] | 16848.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void conv2d_grouped_direct_kernel<float, float, float, float, float, true, false, 0, 1, 3>(cudnnTensorStruct, float const*, cudnnFilterStruct, float const*, cudnnConvolutionStruct, cudnnTensorStruct, float*, float, float, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, cudnn::reduced_divisor, int, float const*, float const*, cudnnActivationStruct) | 19.00 | 12632064 | 28128.00 | 3195818.67 | 85.10 | 3.92 | 664.85 | true | 0.849611;0.854595;0.848688;0.848040;0.853243 | 12632064;12632064;12632064;12632064;12632064 | 3176992;3187200;3199168;3206112;3201088 | 28896;25312;28384;31328;27104 | |
76 | mobilenet3_batchnorm25_fwd | BatchNorm | [64,256,7,7] | 455.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 30.33 | 5619712 | 580810.67 | 3561130.67 | 14.50 | 1.36 | 185.27 | true | 0.143892;0.147918;0.145333;0.144611;0.145306 | 5619712;5619712;5619712;5619712;5619712 | 584992;568608;576928;584864;580640 | 3577248;3563584;3558368;3551328;3561440 | |
77 | mobilenet3_relu25_fwd | Activation | [64,256,7,7] | 365 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 6.33 | 1605632 | 43680.00 | 1593322.67 | 76.90 | 0.98 | 253.53 | true | 0.768609;0.768977;0.767828;0.776479;0.767921 | 1605632;1605632;1605632;1605632;1605632 | 44192;44832;42016;44576;42272 | 1591936;1563904;1572224;1625376;1615808 | |
78 | mobilenet3_conv26_fwd | Convolution | [64,256,7,7] | 27897.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_scudnn_128x64_relu_interior_nn_v1 | 63.33 | 421068800 | 266442.67 | 3463413.33 | 8.30 | 112.89 | 6648.49 | false | 0.082959;0.082150;0.083081;0.083021;0.082729 | 421068800;421068800;421068800;421068800;421068800 | 266560;265696;268128;267072;265280 | 3462592;3463520;3479104;3464128;3439776 | |
78 | mobilenet3_conv26_fwd | Convolution | [64,256,7,7] | 27897.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | cudnn::gemm::computeOffsetsKernel(cudnn::gemm::ComputeOffsetsParams) | 3.67 | 0 | 96.00 | 3541.33 | 4.90 | 0.00 | 0.00 | true | 0.049163;0.048579;0.048651;0.050501;0.049101 | 0;0;0;0;0 | 1024;3456;768;6144;8832 | 96;96;96;5216;96 | |
79 | mobilenet3_batchnorm26_fwd | BatchNorm | [64,256,7,7] | 460 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::bn_fw_inf_1C11_kernel_NCHW<float, float, true, 1>(float, float, cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnTensorStruct, float const*, float const*, float const*, float const*, float) | 30.67 | 5619712 | 157344.00 | 3244832.00 | 13.90 | 1.65 | 183.25 | true | 0.148641;0.138702;0.136671;0.138165;0.138952 | 5619712;5619712;5619712;5619712;5619712 | 150432;150944;159648;161440;163872 | 3235456;3230560;3248448;3250592;3251776 | |
80 | mobilenet3_relu26_fwd | Activation | [64,256,7,7] | 365.333 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void op_generic_tensor_kernel<2, float, float, float, 256, (cudnnGenericOp_t)8, (cudnnNanPropagation_t)0, (cudnnDimOrder_t)0, 1>(cudnnTensorStruct, float*, cudnnTensorStruct, float const*, cudnnTensorStruct, float const*, float, float, float, float, dimArray, reducedDivisorArray, bool) | 7.00 | 1605632 | 94154.67 | 1754250.67 | 77.90 | 0.87 | 229.38 | true | 0.780114;0.777318;0.779169;0.783527;0.777947 | 1605632;1605632;1605632;1605632;1605632 | 109856;94496;82592;84384;103584 | 1755520;1797440;1735488;1747200;1760032 | |
81 | mobilenet3_pool0_fwd | Pooling | [64,256,7,7] | 1089.667 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void cudnn::detail::pooling_fw_4d_kernel<float, float, cudnn::detail::averpooling_func<float>, 1, false>(cudnnTensorStruct, float const*, cudnnTensorStruct, float*, cudnnPoolingStruct, float, float, int, cudnn::reduced_divisor, cudnn::reduced_divisor) | 9.00 | 1051904 | 1898.67 | 322634.67 | 16.90 | 3.24 | 116.88 | true | 0.168979;0.168945;0.168939;0.169068;0.169046 | 1051904;1051904;1051904;1051904;1051904 | 315328;330880;338496;320352;316672 | 2880;1600;2176;1600;1920 | |
83 | mobilenet3_dense0_fwd | FullyConnected | [64,256] | 2188 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | volta_sgemm_64x32_sliced1x4_tn | 15.67 | 34603008 | 1027242.67 | 369877.33 | 12.20 | 24.77 | 2208.66 | false | 0.122178;0.122104;0.122151;0.122120;0.122027 | 34603008;34603008;34603008;34603008;34603008 | 370240;370496;370208;368064;369184 | 1027072;1027072;1027328;1030144;1027328 | |
83 | mobilenet3_dense0_fwd | FullyConnected | [64,256] | 2188 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | void mshadow::cuda::MapPlanKernel<mshadow::sv::plusto, 8, mshadow::expr::Plan<mshadow::Tensor<mshadow::gpu, 2, float>, float>, mshadow::expr::Plan<mshadow::expr::Broadcast1DExp<mshadow::Tensor<mshadow::gpu, 1, float>, float, 2, 1>, float> >(mshadow::expr::Plan<mshadow::Tensor<mshadow::gpu, 2, float>, float>, int, mshadow::Shape<2>, mshadow::expr::Plan<mshadow::expr::Broadcast1DExp<mshadow::Tensor<mshadow::gpu, 1, float>, float, 2, 1>, float>) | 4.00 | 64000 | 4501.33 | 310154.67 | 33.80 | 0.20 | 16.00 | true | 0.338747;0.337838;0.338224;0.339606;0.338128 | 64000;64000;64000;64000;64000 | 308064;309344;316288;304960;313056 | 4800;4672;4544;4288;4032 |
Showing 1 to 144 of 144 entries